Mistral AI kondigde dinsdag Forge aan, een platform waarmee bedrijven AI-modellen kunnen trainen op hun eigen institutionele kennis, in plaats van te vertrouwen op generieke, publiek getrainde modellen. Het bedrijf positioneert Forge als de infrastructuurlaag voor het bouwen van wat het omschrijft als 'frontier-grade AI gegrond in bedrijfseigen kennis': modellen die de interne terminologie, compliance-beleid, operationele procedures en jaren van opgebouwde beslissingen van een organisatie begrijpen.
Forge ondersteunt de volledige levenscyclus van modeltraining: pre-training op grote interne datasets, post-training om gedrag te verfijnen voor specifieke taken, en reinforcement learning om modellen af te stemmen op intern beleid en evaluatiecriteria. Cruciaal is dat met Forge gebouwde modellen binnen de eigen infrastructuur van een bedrijf kunnen worden uitgerold, zodat bedrijfseigen data, trainingsruns en de resulterende modelgewichten onder controle van de organisatie blijven. Mistral heeft al samengewerkt met ASML, Ericsson, het Europees Ruimteagentschap en diverse anderen om domeinspecifieke modellen via het platform te trainen.
Het platform is ook ontworpen met een 'agent-first' filosofie. Mistral's eigen autonome agent, Mistral Vibe, kan Forge gebruiken om modellen te fine-tunen, optimale hyperparameters te vinden, taken in te plannen en synthetische trainingsdata te genereren, waarmee de operationele overhead van modelontwikkeling autonoom wordt afgehandeld. Forge ondersteunt zowel dense als mixture-of-experts architecturen, wat bedrijven controle geeft over de afweging tussen prestaties en inferentiekosten.
De betekenis van Forge reikt veel verder dan Mistral's productroadmap. Jarenlang was het standaard AI-uitrolpatroon: neem een algemeen model, stuur het gedrag bij via prompts, retrieval en fine-tuning. Dat werkt voor veel toepassingen. Maar er is een categorie bedrijfskennis die op die manier moeilijk te ontsluiten is: de opgebouwde redeneerpatronen in jaren interne documentatie, de randgevallen die zijn ingebakken in compliance-beleid, het vocabulaire specifiek aan een bepaalde sector of organisatie. Retrieval-augmented generation helpt, maar een model dat nooit op jouw domein is getraind, moet altijd een aanzienlijk kenniskloof overbruggen.
Op maat getrainde modellen dichten die kloof. Wanneer een model is voor- of nabewerkt op het werkelijke interne corpus van een bedrijf, begrijpt het context die een generiek model slechts kan benaderen. Mistral noemt dit 'strategische autonomie': het idee dat bedrijven in gereguleerde omgevingen niet afhankelijk zouden moeten zijn van het modelgedrag, de evaluatienormen of het governanceframework van een externe leverancier. Het model zelf wordt institutioneel eigendom.
Er is ook een directe kostenimplicatie. Een model dat jouw domein van nature begrijpt, vereist minder retrieval-infrastructuur, minder prompttokens voor contextuele opbouw en produceert nauwkeurigere outputs in de eerste poging. Lagere foutpercentages betekenen minder menselijke reviewcycli. Voor documentverwerkingspijplijnen met hoge volumes, duizenden facturen, contracten of regelgevende documenten per dag, zijn zelfs bescheiden verbeteringen in de straight-through processing rate bepalend voor de operationele kosten.
Bij Laava hanteren we al langer het standpunt dat de redeneerlaag van een AI-systeem als infrastructuur moet worden behandeld, niet als een zwarte doos die je huurt bij een cloudleverancier. Onze 3-laagse architectuur scheidt context (metadata, documentbeheer), redeneren (het model) en actie (integratie met ERP, CRM en operationele systemen). Het model in laag 2 is bewust modulair. We selecteren het op basis van de taak, de gevoeligheid van de data en de infrastructuurwensen van de klant.
Forge past direct in deze architectuur. Voor klanten met grote bedrijfseigen documentcorpora, een logistiek bedrijf met tien jaar aan charterpartijovereenkomsten, een bouwbedrijf met duizenden projectspecificaties, een financiële instelling met de volledige compliance-regelgeving, kan een op het domein getraind Mistral-model dat binnen de eigen infrastructuur is uitgerold een generiek model via een API aanzienlijk overtreffen. De kernzin is 'binnen de eigen infrastructuur van de klant': Forge-modellen blijven in jouw omgeving. Jouw trainingsdata verlaat jouw perimeter niet. De resulterende gewichten zijn van jou.
Dit is een betekenisvol voordeel voor Europese ondernemingen die opereren onder de transparantie- en governancevereisten van de EU AI Act, of onder de GDPR-verplichtingen rondom geautomatiseerde verwerking van persoonsgegevens. Het versturen van gevoelige documenten naar een Amerikaanse cloud-API voor verwerking introduceert juridische en compliance-complexiteit die on-premise of private cloud-uitrol volledig vermijdt.
De praktische weg voor de meeste bedrijven is niet om direct een volledig foundation-model van scratch te trainen. Het toegankelijkere startpunt is post-training: een bestaand open-source basismodel nemen (Mistral, Llama) en het fine-tunen op interne data voor een specifieke taak. Dat is iets wat organisaties met een bescheiden datavolume en standaard GPU-infrastructuur vandaag al kunnen doen. Forge structureert dit proces, met evaluatiepijplijnen, reinforcement learning op basis van interne feedback, en de governance-controles die gereguleerde sectoren vereisen.
Als je AI-agenten evalueert voor documentintensieve workflows en je je afvraagt of een generiek model de nauwkeurigheid haalt die jouw operaties vereisen, is het eerlijke antwoord: dat hangt af van de domeinkloof. Voor organisaties waarvan de processen zijn opgebouwd rondom zeer specifieke interne terminologie, compliance-frameworks of technische normen, kan die kloof groot genoeg zijn om productiewaardige inzet te ondermijnen. Een domein-getraind model elimineert die onzekerheid.
Bij Laava voeren we als onderdeel van elk traject een modelselectieproces uit. Dat proces omvat nu expliciet de optie van een domein-geadapteerd open-source model, uitgerold binnen de infrastructuur van de klant, als alternatief voor cloudtoegang via een API. Voor klanten waar datasouvereiniteit of nauwkeurigheidsvereisten een generiek model onvoldoende maken, is dit pad steeds realistischer. Als je wilt begrijpen of jouw use case zou profiteren van een op maat getraind model of van een goed gestructureerde RAG-pijplijn over een generiek model, is dat precies het soort vraag dat we behandelen in onze gratis Roadmap Session.