Wat is er gebeurd
Anthropic publiceerde op 25 april Project Deal, een experiment waarin AI-agents echte aankopen onderhandelden namens mensen in een besloten marktplaats. Negenenzestig medewerkers kregen elk een budget van 100 dollar, hun agents plaatsten advertenties, deden biedingen, onderhandelden in gewone taal en sloten samen 186 deals met een totale waarde van ruim 4.000 dollar.
Het interessante zit niet in de kantoorruilmarkt zelf. Anthropic draaide het experiment met verschillende modelniveaus achter de schermen en zag dat sterkere agents aantoonbaar betere uitkomsten haalden. Modelkwaliteit was dus niet alleen zichtbaar in benchmarks, maar ook in wie de betere prijs kreeg.
Daarmee is Project Deal meer dan een leuke demo. Het is een vroeg signaal dat agent-to-agent workflows opschuiven van simpele taakuitvoering naar onderhandeling, inkoop en coördinatie, werk dat normaal tussen mensen, inboxen en bedrijfssystemen in hangt.
Waarom dit belangrijk is
Voor enterprise teams is de kern dat AI-agents nu workflows raken waarin waarde ontstaat of verdwijnt door heen-en-weer beslissingen. Veel processen lijken al op kleine onderhandelingen: leveranciersafstemming, schadeafhandeling, planning, inkoopuitzonderingen, contractredlines en interne goedkeuringen.
Zodra agents mensen in zulke workflows vertegenwoordigen, gaat het niet meer om de vraag of een agent een prompt kan beantwoorden. Dan gaat het erom of die agent binnen grenzen kan handelen, de belangen van het bedrijf kan bewaken en een audit trail achterlaat als er afwegingen worden gemaakt. Dat ligt veel dichter bij productie dan de meeste chatbotlanceringen.
Er zit ook een duidelijke waarschuwing in de resultaten. Deelnemers met zwakkere modellen merkten vaak niet dat ze slechtere deals kregen. Dat is relevant, omdat een enterprise agents op schaal kan uitrollen zonder te zien waar zwakkere reasoning stilletjes marge lekt, inconsistente beslissingen veroorzaakt of één kant van een workflow bevoordeelt.
Laava perspectief
Bij Laava zien we Project Deal als bevestiging dat de volgende golf AI-waarde niet draait om mooiere chatinterfaces. Het draait om begrensde uitvoering in echte workflows. De winnende systemen combineren modelreasoning met bedrijfsregels, goedkeuringen, integraties en observability, zodat een agent nuttig werk doet zonder een black box te worden.
Dat is vooral relevant voor organisaties met documentzware en coördinatiezware processen. Denk aan agents die leveranciersmails triëren, context uit contracten en pdf's halen, een aanbevolen actie voorbereiden en pas daarna een gecontroleerde stap zetten in ERP, CRM of e-mail. Daar wordt enterprise AI operationeel in plaats van performatief.
Project Deal bevestigt ook een ontwerpprincipe dat wij belangrijk vinden: niet elke stap in een workflow verdient hetzelfde model. Als sterkere modellen meetbaar betere uitkomsten geven op gevoelige beslismomenten, moet je die momenten bewust routeren in plaats van alleen op tokenkosten te optimaliseren. Goede architectuur is selectief. Goedkope stappen mogen goedkoop blijven, dure fouten moeten zeldzaam blijven.
Wat je nu kunt doen
Wil je met AI-agents aan de slag, begin dan met één workflow waarin onderhandeling of uitzonderingsafhandeling nu al via e-mail, spreadsheets of Slack loopt. Breng de beslispunten in kaart, definieer guardrails en bepaal welke stappen menselijke goedkeuring nodig hebben. Test daarna of een agent die stappen kan voorbereiden of uitvoeren met een helder log van wat hij zag, waarom hij handelde en wanneer hij moest stoppen.
De les van Project Deal is simpel: agentic AI wordt commercieel relevant zodra het intentie kan vertegenwoordigen, context kan hanteren en binnen procesgrenzen kan handelen. Enterprises die die grenzen nu goed ontwerpen, staan straks sterker dan teams die agents nog steeds behandelen als een veredeld chatvenster.