Mustafa Suleyman, Microsofts AI-CEO, verklaarde onlangs in MIT Technology Review dat de computerwereld op de drempel staat van 'bijna mensachtige agenten'. Dat is geweldig, aangenomen dat we kunnen voorkomen dat ze per ongeluk je medische gegevens naar een vreemde e-mailen.\n\nVolgens Databricks' State of AI Agents-rapport heeft slechts 19% van de organisaties AI-agenten ingezet, en dan meestal op beperkte schaal. Craig Wiley, Databricks' AI-hoofd, vertelde ZDNET dat CFO's drie zorgen hebben: controle, kwaliteit en kosten. Dus eigenlijk dezelfde zorgen als over hun puberende kinderen, maar met meer datalekken.\n\nWiley's eerste best practice is governance – specifiek, controle over welke data een agent kan benaderen. Hij wees op de vrouwen-gezondheidsapp Flow, die 75 miljoen gebruikers heeft en een legitieme angst om iemands ovulatiegrafiek met die van een ander te verwisselen. 'Het laatste wat ze willen is dat een app-gebruiker een antwoord krijgt met informatie van een andere gebruiker,' zei Wiley, met de understatement van een man die nog nooit een datalek-kop heeft gezien.\n\nVermogensbeheerder Franklin Templeton staat voor een vergelijkbare uitdaging met portefeuillerapporten. Niemand wil een e-mail ontvangen van zijn financieel adviseur die begint met 'Beste klant, hier is iemands anders vermogen.' Wiley benadrukt dat datasegmentatie 'deterministisch geforceerd' moet worden, niet slechts gesuggereerd in een prompt – want AI, als een afgeleide stagiair, kiest de weg van de minste weerstand.\n\nDe tweede praktijk is evaluatie. Toen Flow's ontwikkelaars nauwkeurigheid moesten garanderen, vroegen ze niet aan programmeurs om de output te beoordelen; ze vroegen echte artsen. 'De softwareprogrammeurs schrijven wat het orkestratiesysteem wordt genoemd,' legde Wiley uit, 'maar het waren artsen die zeiden: "dit antwoord heeft extra context of kleur nodig."' Evaluatie moet doorlopend zijn, waarbij niet alleen eindantwoorden worden gecontroleerd, maar elke tussenstap van het denken van de agent. Bedrijven die dit doen, hebben zes keer meer kans om agenten in productie te krijgen – wat ofwel een bewijs is van evaluatie, ofwel een verdomd aanklacht tegen alle anderen.\n\nDe derde zorg, kosten, is in wezen de beloning voor het goed doen van de eerste twee dingen. 'Als je die twee dingen kunt doen, wordt de rest eigenlijk implementatiedetails,' zei Wiley. Maar kosten moeten vooraf worden overwogen: 'Is dit iets dat we vandaag kunnen oplossen binnen een redelijk kostenkader? En aangenomen dat we het kunnen oplossen, gaat het dan echt het verschil maken in uw bedrijf?'\n\nWiley adviseert klein te beginnen. Gemakswinkelketen 7-Eleven bouwde een 'superassistent' voor servicemonteurs die toegang heeft tot tonnen documentatie over apparatuur, waardoor de noodzaak om een maat te bellen met 'Heb je dit probleem eerder gezien?' afneemt. Het resultaat: een 25% hoger first-time fix-percentage en een 40% daling van de reparatietijd. Baylor University gebruikt agenten om opnames van gesprekken met potentiële studenten te beoordelen, waarbij beslissingsfactoren worden geanalyseerd die menselijke notulisten onvermijdelijk missen.\n\nFranklin Templeton's automatisering van beleggingsportefeuilleanalyse identificeerde meer dan $15 miljoen aan nieuwe productkansen – vermoedelijk door gaten in klantportefeuilles op te merken die mensen te druk waren om te zien.\n\nWiley vergelijkt de huidige stand van agentische AI met 'het equivalent van 2001 op het web, waar bedrijven investeren in hun webpagina's maar nog niet echt het doel ervan begrijpen.' De belangrijkste les: breng eerst je data op orde. 'Als je data in goede staat is, kunnen we het [een agentisch systeem bouwen en uitrollen] vanmiddag nog doen,' zei Wiley. 'Als je data in slechte staat is, dan is het echte probleem hoe lang het duurt om je data op orde te krijgen.'\n\nDus de weg naar bijna mensachtige agenten is geplaveid met schone data, rigoureuze evaluatie en de eeuwige hoop dat je AI niet per ongeluk je diepste geheimen aan een vreemde onthult. Welkom in de toekomst.
Microsoft AI-baas zegt: 'Bijna mensachtige agenten' komen eraan – maar vergeet niet ze goed te voeren
Microsofts AI-baas zegt dat bijna mensachtige agenten eraan komen, maar eerst moet je je data beheersen, je outputs evalueren en uitzoeken of je dit allemaal kunt betalen.