Mustafa Suleyman, Microsofts AI-chef, förklarade nyligen i MIT Technology Review att databehandling står vid tröskeln till "nästan mänskliga agenter." Vilket är bra, förutsatt att vi kan lista ut hur vi hindrar dem från att av misstag mejla dina privata journaler till en främling.
Enligt Databricks rapport "State of AI Agents" har endast 19 % av organisationerna implementerat AI-agenter, och då mest i begränsad omfattning. Craig Wiley, Databricks AI-chef, berättade för ZDNET att ekonomichefer har tre bekymmer: kontroll, kvalitet och kostnad. Så i princip samma bekymmer som de har med sina tonårsbarn, fast med mer dataläckage.
Wileys första bästa praxis är styrning – specifikt att kontrollera vilken data en agent kan komma åt. Han pekade på hälsoappen Flow för kvinnor, som har 75 miljoner användare och en legitim rädsla för att blanda ihop en persons ägglossningsdiagram med en annans. "Det sista de skulle vilja är att en appanvändare får ett svar som innehåller en annan appanvändares information", sa Wiley, med en underdrift från en man som aldrig sett en rubrik om dataintrång.
Tillgångsförvaltaren Franklin Templeton står inför en liknande utmaning med portföljrapporter. Ingen vill få ett mejl från sin finansiella rådgivare som börjar "Bästa kund, här är någon annans nettoförmögenhet." Wiley betonar att datasegmentering måste vara "deterministiskt tvingad", inte bara föreslagen i en prompt – för AI, som en distraherad praktikant, tar den minsta motståndets väg.
Den andra praxisen är utvärdering. När Flows utvecklare behövde säkerställa noggrannhet bad de inte programmerare bedöma resultatet; de frågade faktiska läkare. "Mjukvaruprogrammerarna skriver vad som kallas orkestreringssystemet", förklarade Wiley, "men det var läkare som sa, 'det här svaret behöver ytterligare sammanhang eller färg.'" Utvärdering bör vara kontinuerlig, och kontrollera inte bara slutliga svar utan varje mellansteg i agentens tänkande. Företag som gör detta är sex gånger mer benägna att få agenter i produktion – vilket antingen är ett bevis på utvärdering eller en fördömande anklagelse mot alla andra.
Den tredje frågan, kostnad, är i princip belöningen för att göra de två första sakerna rätt. "När du väl kan göra de två sakerna, ärligt talat, blir resten implementeringsdetaljer", sa Wiley. Men kostnad måste övervägas från början: "Är detta något vi kan lösa idag inom en rimlig kostnadsram? Och om vi antar att vi kan lösa det, kommer det faktiskt att göra skillnad i ditt företag?"
Wiley rekommenderar att börja smått. Närbutikskedjan 7-Eleven byggde en "superassistent" för servicetekniker som kommer åt massor av dokumentation om utrustning, vilket minskar behovet av att ringa en kompis och fråga: "Har du sett det här problemet förut?" Resultatet: en 25-procentig ökning av förstagångsreparationer och en 40-procentig minskning av reparationstid. Baylor University använder agenter för att granska inspelningar av samtal med potentiella studenter, och analyserar beslutsfaktorer som mänskliga antecknare oundvikligen missar.
Franklin Templetons automatisering av investeringsportföljanalys identifierade över 15 miljoner dollar i nya produktmöjligheter – förmodligen genom att upptäcka luckor i kundportföljer som människor var för upptagna för att se.
Wiley jämför det nuvarande tillståndet för agentisk AI med "motsvarigheten till 2001 på webben, där företag investerar i sina webbsidor men inte riktigt förstår syftet med allt detta ännu." Huvudpoängen: få ordning på din data först. "Om din data är i bra skick kunde vi göra det [bygga och distribuera ett agentiskt system] i eftermiddag", sa Wiley. "Om din data är i dåligt skick blir det verkliga problemet hur lång tid det tar att få ordning på din data."
Så vägen till nästan mänskliga agenter är kantad av ren data, rigorös utvärdering och den eviga förhoppningen att din AI inte av misstag avslöjar dina djupaste hemligheter för en främling. Välkommen till framtiden.