Mustafa Suleyman, CEO dell'IA di Microsoft, ha recentemente dichiarato su MIT Technology Review che l'informatica è sulla soglia di "agenti quasi a livello umano". Il che è fantastico, supponendo che riusciamo a capire come impedire loro di inviare accidentalmente le tue cartelle cliniche private a uno sconosciuto.
Secondo il rapporto State of AI Agents di Databricks, solo il 19% delle organizzazioni ha implementato agenti IA, e per lo più su base limitata. Craig Wiley, responsabile IA di Databricks, ha detto a ZDNET che i CFO hanno tre preoccupazioni: controllo, qualità e costo. Quindi fondamentalmente le stesse preoccupazioni che hanno per i loro figli adolescenti, ma con più perdite di dati.
La prima buona pratica di Wiley è la governance – in particolare, controllare a quali dati un agente può accedere. Ha indicato l'app per la salute femminile Flow, che ha 75 milioni di utenti e una legittima paura di confondere il grafico dell'ovulazione di una persona con quello di un'altra. "L'ultima cosa che vorrebbero è che un utente dell'app riceva una risposta che include informazioni di un altro utente", ha detto Wiley, con l'understatement di un uomo che non ha mai visto un titolo di violazione dei dati.
Il gestore patrimoniale Franklin Templeton affronta una sfida simile con i report di portafoglio. Nessuno vuole ricevere un'email dal proprio consulente finanziario che inizia "Caro Cliente, ecco il patrimonio netto di qualcun altro". Wiley sottolinea che la segmentazione dei dati deve essere "forzata deterministicamente", non solo suggerita in un prompt – perché l'IA, come uno stagista distratto, prenderà la via di minor resistenza.
La seconda pratica è la valutazione. Quando gli sviluppatori di Flow avevano bisogno di garantire l'accuratezza, non hanno chiesto ai programmatori di giudicare l'output; hanno chiesto a veri medici. "I programmatori scrivono quello che viene chiamato sistema di orchestrazione", ha spiegato Wiley, "ma sono stati i medici a dire: 'questa risposta qui ha bisogno di ulteriore contesto o colore'." La valutazione dovrebbe essere continua, controllando non solo le risposte finali ma ogni passaggio intermedio del pensiero dell'agente. Le aziende che lo fanno hanno sei volte più probabilità di portare gli agenti in produzione – il che è o una testimonianza della valutazione o una condanna schiacciante di tutti gli altri.
La terza preoccupazione, il costo, è essenzialmente la ricompensa per aver fatto bene le prime due cose. "Una volta che puoi fare queste due cose, onestamente, il resto diventa dettagli di implementazione", ha detto Wiley. Ma il costo deve essere considerato in anticipo: "È qualcosa che possiamo risolvere oggi all'interno di un ragionevole limite di costo? E supponendo che possiamo risolverlo, sposterà effettivamente l'ago della bilancia nella tua azienda?"
Wiley consiglia di iniziare in piccolo. La catena di minimarket 7-Eleven ha costruito un "super assistente" per i tecnici dell'assistenza che accede a tonnellate di documentazione sulle attrezzature, riducendo la necessità di chiamare un collega e chiedere: "Hai già visto questo problema?" Il risultato: un aumento del 25% nei tassi di riparazione al primo tentativo e una riduzione del 40% del tempo di riparazione. La Baylor University utilizza agenti per rivedere le registrazioni delle chiamate con potenziali studenti, analizzando i fattori decisionali che gli annotatori umani inevitabilmente perdono.
L'automazione dell'analisi dei portafogli di investimento di Franklin Templeton ha identificato oltre 15 milioni di dollari in nuove opportunità di prodotto – presumibilmente notando lacune nei portafogli dei clienti che gli umani erano troppo occupati per vedere.
Wiley paragona lo stato attuale dell'IA agentica a "l'equivalente del 2001 sul web, dove le aziende investono nelle loro pagine web ma non capiscono ancora lo scopo di tutto questo". Il punto chiave: metti prima in ordine i tuoi dati. "Se i tuoi dati sono in buona forma, potremmo farlo [costruire e distribuire un sistema agentico] questo pomeriggio", ha detto Wiley. "Se i tuoi dati sono in cattive condizioni, allora il vero problema sarà quanto tempo ci vorrà per mettere in ordine i tuoi dati."
Quindi la strada verso agenti quasi a livello umano è lastricata di dati puliti, valutazione rigorosa e l'eterna speranza che la tua IA non riveli accidentalmente i tuoi segreti più profondi a uno sconosciuto. Benvenuti nel futuro.