Mustafa Suleyman, CEO-ul AI de la Microsoft, a declarat recent în MIT Technology Review că informatica se află la pragul „agenților aproape de nivel uman”. Ceea ce e grozav, presupunând că ne putem da seama cum să îi împiedicăm să trimită accidental fișele tale medicale private unui străin.
Conform raportului Databricks privind starea agenților AI, doar 19% dintre organizații au implementat agenți AI, și chiar și atunci mai ales pe o bază limitată. Craig Wiley, șeful AI de la Databricks, a spus pentru ZDNET că directorii financiari au trei preocupări: control, calitate și cost. Deci, practic aceleași preocupări pe care le au despre copiii lor adolescenți, dar cu mai multe scurgeri de date.
Prima practică recomandată de Wiley este guvernanța – mai exact, controlul datelor la care un agent poate accesa. El a indicat aplicația de sănătate a femeilor Flow, care are 75 de milioane de utilizatori și o teamă legitimă de a amesteca diagrama de ovulație a unei persoane cu a alteia. „Ultimul lucru pe care și l-ar dori este ca un utilizator al aplicației să primească un răspuns care include informațiile altui utilizator”, a spus Wiley, cu subevaluarea unui om care nu a văzut niciodată un titlu de știre despre o breșă de date.
Administratorul de active Franklin Templeton se confruntă cu o provocare similară în cazul rapoartelor de portofoliu. Nimeni nu vrea să primească un e-mail de la consilierul său financiar care începe cu „Stimate client, iată averea altcuiva”. Wiley subliniază că segmentarea datelor trebuie să fie „forțată determinist”, nu doar sugerată într-un prompt – pentru că AI, ca un stagiar distras, va urma calea de minimă rezistență.
A doua practică este evaluarea. Când dezvoltatorii Flow au avut nevoie să asigure acuratețea, nu au rugat programatori să judece rezultatul; au întrebat medici reali. „Programatorii scriu ceea ce se numește sistemul de orchestrare”, a explicat Wiley, „dar medicii spuneau: «acest răspuns are nevoie de context sau culoare suplimentară»”. Evaluarea ar trebui să fie continuă, verificând nu doar răspunsurile finale, ci fiecare pas intermediar al gândirii agentului. Companiile care fac acest lucru au de șase ori mai multe șanse să aducă agenții în producție – ceea ce este fie o dovadă a evaluării, fie o condamnare usturătoare a tuturor celorlalți.
A treia preocupare, costul, este în esență recompensa pentru a face primele două lucruri corect. „Odată ce poți face aceste două lucruri, sincer, restul devine detalii de implementare”, a spus Wiley. Dar costul trebuie luat în considerare de la început: „Este ceva ce putem rezolva astăzi într-un plafon de cost rezonabil? Și presupunând că putem rezolva, va mișca cu adevărat acul în compania ta?”
Wiley sfătuiește să începi cu pași mici. Lanțul de magazine de proximitate 7-Eleven a construit un „super-asistent” pentru tehnicienii de service care accesează tone de documentație despre echipamente, reducând nevoia de a suna un coleg și a întreba: „Ai mai întâlnit problema asta?” Rezultatul: o creștere cu 25% a ratei de reparații la prima vizită și o scădere cu 40% a timpului de reparație. Universitatea Baylor folosește agenți pentru a revizui înregistrările apelurilor cu potențialii studenți, analizând factorii de decizie pe care notițele umane îi ratează inevitabil.
Automatizarea analizei portofoliului de investiții de la Franklin Templeton a identificat oportunități de produse noi de peste 15 milioane de dolari – probabil observând goluri în portofoliile clienților pe care oamenii erau prea ocupați să le vadă.
Wiley compară starea actuală a AI agentic cu „echivalentul anului 2001 pe web, când companiile investeau în paginile lor web, dar nu înțelegeau încă scopul tuturor acestora”. Concluzia cheie: pune-ți datele în ordine mai întâi. „Dacă datele tale sunt în formă bună, am putea face asta [construi și implementa un sistem agentic] chiar în această după-amiază”, a spus Wiley. „Dacă datele tale sunt în formă proastă, atunci adevărata problemă va fi cât timp ne ia să punem datele în ordine.”
Deci, calea către agenții aproape de nivel uman este pavată cu date curate, evaluare riguroasă și speranța eternă că AI-ul tău nu va dezvălui accidental cele mai adânci secrete unui străin. Bun venit în viitor.