În februarie, acest reporter a luat un fluturaș la un marș anti-IA din Londra. Pe el scria, într-un omagiu voit sau nu adus gnomilor cu chiloți din South Park: „Pasul 1: Crește o super-minte digitală. Pasul 2: ? Pasul 3: ?” Produs de Pause AI, un grup activist care a co-organizat protestul, fluturașul se încheia cu o rugăminte: „Pauză IA până știm ce naiba e Pasul 2.”

Referința, pentru neinițiați, este la episodul din 1998 al serialului South Park în care Kenny, Kyle, Cartman și Stan descoperă gnomi al căror plan de afaceri este „Faza 1: Colectează chiloți. Faza 2: ? Faza 3: Profit.” Meme-ul a fost folosit de atunci pentru a satiriza de la strategii de startup-uri până la planul de finanțare a misiunii pe Marte a lui Elon Musk. Chiar acum, surprinde perfect starea IA: Companiile au construit tehnologia (Pasul 1) și au promis transformarea (Pasul 3). Cum ajung acolo rămâne un mare semn de întrebare.

Pause AI crede că Pasul 2 trebuie să implice reglementare, deși exact cum arată asta și cine o aplică este dezbătut. Susținătorii IA, între timp, sunt convinși că Pasul 3 este salvarea și tind să sară peste partea de mijloc cu totul. Chief Scientist-ul OpenAI, Jakub Pachocki, mi-a descris IA ca pe o „tehnologie transformatoare economic”, cu ținuturile însorite aparent dincolo de orizont. Dar fiecare ia un drum diferit, și e greu de ghicit cine va reuși.

Pentru fiecare afirmație grandioasă despre viitor, există un control de realitate sumbru. Luați în considerare două studii recente. Unul de la Anthropic a prezis ce locuri de muncă vor fi afectate cel mai mult de LLM-uri – managerii, arhitecții și tipurile media ar trebui să se pregătească de schimbare; îngrijitorii de terenuri, muncitorii în construcții și cei din ospitalitate, nu atât. Dar aceste predicții sunt de fapt doar ghicitori bazate pe ce par LLM-urile bune, nu pe cum performează efectiv la locul de muncă.

Un alt studiu din februarie de la cercetători de la Mercor, un startup de angajare în IA, a testat mai mulți agenți IA alimentați de modele de top de la OpenAI, Anthropic și Google DeepMind pe 480 de sarcini de la locul de muncă făcute în mod obișnuit de bancheri, consultanți și avocați umani. Fiecare agent a eșuat să îndeplinească majoritatea sarcinilor.

De ce o asemenea dezacord larg? Pentru început, luați în considerare cine face afirmațiile și de ce – Anthropic are interes personal. Majoritatea oamenilor care ne spun că ceva mare este pe cale să se întâmple se bazează pe cât de repede se îmbunătățesc instrumentele de codare IA. Dar nu toate sarcinile pot fi rezolvate cu codare. Alte studii constată că LLM-urile sunt proaste la judecăți strategice.

Mai mult, instrumentele nu sunt aruncate în camere curate. Ele trebuie să funcționeze în locuri contaminate cu oameni și fluxuri de lucru existente, iar uneori adăugarea IA face lucrurile mai rele. Sigur, poate acele fluxuri de lucru trebuie sfâșiate și refăcute în jurul noii tehnologii, dar asta necesită timp și curaj.

Acea gaură mare? Este exact acolo unde ar trebui să fie Pasul 2. Lipsa de acord asupra a ce se va întâmpla și cum creează un vid de informații umplut de cea mai recentă afirmație extravagantă a săptămânii, cu dovezi la naiba. Suntem atât de deconectați de orice înțelegere reală încât o singură postare pe rețelele sociale poate zgudui piețele.

Avem nevoie de mai puține ghicitori și mai multe dovezi. Asta necesită transparență din partea producătorilor de modele, coordonare între cercetători și afaceri și noi modalități de a evalua această tehnologie în lumea reală. Industria tech – și odată cu ea economia mondială – se bazează pe promisiunea că IA va fi transformatoare. Dar asta nu este încă un pariu sigur. Data viitoare când auzi afirmații îndrăznețe, amintește-ți: majoritatea afacerilor încă își dau seama ce să facă cu chiloții lor.