W lutym ten reporter podniósł ulotkę na anty-AI marszu w Londynie. Głosiła ona, w hołdzie lub nie dla krasnali od majtek z South Park: "Krok 1: Wyhoduj cyfrowy superumysł. Krok 2: ? Krok 3: ?" Wyprodukowana przez Pause AI, grupę aktywistów współorganizujących protest, ulotka kończyła się błaganiem: "Wstrzymaj AI, dopóki nie wiemy, co do cholery to Krok 2."
Dla niewtajemniczonych, nawiązanie do odcinka South Park z 1998 roku, w którym Kenny, Kyle, Cartman i Stan odkrywają krasnale, których biznesplan to "Faza 1: Zbieraj majtki. Faza 2: ? Faza 3: Zysk." Mem od tamtej pory używany do satyry na wszystko, od strategii startupów po plan finansowania misji na Marsa Elona Muska. Obecnie doskonale oddaje stan AI: Firmy zbudowały technologię (Krok 1) i obiecały transformację (Krok 3). Jak się tam dostać, pozostaje wielkim znakiem zapytania.
Pause AI wierzy, że Krok 2 musi obejmować regulacje, choć dokładnie jak to wygląda i kto to egzekwuje, jest przedmiotem debaty. Entuzjaści AI są natomiast przekonani, że Krok 3 to zbawienie i zwykle pomijają środkową część. Główny naukowiec OpenAI, Jakub Pachocki, opisał mi AI jako "technologię transformującą gospodarczo", ze słonecznymi wyżynami najwyraźniej tuż za horyzontem. Ale każdy idzie inną drogą i nikt nie wie, kto dotrze.
Na każde wielkie twierdzenie o przyszłości pada trzeźwiąca rzeczywistość. Rozważmy dwa niedawne badania. Jedno z Anthropic przewidziało, które zawody LLM dotkną najbardziej – menedżerowie, architekci i media powinni przygotować się na zmiany; ogrodnicy, budowlańcy i pracownicy hotelarstwa – niekoniecznie. Ale te przewidywania to tak naprawdę tylko domysły oparte na tym, w czym LLM wydają się dobre, a nie na tym, jak faktycznie działają w miejscu pracy.
Inne badanie z lutego przeprowadzone przez naukowców z Mercor, startupu rekrutacyjnego AI, testowało kilka agentów AI napędzanych przez najlepsze modele OpenAI, Anthropic i Google DeepMind w 480 zadaniach biurowych rutynowo wykonywanych przez ludzkich bankierów, konsultantów i prawników. Każdy agent nie zdołał wykonać większości swoich obowiązków.
Skąd taka rozbieżność? Na początek, zastanówmy się, kto wysuwa twierdzenia i dlaczego – Anthropic ma w tym interes. Większość ludzi mówiących nam, że coś wielkiego się wydarzy, opiera się na tym, jak szybko poprawiają się narzędzia do kodowania AI. Ale nie wszystkie zadania można zhakować kodowaniem. Inne badania wykazują, że LLM są słabe w strategicznych osądach.
Co więcej, narzędzia nie są wrzucane do sterylnych pomieszczeń. Muszą działać w miejscach zanieczyszczonych ludźmi i istniejącymi przepływami pracy, a czasami dodanie AI pogarsza sprawę. Jasne, może te przepływy trzeba rozerwać i przerobić wokół nowej technologii, ale to wymaga czasu i odwagi.
Ta wielka dziura? Jest dokładnie tam, gdzie powinien być Krok 2. Brak zgody co do tego, co się wydarzy i jak, tworzy próżnię informacyjną wypełnianą najnowszym szalonym twierdzeniem tygodnia, bez względu na dowody. Jesteśmy tak oderwani od rzeczywistego zrozumienia, że pojedynczy post w mediach społecznościowych może wstrząsnąć rynkami.
Potrzebujemy mniej domysłów, a więcej dowodów. To wymaga przejrzystości od twórców modeli, koordynacji między naukowcami a biznesem oraz nowych sposobów oceny tej technologii w realnym świecie. Branża technologiczna – a wraz z nią światowa gospodarka – opiera się na obietnicy, że AI będzie transformacyjne. Ale to jeszcze nie jest pewny zakład. Następnym razem, gdy usłyszysz śmiałe twierdzenia, pamiętaj: większość firm wciąż zastanawia się, co zrobić ze swoimi majtkami.