Świat AI ma nową błyszczącą obsesję, która przybiera formę trzech liter: RSI. Nie, nie chodzi o uraz związany z powtarzalnym obciążeniem – choć gorączkowe przyjmowanie modnych słów w branży może i to spowodować. To RSI oznacza Recursive Self-Improvement, najnowszy buzzword, za którym gonią startupy i badacze, marząc o AI, która może ulepszać się bez irytującej ingerencji człowieka.

W teorii RSI jest proste: system AI, który ciągle poprawia swoje własne możliwości, ostatecznie zamykając pętlę tak, że ludzie stają się opcjonalni – lub co gorsza, przestarzały. W praktyce, podobnie jak wcześniej z AGI, nikt nie może się zgodzić, co to właściwie znaczy ani kiedy może nadejść. Ale to nie powstrzymuje pociągu hype'u.

Na początku tego miesiąca znany badacz AI Richard Socher uruchomił startup o nazwie Recursive Superintelligence, którego głównym celem jest zbudowanie „prawdziwie rekurencyjnej, samodoskonalącej się superinteligencji na skalę”. Socher powiedział TechCrunch, że celem jest zautomatyzowanie „całego procesu tworzenia pomysłów, wdrażania i walidacji pomysłów badawczych”. Czyli w zasadzie AI, która może wymyślić własną pracę domową, odrobić ją i ocenić. Co może pójść nie tak?

Socher nie jest sam. Alex Karpathy, absolwent Tesli i OpenAI, obecnie w Anthropic, pracuje nad projektem o nazwie Auto-Research, wykorzystującym roje agentów do trenowania LLM-ów na prostych zadaniach. Jak dotąd jego praca ograniczała się do drobnych ulepszeń w modelu skali GPT-2 – co, jak sam Karpathy zauważył, nie jest „nowatorskim, przełomowym 'badaniem' (jeszcze)”. Ale to wystarczy, by podtrzymać marzenie.

Adaption, założone przez absolwentów Cohere i Google Sara Hooker, niedawno uruchomiło AutoScientist, narzędzie mające na celu automatyzację trenowania na granicy możliwości. Podobnie jak system Karpathy'ego, trenuje agentów do wprowadzania stopniowych ulepszeń – ale z wielką ambicją wytrenowania pełnoskalowego modelu granicznego. Jeśli to zadziała, system może szybko wymknąć się spod kontroli w coś bardzo przypominającego RSI.

Założycielka Disarray, Doris Xin, poszła bardziej praktyczną drogą: jej samodzielnie wytrenowany agent uczenia maszynowego zdobył 28 medali w niedawnym konkursie Kaggle, pokonując wielu ludzkich agentów. Xin twierdzi, że przy nieskończonej mocy obliczeniowej i czasie „już tam jesteśmy”. Uważa, że nie chodzi o kreatywność, tylko o „inżynierię na chleb powszedni”.

Ale są dowody, że branża nie jest tak blisko, jak sugeruje hype. CEO Google Sundar Pichai niedawno przyznał: „Nie jesteśmy jeszcze całkiem gotowi”, opisując RSI jako „kolejny poziom przyspieszenia z wieloma implikacjami”. Tymczasem narzędzie Claude Code od Anthropic podobno pisze prawie 100% kodu własnego zespołu. Niedawne badanie wykazało, że pięciu z 18 inżynierów Anthropic wierzyło, że Mythos może wkrótce zastąpić inżyniera L4 – programistę średniego szczebla. Jednak raport odnotował słabości w samodzielnym kierowaniu, w tym „samodzielne zarządzanie tygodniowymi niejednoznacznymi zadaniami, rozumienie priorytetów organizacji, gust, weryfikację, podążanie za instrukcjami i epistemikę”. Innymi słowy, wszystko, co sprawia, że RSI faktycznie działa.

Centrum Bezpieczeństwa i Technologii Wschodzących w Georgetown zebrało w zeszłym roku ekspertów i stwierdziło poważny podział: niektórzy spodziewali się nieuchronnej eksplozji „superinteligencji”, inni wolniejszego postępu i plateau. Helen Toner, dyrektor CSET i była członkini zarządu OpenAI, wyjaśniła, że używanie narzędzi AI do badań nie kwalifikuje się jako RSI. „Po prostu używają AI tak dużo, jak mogą”, powiedziała. „RSI to naprawdę brak potrzeby udziału człowieka”.

Ayeja Cotra z METR nakreśliła kamienie milowe: „adekwatność” (AI może prowadzić badania bez ludzi, nawet jeśli słabo), „parytet” (AI dorównuje ludziom) i „supremacja” (AI przewyższa współpracę człowieka z AI). Uważa, że adekwatność może nadejść w ciągu kilku lat, ale parytet jest bardziej niejasny. Gdy parytet zostanie osiągnięty, przewiduje supremację w ciągu kolejnego roku.

Toner rysuje historyczną paralelę: „Przeszliśmy od języków maszynowych do języka asemblera i języków kompilowanych; oddalasz się od wnętrzności komputera. Ale człowiek wciąż, w pewnym intuicyjnym sensie, prowadzi przedstawienie”. Przekroczenie tego paradygmatu wymaga rozwiązania