Mustafa Suleyman, dyrektor generalny Microsoft ds. AI, ogłosił niedawno w MIT Technology Review, że informatyka stoi u progu „agentów prawie ludzkiego poziomu”. Co jest świetne, zakładając, że uda nam się wymyślić, jak powstrzymać ich przed przypadkowym wysłaniem twojej prywatnej dokumentacji medycznej do nieznajomego.
Według raportu Databricks „State of AI Agents” tylko 19% organizacji wdrożyło agentów AI, a i to głównie na ograniczoną skalę. Craig Wiley, szef AI w Databricks, powiedział ZDNET, że dyrektorzy finansowi mają trzy obawy: kontrolę, jakość i koszt. Czyli w zasadzie te same obawy, co wobec swoich nastoletnich dzieci, tyle że z większym wyciekiem danych.
Pierwszą dobrą praktyką Wiley'a jest zarządzanie – a konkretnie kontrolowanie, do jakich danych agent ma dostęp. Wskazał na aplikację zdrowotną dla kobiet Flow, która ma 75 milionów użytkowników i uzasadnioną obawę przed pomyleniem czyjegoś wykresu owulacji z innym. „Ostatnią rzeczą, jakiej by chcieli, jest to, aby użytkownik aplikacji otrzymał odpowiedź zawierającą informacje innego użytkownika” – powiedział Wiley, z niedopowiedzeniem człowieka, który nigdy nie widział nagłówka o naruszeniu danych.
Zarządzający aktywami Franklin Templeton stoi przed podobnym wyzwaniem z raportami portfelowymi. Nikt nie chce otrzymać e-maila od swojego doradcy finansowego zaczynającego się od „Szanowny Kliencie, oto czyjaś wartość netto”. Wiley podkreśla, że segmentacja danych musi być „deterministycznie wymuszona”, a nie tylko zasugerowana w podpowiedzi – ponieważ AI, jak rozproszony stażysta, pójdzie po linii najmniejszego oporu.
Drugą praktyką jest ewaluacja. Gdy programiści Flow potrzebowali zapewnić dokładność, nie prosili programistów o ocenę wyników; zapytali prawdziwych lekarzy. „Programiści piszą tak zwany system orkiestracji” – wyjaśnił Wiley – „ale to lekarze mówili: 'ta odpowiedź wymaga dodatkowego kontekstu lub koloru'”. Ewaluacja powinna być ciągła, sprawdzając nie tylko ostateczne odpowiedzi, ale każdy pośredni krok myślenia agenta. Firmy, które to robią, są sześć razy bardziej skłonne do wprowadzenia agentów do produkcji – co jest albo świadectwem ewaluacji, albo druzgocącym oskarżeniem wszystkich innych.
Trzecia obawa, koszt, jest w zasadzie nagrodą za zrobienie dwóch pierwszych rzeczy dobrze. „Kiedy już możesz zrobić te dwie rzeczy, szczerze mówiąc, reszta to szczegóły implementacji” – powiedział Wiley. Ale koszt należy rozważyć z góry: „Czy jest to coś, co możemy rozwiązać dzisiaj w rozsądnym przedziale kosztów? I zakładając, że możemy to rozwiązać, czy rzeczywiście przesunie to igłę w twojej firmie?”
Wiley radzi zaczynać od małych rzeczy. Sieć sklepów convenience 7-Eleven zbudowała „super asystenta” dla techników serwisowych, który ma dostęp do mnóstwa dokumentacji dotyczącej sprzętu, zmniejszając potrzebę dzwonienia do kolegi i pytania: „Widziałeś już ten problem?”. Rezultat: 25% wzrost wskaźnika napraw za pierwszym razem i 40% spadek czasu naprawy. Uniwersytet Baylor używa agentów do przeglądania nagrań rozmów z potencjalnymi studentami, analizując czynniki decyzyjne, które ludzcy notujący nieuchronnie pomijają.
Automatyzacja analizy portfela inwestycyjnego przez Franklin Templeton zidentyfikowała ponad 15 milionów dolarów w nowych możliwościach produktowych – prawdopodobnie poprzez zauważenie luk w portfelach klientów, których ludzie byli zbyt zajęci, aby dostrzec.
Wiley porównuje obecny stan agentowego AI do „odpowiednika roku 2001 w sieci, gdzie firmy inwestują w swoje strony internetowe, ale tak naprawdę nie rozumieją jeszcze celu tego wszystkiego”. Kluczowy wniosek: najpierw uporządkuj swoje dane. „Jeśli twoje dane są w dobrym stanie, moglibyśmy to zrobić [zbudować i wdrożyć system agentowy] dziś po południu” – powiedział Wiley. „Jeśli twoje dane są w złym stanie, to prawdziwym problemem będzie to, ile czasu zajmie nam doprowadzenie twoich danych do porządku”.
Więc droga do agentów prawie ludzkiego poziomu jest wybrukowana czystymi danymi, rygorystyczną ewaluacją i wieczną nadzieją, że twój AI nie ujawni przypadkiem twoich najgłębszych tajemnic nieznajomemu. Witaj w przyszłości.