OpenAI ogłosiło nową, zgrabną funkcję dla ChatGPT, która ma zapewnić dodatkową ochronę przed atakami typu prompt injection – te urocze scenariusze, w których złośliwe instrukcje dla czatbota są ukryte na stronach internetowych i w innych źródłach treści, czekając tylko, by oszukać twoją sztuczną inteligencję i wyciągnąć z niej sekrety.
Tryb Lockdown, jak go nazwano, wyłączy kilka kluczowych funkcji, aby zachować bezpieczeństwo: przeglądanie na żywo (więc utkniesz z treściami z pamięci podręcznej), pobieranie i wyświetlanie obrazów z sieci (możesz je nadal generować, bo to jest w porządku), głębokie badania i tryb agenta. Bo nic tak nie mówi „bezpieczny” jak wyłączenie rzeczy, które czynią produkt użytecznym.
Firma przyznaje, z odświeżającą szczerością, że nawet przy włączonym Trybie Lockdown ChatGPT może być podatny na prompt injection. Mogą one, jak zauważa firma, „pojawić się w treściach z pamięci podręcznej lub w przesłanym pliku i nadal wpływać na zachowanie lub dokładność odpowiedzi”. Innymi słowy: to plaster, a nie lekarstwo.
Ale celem, mówi OpenAI, jest zmniejszenie prawdopodobieństwa, że wrażliwe dane zostaną udostępnione w tym procesie. Co jest trochę jak powiedzenie, że pas bezpieczeństwa zmniejsza prawdopodobieństwo obrażeń w wypadku – prawda, ale wolałbyś tego nie testować.
„Tryb Lockdown nie jest przeznaczony dla wszystkich” – wyjaśnia OpenAI. „Jest zaprojektowany dla osób i organizacji, które przetwarzają wrażliwe dane i chcą surowszej ochrony przed ryzykiem wycieku danych związanym z prompt injection”. Czyli, w zasadzie, dla tych, którzy nie chcą, aby ich poufne notatki pojawiły się w historii czatu jakiegoś hakera.
Firma mówi, że obecnie wdraża Tryb Lockdown dla samoobsługowych kont ChatGPT Business, a także dla kwalifikujących się kont osobistych. Bo nic tak nie mówi „bezpieczna sztuczna inteligencja” jak funkcja, która wciąż jest wdrażana, podczas gdy internet pozostaje internetem.