OpenAI объявила о новой полезной функции для ChatGPT, которая, по её словам, обеспечит дополнительную защиту от атак с внедрением подсказок — тех восхитительных сценариев, когда вредоносные инструкции для чат-бота спрятаны на веб-страницах и в других источниках контента, ожидая, чтобы обманом заставить ваш ИИ разболтать секреты.
Режим блокировки, как он называется, отключит несколько ключевых функций для обеспечения безопасности: просмотр веб-страниц в реальном времени (так что вы застрянете с кэшированным контентом), получение и отображение изображений из интернета (генерировать их можно, потому что это нормально), глубокое исследование и режим агента. Потому что ничто так не говорит «безопасно», как отключение того, что делает продукт полезным.
Компания признаёт, с освежающей честностью, что даже при включённом режиме блокировки ChatGPT может быть уязвим для внедрения подсказок. Они могут, отмечает компания, «появиться в кэшированном веб-контенте или в загруженном файле и всё ещё влиять на поведение или точность ответа». Иными словами: это пластырь, а не лекарство.
Но цель, говорит OpenAI, — снизить вероятность того, что конфиденциальные данные будут раскрыты в процессе. Что немного похоже на утверждение, что ремень безопасности снижает вероятность травм при аварии — верно, но лучше бы не проверять.
«Режим блокировки не предназначен для всех», — уточняет OpenAI. «Он разработан для людей и организаций, которые работают с конфиденциальными данными и хотят более строгой защиты от рисков утечки данных, связанных с внедрением подсказок». Так что, в основном, для тех, кто не хочет, чтобы их конфиденциальные меморандумы оказались в истории чата какого-нибудь хакера.
Компания сообщает, что в настоящее время развёртывает режим блокировки для самообслуживаемых аккаунтов ChatGPT Business, а также для подходящих личных аккаунтов. Потому что ничто так не говорит «безопасный ИИ», как функция, которая всё ещё внедряется, пока интернет остаётся интернетом.