오픈AI가 ChatGPT를 위한 멋진 새 기능을 발표했다. 이 기능은 프롬프트 인젝션 공격으로부터 추가 보호를 제공한다고 한다. 프롬프트 인젝션은 악의적인 챗봇 명령이 웹페이지나 다른 콘텐츠 소스에 숨겨져 AI가 비밀을 흘리도록 속이는 그런 유쾌한 시나리오다.
락다운 모드(Lockdown Mode)라고 불리는 이 기능은 안전을 유지하기 위해 몇 가지 주요 기능을 비활성화한다: 실시간 웹 브라우징(그래서 캐시된 콘텐츠에 갇힘), 웹에서 이미지 검색 및 표시(이미지 생성은 여전히 가능, 왜냐면 괜찮으니까), 딥 리서치, 그리고 에이전트 모드. '보안'이라고 말하려면 제품을 유용하게 만드는 기능들을 꺼야 한다는 뜻이다.
회사는 솔직하게 인정한다. 락다운 모드가 켜져 있어도 ChatGPT는 여전히 프롬프트 인젝션에 취약할 수 있다고. 회사는 '캐시된 웹 콘텐츠나 업로드된 파일에 나타날 수 있으며, 응답의 행동이나 정확성에 영향을 미칠 수 있다'고 설명한다. 즉, 이것은 반창고일 뿐 치료제가 아니다.
하지만 목표는 민감한 데이터가 과정에서 공유될 가능성을 줄이는 것이라고 오픈AI는 말한다. 이는 안전벨트가 충돌 시 부상 가능성을 줄인다는 말과 비슷하다. 사실이지만, 테스트하고 싶지는 않다.
'락다운 모드는 모든 사람을 위한 것이 아닙니다.' 오픈AI는 분명히 밝힌다. '민감한 데이터를 다루고 프롬프트 인젝션과 관련된 데이터 유출 위험으로부터 더 엄격한 보호를 원하는 사람과 조직을 위해 설계되었습니다.' 따라서 기본적으로 기밀 메모가 해커의 채팅 기록에 나타나는 것을 원하지 않는 사람들을 위한 것이다.
회사는 현재 락다운 모드를 셀프 서비스 ChatGPT 비즈니스 계정과 적격 개인 계정에 출시하고 있다고 밝혔다. '보안 AI'라고 말하려면 인터넷이 여전히 인터넷인 동안 출시 중인 기능이 필요하다.