OpenAI hat eine praktische neue Funktion für ChatGPT angekündigt, die zusätzlichen Schutz vor Prompt-Injection-Angriffen bieten soll – diesen entzückenden kleinen Szenarien, bei denen bösartige Chatbot-Anweisungen in Webseiten und anderen Inhaltsquellen versteckt sind und nur darauf warten, Ihre KI dazu zu bringen, Geheimnisse preiszugeben.
Der sogenannte Lockdown-Modus deaktiviert einige wichtige Funktionen, um die Sicherheit zu gewährleisten: Live-Web-Browsing (also bleiben Sie an zwischengespeicherten Inhalten hängen), das Abrufen und Anzeigen von Bildern aus dem Web (Sie können sie weiterhin generieren, weil das in Ordnung ist), Deep Research und den Agentenmodus. Denn nichts sagt 'sicher' wie das Ausschalten der Dinge, die das Produkt nützlich machen.
Das Unternehmen gibt mit erfrischender Ehrlichkeit zu, dass ChatGPT selbst bei eingeschaltetem Lockdown-Modus immer noch anfällig für Prompt-Injections sein könnte. Diese könnten, so das Unternehmen, 'in zwischengespeicherten Webinhalten oder in einer hochgeladenen Datei auftauchen und könnten dennoch das Verhalten oder die Genauigkeit einer Antwort beeinflussen.' Mit anderen Worten: Dies ist ein Pflaster, keine Heilung.
Aber das Ziel, so OpenAI, ist es, die Wahrscheinlichkeit zu verringern, dass sensible Daten während des Prozesses weitergegeben werden. Das ist ein bisschen so, als würde man sagen, ein Sicherheitsgurt verringert die Wahrscheinlichkeit von Verletzungen bei einem Unfall – stimmt, aber man möchte es lieber nicht testen.
'Der Lockdown-Modus ist nicht für jeden gedacht', stellt OpenAI klar. 'Er wurde für Personen und Organisationen entwickelt, die mit sensiblen Daten umgehen und einen strengeren Schutz vor Datenexfiltrationsrisiken im Zusammenhang mit Prompt-Injection wünschen.' Also im Grunde für diejenigen, die nicht wollen, dass ihre vertraulichen Memos in der Chat-Historie eines Hackers auftauchen.
Das Unternehmen sagt, dass es den Lockdown-Modus derzeit für Self-Service-ChatGPT-Business-Konten sowie für berechtigte persönliche Konten ausrollt. Denn nichts sagt 'sichere KI' wie eine Funktion, die noch ausgerollt wird, während das Internet weiterhin das Internet ist.