OpenAI heeft een handige nieuwe functie voor ChatGPT aangekondigd die volgens hen extra bescherming biedt tegen prompt-injectie-aanvallen - die heerlijke scenario's waarin kwaadaardige chatbot-instructies verborgen zitten in webpagina's en andere bronnen, wachtend om je AI geheimen te laten lekken.
Lockdown-modus, zoals het heet, zal een paar belangrijke functies uitschakelen om de boel veilig te houden: live surfen op het web (dus je zit vast aan gecachte inhoud), het ophalen en weergeven van afbeeldingen van het web (je kunt ze nog steeds genereren, want dat is prima), diepgaand onderzoek en agentmodus. Want niets zegt 'veilig' zoals het uitschakelen van de dingen die het product nuttig maken.
Het bedrijf geeft met verfrissende eerlijkheid toe dat zelfs met Lockdown-modus ingeschakeld, ChatGPT nog steeds kwetsbaar kan zijn voor prompt-injecties. Deze kunnen, merkt het bedrijf op, 'verschijnen in gecachte webinhoud of in een geüpload bestand, en kunnen nog steeds het gedrag of de nauwkeurigheid van een antwoord beïnvloeden.' Met andere woorden: dit is een pleister, geen geneesmiddel.
Maar het doel, zegt OpenAI, is om de kans te verkleinen dat gevoelige gegevens worden gedeeld in het proces. Dat is een beetje als zeggen dat een veiligheidsgordel de kans op letsel bij een crash verkleint - waar, maar je zou het liever niet testen.
'Lockdown-modus is niet bedoeld voor iedereen', verduidelijkt OpenAI. 'Het is ontworpen voor mensen en organisaties die met gevoelige gegevens omgaan en strengere bescherming willen tegen datalekrisico's gerelateerd aan prompt-injectie.' Dus eigenlijk is het voor degenen die niet willen dat hun vertrouwelijke memo's in de chatgeschiedenis van een of andere hacker belanden.
Het bedrijf zegt dat het Lockdown-modus momenteel uitrolt naar self-service ChatGPT Business-accounts, evenals naar in aanmerking komende persoonlijke accounts. Want niets zegt 'veilige AI' zoals een functie die nog wordt uitgerold terwijl het internet gewoon het internet blijft.