OpenAI ha annunciato una nuova interessante funzionalità per ChatGPT che, a suo dire, fornirà una protezione aggiuntiva dagli attacchi di prompt injection – quei deliziosi scenari in cui istruzioni malevole per chatbot sono nascoste in pagine web e altre fonti di contenuti, in attesa di ingannare la tua IA per farla spiattellare segreti.
La Modalità Lockdown, così si chiama, disabiliterà alcune funzionalità chiave per mantenere le cose al sicuro: la navigazione web in tempo reale (quindi rimani bloccato con contenuti in cache), il recupero e la visualizzazione di immagini dal web (puoi ancora generarli, perché quello va bene), la ricerca approfondita e la modalità agente. Perché niente dice 'sicuro' come spegnere le cose che rendono il prodotto utile.
L'azienda ammette, con onestà rinfrescante, che anche con la Modalità Lockdown attivata, ChatGPT potrebbe ancora essere vulnerabile a prompt injection. Questi potrebbero, nota l'azienda, 'apparire in contenuti web in cache o in un file caricato, e potrebbero ancora influenzare il comportamento o l'accuratezza di una risposta.' In altre parole: questo è un cerotto, non una cura.
Ma l'obiettivo, dice OpenAI, è ridurre la probabilità che dati sensibili vengano condivisi nel processo. Il che è un po' come dire che una cintura di sicurezza riduce la probabilità di lesioni in un incidente – vero, ma preferiresti non testarla.
'La Modalità Lockdown non è pensata per tutti,' chiarisce OpenAI. 'È progettata per persone e organizzazioni che gestiscono dati sensibili e vogliono una protezione più rigorosa dai rischi di esfiltrazione dei dati legati a prompt injection.' Quindi, in pratica, è per quelli che non vogliono che i loro promemoria riservati finiscano nella cronologia chat di qualche hacker.
L'azienda dice che sta attualmente distribuendo la Modalità Lockdown agli account self-serve ChatGPT Business, così come agli account personali idonei. Perché niente dice 'IA sicura' come una funzionalità che è ancora in fase di distribuzione mentre internet continua a essere internet.