OpenAI a annoncé une nouvelle fonctionnalité astucieuse pour ChatGPT qui, selon elle, offrira une protection supplémentaire contre les attaques par injection de prompts – ces charmants petits scénarios où des instructions malveillantes pour chatbot sont cachées dans des pages Web et d'autres sources de contenu, attendant juste de piéger votre IA pour qu'elle révèle des secrets.
Le mode confinement, comme on l'appelle, désactivera quelques fonctionnalités clés pour garantir la sécurité : la navigation Web en direct (vous êtes donc coincé avec du contenu en cache), la récupération et l'affichage d'images depuis le Web (vous pouvez toujours en générer, parce que ça va), la recherche approfondie et le mode agent. Parce que rien ne dit « sécurisé » comme désactiver ce qui rend le produit utile.
L'entreprise admet, avec une franchise rafraîchissante, que même avec le mode confinement activé, ChatGPT pourrait toujours être vulnérable aux injections de prompts. Celles-ci pourraient, note l'entreprise, « apparaître dans du contenu Web en cache ou dans un fichier téléchargé, et pourraient encore affecter le comportement ou la précision d'une réponse ». En d'autres termes : c'est un pansement, pas un remède.
Mais l'objectif, dit OpenAI, est de réduire la probabilité que des données sensibles soient partagées dans le processus. Ce qui revient à dire qu'une ceinture de sécurité réduit la probabilité de blessure en cas d'accident – c'est vrai, mais vous préféreriez ne pas la tester.
« Le mode confinement n'est pas destiné à tout le monde », précise OpenAI. « Il est conçu pour les personnes et les organisations qui traitent des données sensibles et souhaitent une protection plus stricte contre les risques d'exfiltration de données liés à l'injection de prompts. » Donc, en gros, c'est pour ceux qui ne veulent pas que leurs mémos confidentiels se retrouvent dans l'historique de chat d'un hacker.
L'entreprise indique qu'elle déploie actuellement le mode confinement pour les comptes ChatGPT Business en libre-service, ainsi que pour les comptes personnels éligibles. Parce que rien ne dit « IA sécurisée » comme une fonctionnalité encore en cours de déploiement alors qu'Internet continue d'être Internet.