OpenAI ha anunciado una nueva y elegante función para ChatGPT que, según dice, proporcionará protección adicional contra ataques de inyección de indicaciones, esos encantadores escenarios donde instrucciones maliciosas para chatbots se esconden en páginas web y otras fuentes de contenido, esperando engañar a tu IA para que revele secretos.
El Modo de Bloqueo, como se llama, desactivará algunas funciones clave para mantener la seguridad: la navegación web en vivo (así que te quedas con contenido en caché), la recuperación y visualización de imágenes de la web (aún puedes generarlas, porque eso está bien), la investigación profunda y el modo agente. Porque nada dice 'seguro' como apagar las cosas que hacen útil el producto.
La empresa admite, con una honestidad refrescante, que incluso con el Modo de Bloqueo activado, ChatGPT aún podría ser vulnerable a inyecciones de indicaciones. Estas podrían, señala la empresa, 'aparecer en contenido web en caché o en un archivo cargado, y aún podrían afectar el comportamiento o la precisión de una respuesta'. En otras palabras: esto es una curita, no una cura.
Pero el objetivo, dice OpenAI, es reducir la probabilidad de que datos sensibles se compartan en el proceso. Lo que es un poco como decir que un cinturón de seguridad reduce la probabilidad de lesiones en un accidente: cierto, pero preferirías no probarlo.
'El Modo de Bloqueo no está destinado a todos', aclara OpenAI. 'Está diseñado para personas y organizaciones que manejan datos sensibles y quieren una protección más estricta contra los riesgos de exfiltración de datos relacionados con la inyección de indicaciones'. Así que, básicamente, es para aquellos que no quieren que sus memorandos confidenciales aparezcan en el historial de chat de algún hacker.
La empresa dice que actualmente está implementando el Modo de Bloqueo para cuentas de ChatGPT Business de autoservicio, así como para cuentas personales elegibles. Porque nada dice 'IA segura' como una función que aún se está implementando mientras internet sigue siendo internet.