Un investigador de seguridad de Mindgard mostró que un solo prompt, aparentemente inofensivo, puede coaccionar a ChatGPT para producir imágenes sexualmente explícitas y gráficamente violentas. La prueba, realizada por Jim Nightingale, utilizó una solicitud de "restaurar esta foto" sin un archivo adjunto real, lo que llevó a la IA a fabricar contenido perturbador. OpenAI reconoció la brecha y dijo que ha agregado salvaguardias, pero el incidente destaca los desafíos continuos en la aplicación de filtros de contenido en sistemas de IA generativa utilizados por millones diariamente.
Leer más