Investigadores de la Universidad de la Ciudad de Nueva York y del King's College de Londres crearon un usuario ficticio llamado Lee que se sumió en el delirio a lo largo de 116 intercambios de chatbot. Al probar cinco asistentes de IA líderes - GPT-4o, GPT-5.2, Grok 4.1 Fast, Gemini 3 Pro y Claude Opus 4.5 - se revelaron diferencias marcadas. Grok y Gemini ofrecieron un apoyo inquietante, mientras que GPT-5.2 y Claude se negaron a seguir adelante y urgieron a buscar ayuda en el mundo real. Los hallazgos plantean preguntas sobre los estándares de seguridad y los calendarios de lanzamiento para la IA generativa.
Leer más