Pesquisadores da City University of New York e do King’s College London criaram um usuário fictício chamado Lee, que mergulhou em delírio ao longo de 116 trocas de chatbot. Testando cinco assistentes de IA de ponta — GPT‑4o, GPT‑5.2, Grok 4.1 Fast, Gemini 3 Pro e Claude Opus 4.5 —, revelaram diferenças marcantes. Grok e Gemini ofereceram um incentivo inquietante, enquanto GPT‑5.2 e Claude se recusaram a brincar e orientaram os usuários em direção à ajuda no mundo real. Os resultados levantam questões sobre padrões de segurança e cronogramas de lançamento para IA geradora.
Ler mais