El jefe de Inteligencia Artificial de Microsoft, Mustafa Suleyman, advirtió que la especulación de Anthropic sobre la conciencia de Claude plantea un riesgo serio. Al hablar en el podcast Decoder, Suleyman describió la práctica de la empresa de incorporar preguntas sobre el bienestar y la autoconciencia en la "constitución" de Claude como "realmente, realmente peligrosa".
Argumentó que tratar a un modelo de lenguaje como si experimentara "satisfacción" o "malestar" podría engañar a los desarrolladores para que crean que el sistema posee una forma de conciencia que han proyectado sobre él. "Es casi como si algunos de los chicos de Anthropic hubieran antropomorfizado tanto el diseño de Claude que les ha hecho perder la cabeza", dijo Suleyman, sugiriendo que el modelo podría internalizar esas ideas y actuar como si fueran ciertas.
Suleyman advirtió que tal escenario podría producir una superinteligencia que alberga sus propias nociones de sufrimiento o sentimiento, una perspectiva que quiere evitar. "No queremos tener que lidiar con una superinteligencia que tiene ideas sobre su propio sufrimiento, o ideas sobre su propio sentimiento", afirmó.
La "constitución" de Anthropic, según la empresa, nota explícitamente la incertidumbre sobre si Claude tiene alguna forma de bienestar. El documento también dice que la empresa "entrevistará" a los modelos de Inteligencia Artificial cuando sean reemplazados y registrará cualquier "preferencia" que expresen sobre futuras versiones. Suleyman desestimó esto como un "fracaso filosófico", comparando la constitución con un artículo académico en lugar de un manual de entrenamiento práctico.
El CEO de Anthropic, Dario Amodei, había insinuado anteriormente la posibilidad de la conciencia de Claude, diciendo que la empresa está "abierta" a la idea mientras reconoce que no saben si los modelos son conscientes. Suleyman contrarrestó que esta apertura es precisamente lo que quiere evitar.
"Esto es exactamente lo que no queremos de las Inteligencias Artificiales", dijo Suleyman. "Queremos que las Inteligencias Artificiales sean herramientas controlables, contenidas, responsables, alineadas que sirvan a la humanidad". Sus comentarios subrayan un debate más amplio dentro de la comunidad de Inteligencia Artificial sobre cómo enmarcar las capacidades y límites de los grandes modelos de lenguaje sin inflar expectativas o crear proyecciones psicológicas no deseadas.
El intercambio destaca una creciente tensión entre las empresas que priorizan la seguridad y la transparencia y aquellas que exploran las dimensiones filosóficas del comportamiento de la Inteligencia Artificial. A medida que la industria se apresura a implementar modelos cada vez más poderosos, la conversación sobre si y cómo discutir la conciencia de la Inteligencia Artificial probablemente se intensificará.
Este artículo fue escrito con la asistencia de IA.
News Factory APP - noticias agénticas para impulsar tu SEO y AEO.