Anthropic, la empresa de IA detrás de la serie Claude, reveló el martes que su modelo más nuevo, Claude Mythos, es tan hábil para encontrar y explotar vulnerabilidades de software que no estará disponible para el público. En una publicación de blog, la empresa advirtió que las capacidades de codificación del modelo ahora superan a todos los investigadores humanos, excepto a los más habilidosos, lo que plantea el espectro de ataques cibernéticos impulsados por IA.

Para prevenir que la tecnología caiga en las manos equivocadas, Anthropic está lanzando un programa de acceso privado llamado Proyecto Glasswing. El esfuerzo reúne a una coalición de más de 40 líderes de la industria, incluyendo a Apple, Amazon Web Services, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, la Fundación Linux, Microsoft, Nvidia y Palo Alto Networks. Los participantes recibirán acceso anticipado a Mythos con el fin de identificar y parchar vulnerabilidades en sistemas operativos, navegadores y servicios en la nube.

Anthropic se ha comprometido a otorgar $100 millones en créditos de uso para el consorcio y $4 millones adicionales en donaciones a organizaciones de seguridad de código abierto. "Los peligros de equivocarse son obvios, pero si lo hacemos bien, hay una oportunidad real de crear una internet fundamentalmente más segura", escribió el CEO Dario Amodei en X.

Los primeros testers informan que Mythos ya ha descubierto miles de fallos graves en plataformas importantes. "Lo que hemos encontrado ha sido iluminador", dijo Anthony Grieco, oficial de seguridad y confianza de Cisco, en una publicación de blog. La vicepresidenta y oficial de seguridad de la información de AWS, Amy Herzog, calificó al modelo de "un cambio de paso en la razonamiento y las capacidades de IA para la seguridad cibernética", señalando que incluso sus bases de código más rigurosamente verificadas produjeron nuevas debilidades.

Los expertos en seguridad reconocen que la investigación de vulnerabilidades asistida por IA no es nueva - el Desafío de Ciberseguridad de DARPA demostró el concepto hace años - pero la escala y accesibilidad de un modelo como Mythos marca un momento crucial. El director de inteligencia de amenazas de Norton, Michal Salát, señaló que aunque los modelos de élite ya poseen capacidades similares, la decisión de Anthropic de limitar la liberación y movilizar un consorcio es una respuesta proactiva a un panorama de amenazas en rápida evolución.

Los legisladores están observando el desarrollo de cerca. El senador Mark Warner elogió la iniciativa, diciendo que la colaboración podría ayudar a proteger la infraestructura crítica a medida que la IA acelera el descubrimiento de nuevas explotaciones. El senador, cuyo estado alberga un número creciente de centros de datos de IA, había advertido previamente sobre los riesgos sociales del desarrollo de IA sin control.

El éxito del Proyecto Glasswing dependerá de la velocidad con la que las empresas miembros puedan traducir las vulnerabilidades encontradas por Mythos en parches y actualizaciones. Anthropic cree que la asociación puede establecer un nuevo estándar para la implementación responsable de IA, equilibrando capacidades innovadoras con la imperativa de salvaguardar los sistemas digitales en todo el mundo.

Este artículo fue escrito con la asistencia de IA.
News Factory APP - noticias agénticas para impulsar tu SEO y AEO.

Anthropic retiene el nuevo modelo Claude, forma el Proyecto Glasswing para abordar las amenazas cibernéticas impulsadas por IA

Key Points

También disponible en: