Etiquetas: seguridad de IA

OpenAI Lanza Políticas de Seguridad Abiertas para Menores de Edad para Desarrolladores de IA

OpenAI Lanza Políticas de Seguridad Abiertas para Menores de Edad para Desarrolladores de IA
OpenAI anunció un conjunto de políticas de seguridad abiertas y basadas en solicitudes destinadas a ayudar a los desarrolladores a proteger a los usuarios adolescentes de aplicaciones de IA. Desarrolladas con Common Sense Media y everyone.ai, las políticas se centran en cinco categorías de daño potencial, incluyendo violencia gráfica, ideales corporales dañinos, desafíos peligrosos, juego de roles romántico o violento y bienes restringidos por edad. Leer más

Anthropic presenta el modo automático para Claude Code, otorgando a la IA una acción autónoma con salvaguardias de seguridad

Anthropic presenta el modo automático para Claude Code, otorgando a la IA una acción autónoma con salvaguardias de seguridad
Anthropic ha introducido un "modo automático" para su IA Claude Code, lo que permite al sistema ejecutar acciones de forma autónoma que considere seguras, mientras bloquea aquellas que parezcan riesgosas. La función, ahora en vista previa de investigación, agrega una capa de seguridad que verifica el comportamiento peligroso y los ataques de inyección de instrucciones antes de que se ejecute cualquier acción. El modo automático funciona con Claude Sonnet 4.6 y Opus 4.6 y se recomienda para entornos aislados y sandbox. La implementación se dirige a usuarios de Enterprise y API y sigue las recientes publicaciones de Anthropic de Claude Code Review y Dispatch para Cowork, reflejando un movimiento más amplio en la industria hacia herramientas de codificación más autónomas. Leer más

Anthropic Introduce Característica de Control de Computadora de Claude para Suscriptores de Pro y Max

Anthropic Introduce Característica de Control de Computadora de Claude para Suscriptores de Pro y Max
Anthropic anunció que su AI Claude ahora puede controlar una computadora MacOS, permitiéndole realizar tareas como abrir archivos, desplazarse, hacer clic y utilizar aplicaciones como Google Calendar o Slack. La capacidad está limitada a los suscriptores de Claude Pro y Claude Max, requiere permiso antes de cada acción y cuenta con salvaguardias de seguridad para bloquear inyecciones de comandos y otras vulnerabilidades. Leer más