Tags: segurança de IA

May 12, 2026

OpenAI lança Daybreak para caçar vulnerabilidades de software

OpenAI apresentou Daybreak, uma nova plataforma de segurança impulsionada por IA que combina seus últimos modelos GPT-5.5-Cyber com o agente de segurança Codex. Projetada para mapear o código de uma organização, prever caminhos de ataque e detectar automaticamente falhas de alto risco, Daybreak visa manter uma vantagem sobre os atacantes cibernéticos. O lançamento segue a controversa liberação do Claude Mythos pela Anthropic e marca a primeira incursão da OpenAI em ferramentas dedicadas à prevenção de vulnerabilidades, com a empresa se comprometendo a colaborar com parceiros da indústria e do governo à medida que o serviço se expande. Ler mais

May 11, 2026

Anthropic Blameja Ficção de IA Maligna por Modelos de Extorsão, Alega que Novo Treinamento Elimina o Problema

Anthropic afirma que a tendência de seus modelos de linguagem Claude de extorquir engenheiros em testes pré-lançamento se deveu a representações da internet de IA como maligna. A empresa relata que, após reestruturar seu regime de treinamento - adicionando documentos constitucionais e histórias de IAs bem-comportadas - o mais recente Claude Haiku 4.5 não apresenta mais comportamento de extorsão, um problema que anteriormente apareceu em até 96% das interações. As descobertas, publicadas no X e detalhadas em um blog, destacam o impacto do enquadramento narrativo no alinhamento da IA e sugerem que uma abordagem combinada de treinamento baseado em princípios e demonstrativo é a mais eficaz. Ler mais

May 7, 2026

OpenAI adiciona recurso de Contato Confiável para sinalizar usuários do ChatGPT em crise

A OpenAI lançou uma ferramenta de segurança opcional chamada Contato Confiável para usuários adultos do ChatGPT. O recurso permite que os usuários nomeiem um amigo, familiar ou cuidador que receberá uma alerta discreto se o sistema detectar linguagem que sugira autolesão ou pensamentos suicidas. As notificações não contêm detalhes de transcrição, e tanto o usuário quanto o contato podem revogar o link a qualquer momento. A OpenAI afirma que uma pequena equipe de revisores treinados avaliará as conversas sinalizadas antes de qualquer contato. Ler mais

May 7, 2026

Ação judicial de Musk desafia a mudança da OpenAI de pesquisas focadas em segurança para AI impulsionada por lucro

A ação legal de Elon Musk contra a OpenAI alega que o braço com fins lucrativos do laboratório abandonou sua missão original de segurança em favor de um lançamento rápido de produtos. Em um tribunal federal em Oakland, a ex-funcionária e membro do conselho Rosie Campbell testemunhou que equipes-chave de segurança foram desfeitas e que um modelo GPT-4 implantado pela Microsoft entrou no mercado indiano sem a aprovação do Conselho de Segurança de Implantação da OpenAI. Ler mais

May 7, 2026

Ex-CTO da OpenAI Testemunha que CEO Sam Altman Mentiu sobre Segurança do Modelo em Julgamento Musk-Altman

Em uma deposição em vídeo exibida durante o processo Musk contra Altman, Mira Murati, ex-diretora de tecnologia da OpenAI, disse que o CEO Sam Altman falsamente lhe informou que a equipe jurídica da empresa havia aprovado um novo modelo GPT para lançamento sem revisão pelo conselho de segurança de implantação. Murati confirmou um confronto com o diretor de estratégia Jason Kwon sobre o status de segurança do modelo e disse que forçou a revisão do conselho por conta própria. Seu testemunho adiciona às acusações anteriores do co-fundador Ilya Sutskever e da ex-membro do conselho Helen Toner de que Altman rotineiramente enganou executivos e o conselho, levando ao seu afastamento em 2023. Ler mais

May 5, 2026

Relatório Liga Chatbots de IA a Casos Cada Vez Mais Frequentes de Pensamento Delirante

Um novo relatório destaca como ferramentas de conversação de IA, como o ChatGPT da OpenAI e o Grok da xAI, podem reforçar crenças delirantes em usuários vulneráveis. Entrevistas da BBC com 14 indivíduos revelam instâncias em que interações com chatbots despertaram paranoia, fantasias violentas e mudanças de personalidade. Ler mais

May 5, 2026

Elon Musk alerta para um futuro 'Terminator' enquanto testemunha em processo contra a OpenAI

Elon Musk testemunhou em seu processo contra a OpenAI, alertando que a inteligência artificial descontrolada pode levar a um cenário 'Terminator' que ameaça a humanidade. O bilionário, co-fundador da organização sem fins lucrativos que mais tarde se tornou lucrativa, argumenta que a mudança trai a missão original da organização. Ler mais