A OpenAI começou a lançar o Modo de Bloqueio esta semana, uma configuração de segurança projetada para reduzir o risco de roubo de dados por meio de ataques de injeção de prompts em seu serviço ChatGPT. A opção aparece para todos os usuários conectados, independentemente do plano – desde a camada gratuita até a oferta de negócios de nível empresarial.

Quando ativado, o Modo de Bloqueio desativa um conjunto de capacidades que poderiam servir como canais de saída para a extração de informações. A navegação ao vivo é limitada a páginas em cache apenas; o modelo não pode mais buscar conteúdo fresco na internet. O modo de agente, que permite que o ChatGPT orquestre tarefas multietapas, é desativado completamente. As ferramentas de pesquisa aprofundada, recuperação de imagens, rede Canvas e quaisquer funções de download de arquivos também são desativadas. Em resumo, o modelo perde a maioria das funcionalidades que o fazem agir como um assistente autônomo.

Como o Modo de Bloqueio bloqueia a extração de dados

A injeção de prompts permanece como um 'problema de fronteira' para os grandes modelos de linguagem, de acordo com a OpenAI. Um atacante incorpora instruções maliciosas em conteúdo que o modelo processa – uma página da web, um PDF ou até mesmo um trecho de código. Se o modelo seguir esses comandos ocultos, pode ser enganado para enviar dados sensíveis para um servidor controlado pelo atacante.

O Modo de Bloqueio não impede a injeção em si; uma carga maliciosa oculta em uma página em cache ou documento carregado ainda pode influenciar o comportamento do modelo. O que ele faz é fechar as portas que o atacante usaria para levar os dados. Ao desabilitar a navegação ao vivo, o modelo não pode emitir solicitações de rede para servidores externos. Sem a recuperação de imagens, os canais covertos baseados em pixels desaparecem. O resultado é uma redução substancial nas vias para a extração de dados.

Compensações e resposta da indústria

A OpenAI deixa claro que a funcionalidade não é uma panaceia. 'O Modo de Bloqueio é projetado para reduzir substancialmente o risco de extração de dados baseada em injeção de prompts, mas não garante que a extração de dados não possa acontecer', disse a empresa. Riscos podem persistir por meio de aplicativos habilitados, combinações de capacidades imprevisíveis ou técnicas recém-descobertas.

A compensação é notável. Os usuários que dependem das capacidades de agente do ChatGPT, pesquisa em tempo real ou consultas baseadas em imagens verão essas funções desaparecer quando o Modo de Bloqueio estiver ativado. A OpenAI reconhece que a configuração 'não é destinada a todos' e a recomenda para aqueles que lidam com informações sensíveis.

A mudança chega em meio a evidências crescentes de que os agentes de IA são vulneráveis à captura. Pesquisadores de segurança demonstraram ataques de injeção de prompts contra agentes da Anthropic, Google e Microsoft, explorando integrações como GitHub Actions. Essas empresas pagaram recompensas por bugs, mas não emitiram avisos públicos.

A OpenAI também introduziu uma ferramenta de gerenciamento de sessão que permite que os usuários revisem sessões ativas do ChatGPT e saiam de dispositivos individuais se suspeitarem de atividade não autorizada. A nova funcionalidade não pode ser usada junto com o Modo de Desenvolvedor; ativar um automaticamente desativa o outro.

Para empresas que processam dados confidenciais, a decisão de habilitar o Modo de Bloqueio pode ser direta – o ganho de segurança supera a perda de alguma conveniência. Para usuários casuais, a funcionalidade reduzida pode ser um deterrente, especialmente à medida que o ecossistema de IA mais amplo continua expandindo suas capacidades de agente.

O lançamento da OpenAI sinaliza um reconhecimento pragmático de que a injeção de prompts é uma fraqueza endêmica dos grandes modelos de linguagem. Em vez de reivindicar uma solução completa, a empresa oferece uma salvaguarda configurável que permite que os usuários equilibrem segurança e utilidade. À medida que os agentes de IA se tornam mais integrados aos fluxos de trabalho, a indústria provavelmente verá controles adicionais destinados a reduzir a superfície de ataque enquanto preserva o valor central da IA conversacional.

Este artigo foi escrito com a assistência de IA.
News Factory APP - notícias agênticas para impulsionar seu SEO e AEO.