A OpenAI anunciou uma nova opção de segurança para seu chatbot de ponta, o ChatGPT, chamada Modo de Bloqueio. A configuração desativa várias capacidades que poderiam servir como condutos para ataques de injeção de prompts, uma técnica onde instruções maliciosas se escondem em conteúdo da web ou arquivos carregados e manipulam as respostas do modelo.

Quando ativado, o Modo de Bloqueio desativa a navegação na web em tempo real, significando que o modelo pode apenas usar páginas em cache em vez de buscar conteúdo fresco. Ele também bloqueia a recuperação e exibição de imagens da internet, embora os usuários ainda possam gerar imagens dentro do chat. As ferramentas de pesquisa aprofundada e o modo de agente experimental também são desativados, reduzindo a área de superfície para exploração potencial.

A OpenAI reconhece que a salvaguarda não torna o ChatGPT imune a todos os cenários de injeção. Prompts maliciosos ainda poderiam aparecer em material em cache ou em arquivos que os usuários carregam, potencialmente influenciando a saída do modelo. A empresa define o recurso como uma medida de redução de risco, não uma garantia de segurança absoluta.

"O Modo de Bloqueio não é destinado a todos", disse a empresa em seu anúncio. "Ele é projetado para pessoas e organizações que lidam com dados sensíveis e desejam proteção mais rigorosa contra riscos de exfiltração de dados relacionados à injeção de prompts". A palavra-chave destaca um público-alvo de empresas, laboratórios de pesquisa e indivíduos conscientes da privacidade.

A implantação começa com contas de negócios do ChatGPT de autoatendimento, permitindo que as empresas atuem no modo por demanda. Contas pessoais elegíveis também podem optar por participar, embora os critérios de elegibilidade não tenham sido divulgados. A OpenAI não especificou um cronograma para uma disponibilidade mais ampla.

A medida vem em um momento em que os desenvolvedores de IA lidam com preocupações crescentes sobre o mau uso de modelos. Ataques de injeção de prompts surgiram nos últimos meses, gerando pedidos por controles mais rigorosos. Ao limitar as fontes de dados externas, a OpenAI espera reduzir as vias pelas quais adversários podem injetar instruções prejudiciais.

Observadores da indústria notam que o recurso pode atrair setores regulamentados, como finanças, saúde e serviços jurídicos, onde a perda de dados acarreta penalidades pesadas. Ao mesmo tempo, as restrições podem reduzir a utilidade do modelo para tarefas que dependem de informações atualizadas ou contexto visual.

A declaração da OpenAI deixa claro que a empresa vê o Modo de Bloqueio como parte de uma ferramenta de segurança mais ampla, em vez de uma solução autônoma. A empresa continua a explorar salvaguardas adicionais, incluindo melhor detecção de prompts maliciosos e controles de usuário mais granulares.

À medida que a paisagem de IA evolui, o equilíbrio entre funcionalidade e segurança permanece um desafio central. O Modo de Bloqueio marca um passo concreto para proteger fluxos de trabalho sensíveis, preservando a experiência conversacional central que os usuários esperam do ChatGPT.

Este artigo foi escrito com a assistência de IA.
News Factory APP - notícias agênticas para impulsionar seu SEO e AEO.

OpenAI lança Modo de Bloqueio para reduzir ameaças de injeção de prompts

Key Points

Também disponível em: