OpenAI anunciou hoje que seu gerador de imagens de IA, ChatGPT Images, está recebendo sua maior atualização desde o lançamento da ferramenta no ano passado. Chamado de Images 2.0, o serviço agora utiliza um novo modelo GPT-Image-2 equipado com o que a empresa chama de "capacidades de pensamento", permitindo que o sistema extraia informações da web antes de criar uma imagem.

Quando os usuários habilitam o modelo de pensamento, o gerador pode pesquisar fontes online, analisar arquivos carregados e "raciocinar sobre a estrutura da imagem antes de gerá-la". Essa etapa adicional permite que preserve detalhes específicos solicitados pelos usuários, produza texto coerente dentro das imagens e mantenha personagens, objetos e estilos consistentes em várias saídas. Na prática, um único prompt pode renderizar até oito imagens que pertencem à mesma narrativa visual - ideal para páginas de mangá, uma série de gráficos de mídia social ou planos de design de sala por sala.

Opções de resolução e formato também se expandem. As imagens agora podem ser renderizadas em até 2.048 pixels por lado e em proporções de aspecto que variam de ultra-largo 3:1 a alto 1:3. A atualização melhora o tratamento do modelo de scripts não latinos, fornecendo "ganhos significativos" para texto em japonês, coreano, chinês, hindi e bengali. O inglês e outras línguas baseadas em latim permanecem fortes, mas o suporte mais amplo à linguagem marca um passo notável para criadores que trabalham em contextos multilíngues.

A disponibilidade segue um lançamento em camadas. Assinantes dos planos ChatGPT Plus, Pro, Business e Enterprise recebem a suite completa de capacidades de pensamento, incluindo geração de imagens habilitada para busca na web. No entanto, todos os outros usuários do ChatGPT ganham acesso a melhorias básicas que aprimoram a capacidade da ferramenta de capturar as características definidoras de fotos, arte de pixels, imagens estáticas cinematográficas e outros estilos visuais. OpenAI afirma que as atualizações estão ao vivo para todos os usuários do ChatGPT e Codex a partir de hoje.

A nova versão chega em meio a uma competição intensificada na arena de imagens geradas. O Google recentemente introduziu o Nano Banana Pro, enquanto a Microsoft lançou o MAI-Image-2, ambos visando impulsionar a velocidade e a fidelidade. A última atualização importante da OpenAI em dezembro adicionou geração mais rápida e melhores recursos de edição de fotos, mas o lançamento atual representa um salto mais amplo em funcionalidade.

OpenAI lançou o ChatGPT Images pela primeira vez em 2023, posicionando-o como um complemento à sua IA conversacional. Desde então, a ferramenta evoluiu de uma novidade para uma utilidade para designers, marketers e hobbyists. Ao integrar capacidades de busca na web e saída de múltiplas imagens, OpenAI espera tornar o gerador de imagens um componente prático de fluxos de trabalho criativos, e não apenas uma novidade de uma vez.

Observadores da indústria notam que a mudança destaca uma tendência mais ampla: modelos de IA estão sendo cada vez mais dotados de "camadas de raciocínio" que permitem que eles façam referência a dados externos antes de produzir saídas. Se essa abordagem se tornará padrão em todo o setor ainda está para ser visto, mas o impulso mais recente da OpenAI sinaliza seu compromisso em permanecer à frente da tecnologia de imagens geradas.

Dieser Artikel wurde mit Unterstützung von KI verfasst.
News Factory APP - agentische News für besseres SEO & AEO.

OpenAI lança ChatGPT Images 2.0 com busca na web e geração de múltiplas imagens

Key Points

Auch verfügbar in: