A OpenAI anunciou oficialmente o ChatGPT Images 2.0, apresentando o modelo gpt-image-2 com raciocínio visual, capacidade de gerar até 10 imagens por prompt e resolução de até 2K pixels. A novidade está disponível no ChatGPT, no Codex e via API, obrigando equipes de TI a migrarem rapidamente dos endpoints do DALL-E 2 e DALL-E 3, que serão descontinuados em 12 de maio de 2026.
O serviço opera em dois modos distintos. O modo Instant é o padrão, acessível a todos os usuários, incluindo o plano gratuito; já o modo Thinking, voltado para raciocínio avançado, é exclusivo para assinantes Plus, Pro e Business. No Thinking, o sistema raciocina sobre a tarefa antes de gerar qualquer imagem, pode buscar dados na web em tempo real e produzir até várias imagens a partir de um único prompt.
A geração suporta até 10 imagens por prompt, com resolução máxima de 2.000 pixels via API e proporções entre 3:1 e 1:3. Essa versatilidade atende a banners, slides, pôsteres e formatos mobile, com aplicações diretas para equipes de marketing, produto e comunicação corporativa.
Um dos avanços mais aguardados é a renderização de texto dentro das imagens. O gpt-image-2 oferece suporte a scripts como japonês, coreano, chinês, hindi e bengali, entre outros, facilitando materiais visuais multilíngues para mercados globais e reduzindo a necessidade de pós-produção.
A imprensa de TI destaca o impacto operacional: com a descontinuação do DALL-E 2 e DALL-E 3 em 12 de maio de 2026, qualquer pipeline que ainda dependa desses modelos precisará ser atualizado. A nova precificação via API aponta US$ 0,21 por imagem 1024×1024 em qualidade alta, além de uma estrutura de tokens: US$ 5 por milhão de tokens de entrada, US$ 10 por milhão de tokens de saída, US$ 8 por milhão de tokens de imagem de entrada e US$ 30 por milhão de tokens de imagem de saída.
Além das questões técnicas, o avanço traz alertas de cibersegurança. A capacidade de gerar imagens hiper-realistas eleva riscos de desinformação e ataques de engenharia social, mesmo com salvaguardas em várias camadas — verificação de prompts, filtragem de imagens e revisão de outputs. Organizações devem reforçar políticas internas de uso e governança de conteúdo para mitigar esses riscos.
No âmbito concorrencial, o ChatGPT Images 2.0 redefine o cenário visual, colocando o OpenAI no centro de uma arena com Midjourney, Adobe Firefly e Canva. A tendência é de consolidação de ferramentas dentro de ecossistemas de produtividade, exigindo avaliação cuidadosa de integração na stack existente e políticas de uso para gerenciar ativos gerados pela IA.