Notícia AI·Inteligência Artificial·Fonte: OpenAI API Changelog

OpenAI remove DALL-E 2 e 3 da API; gpt-image é o novo padrão

DALL·E 2 e DALL·E 3 foram descontinuados e removidos da API OpenAI em 12 de maio de 2026. Quem usa geração de imagem em produção deve migrar para gpt-image-1 ou gpt-image-2.

Por Vitor Morais

Fundador do MochaLabz · publicado em 14 de maio de 2026

A OpenAI removeu os modelos dall-e-2 e dall-e-3 da API em 12 de maio de 2026. Qualquer chamada que ainda referencie esses identificadores retorna erro — a descontinuação é definitiva, sem período de transição estendido. O substituto oficial é a família gpt-image: gpt-image-2, gpt-image-1 e gpt-image-1-mini.

Impacto imediato em produção

"DALL·E model snapshots dall-e-2 and dall-e-3 were deprecated and removed from the API on May 12, 2026." — OpenAI API Changelog. Se há código apontando para esses identificadores, ele está falhando agora.

O que mudou e por que a OpenAI descontinuou

DALL-E 2 estreou em 2022 e DALL-E 3 em 2023. Ambos tinham arquitetura separada do pipeline de linguagem — a OpenAI os tratava como produtos distintos da linha de GPT. Com a chegada dos modelos gpt-image, a empresa unificou geração de imagem dentro do mesmo ecossistema de API dos modelos de texto, simplificando autenticação, faturamento e controle de moderação.

A remoção simultânea de ambas as versões — sem manter nem a mais antiga como fallback — indica que a migração era planejada há meses internamente. O changelog não detalha janela de aviso prévia para desenvolvedores com integrações ativas.

Como atualizar a integração agora

A mudança mais direta é trocar o campo model nas chamadas à API. Os três substitutos disponíveis são:

gpt-image-2 — qualidade mais alta, recomendado para outputs finais e assets de produto.
gpt-image-1 — equilíbrio entre qualidade e custo, uso geral.
gpt-image-1-mini — menor custo por requisição, adequado para pré-visualizações e iterações rápidas.

// Antes (quebrado desde 12 mai 2026)
const response = await openai.images.generate({
  model: "dall-e-3",
  prompt: "product mockup flat design",
  n: 1,
  size: "1024x1024",
});

// Depois (substituto direto)
const response = await openai.images.generate({
  model: "gpt-image-1", // ou "gpt-image-2" / "gpt-image-1-mini"
  prompt: "product mockup flat design",
  n: 1,
  size: "1024x1024",
});

Além do identificador de modelo, vale revisar os parâmetros quality e style — a família gpt-image aceita valores diferentes dos que DALL-E 3 expunha. Prompts que dependiam de instruções de estilo específicas do DALL-E 3 (como vivid e natural) podem precisar de ajuste para manter consistência visual.

O que auditar nos próximos dias

Buscar nos repositórios por dall-e-2 e dall-e-3 — incluindo variáveis de ambiente e configs hardcoded.
Verificar integrações via SDKs de terceiros (Langchain, LlamaIndex, wrappers de n8n) que podem referenciar o modelo internamente.
Checar limites de rate e precificação do plano atual — gpt-image tem estrutura de custo diferente.
Testar prompts críticos com gpt-image-1 antes de subir gpt-image-2 em produção; qualidade maior pode vir com latência maior.
Atualizar documentação interna e variáveis de ambiente em staging e produção.

Para quem já trabalha com controle de custo de API, o artigo sobre como reduzir custo de API com batch e caching mostra técnicas aplicáveis também ao novo pipeline de imagem — especialmente se o volume de requisições for alto.

#dall-e-deprecation-api#gpt-image-2#openai-api#migracao-api-openai#geracao-imagem-ia#gpt-image-1#openai-changelog-2026

Para ler em seguida

Inteligência ArtificialAI13 min de leitura

O Que São Tokens em IA (2026): Guia Completo para LLMs como GPT e Claude

Tokens explicados: o que são, como a tokenização funciona, custo por token nos principais modelos, como contar antes de enviar e estratégias para reduzir consumo.

17 de abril de 2026

Ler artigo

#tokens#ia#llm

Inteligência ArtificialAI12 min de leitura

Janela de Contexto em IA: Guia Completo (2026) com Limites por Modelo

A janela de contexto define quanto texto um LLM consegue processar de uma vez. Conheça os limites de GPT-5, Claude, Gemini e Llama em 2026, lost-in-the-middle, RAG, chunking e prompt caching.

18 de abril de 2026

Ler artigo

#janela contexto#context window#tokens

Inteligência ArtificialAI12 min de leitura

Qual LLM escolher como freelancer em 2026: Claude, GPT ou open-source?

Matriz decisória para solopreneur brasileiro: Claude vs GPT vs Llama 4 por custo, contexto, reasoning e deploy local. Escolha o LLM certo para cada task.

26 de abril de 2026

Ler artigo

#qual-llm-escolher-freelancer-2026#claude-vs-gpt-vs-llama#llm-para-solopreneur

Inteligência ArtificialAI12 min de leitura

Reduzir 90% do custo de API Claude com batch e caching

Aprenda a usar batch API e prompt caching do Claude pra cortar despesa com tokens. Guia prático com exemplos reais pra solopreneur.

20 de abril de 2026

Ler artigo

#reducir-custo-api-claude#batch-api-prompt-caching#otimizacao-tokens-ia

← Ver todas as novidades