OpenAI remove DALL-E 2 e 3 da API; gpt-image é o novo padrão
DALL·E 2 e DALL·E 3 foram descontinuados e removidos da API OpenAI em 12 de maio de 2026. Quem usa geração de imagem em produção deve migrar para gpt-image-1 ou gpt-image-2.
Por Vitor Morais
Fundador do MochaLabz ·
A OpenAI removeu os modelos dall-e-2 e dall-e-3 da API em 12 de maio de 2026. Qualquer chamada que ainda referencie esses identificadores retorna erro — a descontinuação é definitiva, sem período de transição estendido. O substituto oficial é a família gpt-image: gpt-image-2, gpt-image-1 e gpt-image-1-mini.
Impacto imediato em produção
"DALL·E model snapshots dall-e-2 and dall-e-3 were deprecated and removed from the API on May 12, 2026." — OpenAI API Changelog. Se há código apontando para esses identificadores, ele está falhando agora.
O que mudou e por que a OpenAI descontinuou
DALL-E 2 estreou em 2022 e DALL-E 3 em 2023. Ambos tinham arquitetura separada do pipeline de linguagem — a OpenAI os tratava como produtos distintos da linha de GPT. Com a chegada dos modelos gpt-image, a empresa unificou geração de imagem dentro do mesmo ecossistema de API dos modelos de texto, simplificando autenticação, faturamento e controle de moderação.
A remoção simultânea de ambas as versões — sem manter nem a mais antiga como fallback — indica que a migração era planejada há meses internamente. O changelog não detalha janela de aviso prévia para desenvolvedores com integrações ativas.
Como atualizar a integração agora
A mudança mais direta é trocar o campo model nas chamadas à API. Os três substitutos disponíveis são:
- gpt-image-2 — qualidade mais alta, recomendado para outputs finais e assets de produto.
- gpt-image-1 — equilíbrio entre qualidade e custo, uso geral.
- gpt-image-1-mini — menor custo por requisição, adequado para pré-visualizações e iterações rápidas.
// Antes (quebrado desde 12 mai 2026)
const response = await openai.images.generate({
model: "dall-e-3",
prompt: "product mockup flat design",
n: 1,
size: "1024x1024",
});
// Depois (substituto direto)
const response = await openai.images.generate({
model: "gpt-image-1", // ou "gpt-image-2" / "gpt-image-1-mini"
prompt: "product mockup flat design",
n: 1,
size: "1024x1024",
});Além do identificador de modelo, vale revisar os parâmetros quality e style — a família gpt-image aceita valores diferentes dos que DALL-E 3 expunha. Prompts que dependiam de instruções de estilo específicas do DALL-E 3 (como vivid e natural) podem precisar de ajuste para manter consistência visual.
O que auditar nos próximos dias
- Buscar nos repositórios por
dall-e-2edall-e-3— incluindo variáveis de ambiente e configs hardcoded. - Verificar integrações via SDKs de terceiros (Langchain, LlamaIndex, wrappers de n8n) que podem referenciar o modelo internamente.
- Checar limites de rate e precificação do plano atual — gpt-image tem estrutura de custo diferente.
- Testar prompts críticos com gpt-image-1 antes de subir gpt-image-2 em produção; qualidade maior pode vir com latência maior.
- Atualizar documentação interna e variáveis de ambiente em staging e produção.
Para quem já trabalha com controle de custo de API, o artigo sobre como reduzir custo de API com batch e caching mostra técnicas aplicáveis também ao novo pipeline de imagem — especialmente se o volume de requisições for alto.
Para ler em seguida
O Que São Tokens em IA (2026): Guia Completo para LLMs como GPT e Claude
Tokens explicados: o que são, como a tokenização funciona, custo por token nos principais modelos, como contar antes de enviar e estratégias para reduzir consumo.
Janela de Contexto em IA: Guia Completo (2026) com Limites por Modelo
A janela de contexto define quanto texto um LLM consegue processar de uma vez. Conheça os limites de GPT-5, Claude, Gemini e Llama em 2026, lost-in-the-middle, RAG, chunking e prompt caching.
Qual LLM escolher como freelancer em 2026: Claude, GPT ou open-source?
Matriz decisória para solopreneur brasileiro: Claude vs GPT vs Llama 4 por custo, contexto, reasoning e deploy local. Escolha o LLM certo para cada task.
Reduzir 90% do custo de API Claude com batch e caching
Aprenda a usar batch API e prompt caching do Claude pra cortar despesa com tokens. Guia prático com exemplos reais pra solopreneur.