Google lança Gemini Omni e Gemini 3.5 Flash no I/O 2026
Gemini Omni cria qualquer saída a partir de qualquer entrada, com foco em vídeo. Gemini 3.5 Flash combina inteligência frontier com ação — base da plataforma agent-first do Google.
Por Vitor Morais
Fundador do MochaLabz ·
O Google apresentou dois novos modelos durante o Google I/O 2026, em 19 de maio: Gemini Omni e Gemini 3.5 Flash. Segundo o anúncio oficial, "Gemini Omni can create anything from any input, starting with video, and is a leap forward in world understanding, multimodality and editing, while Gemini 3.5 Flash is the first in our latest family of models combining frontier intelligence with action." O lançamento marca a aposta do Google na transição de ferramentas de IA assistivas para agentes que executam tarefas de forma autônoma.
O que cada modelo faz na prática
Gemini Omni é posicionado como o modelo de maior capacidade perceptiva da família: aceita qualquer tipo de entrada — texto, imagem, áudio e vídeo — e produz saídas igualmente variadas. O foco inicial está em vídeo, com capacidades de compreensão de cena, edição e geração que o Google descreve como um salto qualitativo em relação às versões anteriores.
Gemini 3.5 Flash ocupa o outro extremo: é o primeiro modelo da nova linha a equilibrar inteligência de nível frontier com capacidade de agir — ou seja, não apenas responder a perguntas, mas completar sequências de passos em nome do usuário. É a peça central da plataforma Antigravity, que o Google descreve como agent-first: projetada para quem quer construir fluxos que operam sem intervenção humana a cada etapa.
- Gemini Omni — multimodalidade total, entrada e saída em vídeo, áudio, imagem e texto; salto em compreensão de mundo e edição.
- Gemini 3.5 Flash — primeiro modelo da família que combina inteligência frontier com execução de ações; base do stack agentic do Google.
- Antigravity — plataforma agent-first expandida no I/O; permite que qualquer pessoa construa agentes que operam sobre múltiplas ferramentas.
O que muda para quem já usa IA na operação
A combinação dos dois modelos sinaliza uma bifurcação clara na oferta do Google: Omni para quem precisa de capacidade perceptiva pesada — análise de vídeo, geração de assets multimodais, transcrição com contexto visual; Flash para quem monta pipelines agentic e precisa de um modelo que reaja, decida e execute dentro de um fluxo automatizado.
Para quem já usa n8n ou agentes conectados via MCP, o Gemini 3.5 Flash passa a ser uma alternativa concreta ao GPT-4o e ao Claude Sonnet em fluxos que exigem baixa latência e ação encadeada. A disponibilidade via API do Google AI Studio e Vertex AI significa que é possível trocar o modelo em um endpoint existente sem reescrever a lógica do agente.
Antigravity é o ponto de atenção real
Mais do que os modelos em si, a plataforma Antigravity representa a aposta estrutural do Google: um ambiente onde agentes de IA coordenam tarefas entre ferramentas, não apenas assistem a humanos. Quem já tem automações rodando vai querer avaliar se vale migrar parte do stack para dentro do ecossistema Google — especialmente se o projeto usa Google Workspace, Drive ou YouTube como fonte de dados.
Disponibilidade e acesso
O Google não detalhou precificação final por token dos novos modelos no anúncio do I/O, mas confirmou acesso via Google AI Studio para desenvolvedores testarem Gemini 3.5 Flash imediatamente após o evento. Gemini Omni, com foco em vídeo, tem rollout progressivo — o acesso completo ainda não está disponível para todos os planos.
Para quem está avaliando qual modelo usar em automações que envolvem análise de conteúdo ou geração de assets, vale comparar Gemini 3.5 Flash com as alternativas atuais — o artigo Qual LLM escolher: Claude, GPT ou Llama traz os critérios práticos de decisão por tipo de tarefa.
Para ler em seguida
Como Economizar Tokens no ChatGPT, Claude e Gemini (Guia 2026)
Reduza o custo das APIs de IA em 40–80% sem perder qualidade. 12 técnicas práticas: compressão, prompt caching, modelos em cascata, RAG, batching, sumarização — com estimativas reais.
Arquitetura mínima de um agente IA em produção
Os 3 componentes que separam um agente IA funcional de um loop de prompts frágil: indexação, query layer e feedback — sem overengineering.
Qual LLM escolher como freelancer em 2026: Claude, GPT ou open-source?
Matriz decisória para solopreneur brasileiro: Claude vs GPT vs Llama 4 por custo, contexto, reasoning e deploy local. Escolha o LLM certo para cada task.
MCP: conecte agentes IA a ferramentas reais em 2026
Model Context Protocol vira padrão universal de agentes IA. Veja como conectar Claude a Notion, Stripe e APIs próprias sem DevOps em 2026.