Como cobrar pelo uso de IA no Stripe: guia de billing para SaaS indie
Aprenda a precificar e cobrar automaticamente pelo consumo de tokens IA no Stripe. Setup prático para solopreneur monetizar produto com Claude, GPT ou Gemini.
Por Vitor Morais
Fundador do MochaLabz ·
Cobrar pelo uso de IA dentro do seu produto SaaS é hoje mais fácil que nunca — mas requer setup específico na infraestrutura de billing. O Stripe lançou em 2026 suporte nativo a metering e markup automático para tokens de IA, permitindo que você aplique um markup percentual sobre o custo bruto do modelo (Claude 3.5, GPT-4, Gemini) e cobre o cliente em tempo real, sem tocar uma linha de código a cada transação. Este guia te leva do conceito ao primeiro cliente pagante.
Por que cobrar por token e não por usuário
Cobrar por usuário (seat-based) funciona para SaaS tradicional, mas falha com produtos que usam IA: um cliente pode mexer com seu assistente 10 minutos por mês; outro pode deixá-lo rodando 8 horas por dia. O custo para você é radicalmente diferente, mas você cobra o mesmo.
Cobrar por consumo de tokens alinha incentivos: você lucra mais quando o cliente usa mais sua IA (porque ele vê valor), e o cliente não paga por capacidade que não usa. É o modelo que APIs como OpenAI, Anthropic e Google usam internamente — simples, justo, escalável.
- Margem protegida: você define markup (30%, 50%, 100%) sobre custo de API. Se Claude custa R$ 0,003 por token, você cobra R$ 0,0039 e lucra a diferença.
- Zero overhead administrativo: Stripe lida com cálculo, fatura, cobrança e reconciliação automaticamente.
- Cliente paga pelo que usa: incentivo natural a criar produto mais eficiente em consumo de tokens.
- Previsibilidade de cost: você sabe exatamente quanto paga de API por cliente; markup é fixo.
Como funciona o Stripe Billing para IA em 2026
O Stripe lançou dois novos recursos dentro do Stripe Billing: metering (registrar consumo em tempo real) e pricing baseado em uso com suporte a markup percentual.
Fluxo básico: seu app envia um evento meter_event ao Stripe com a quantidade de tokens consumidos; Stripe multiplica pelo preço base (que você configura), aplica o markup automático, e na data de faturamento (fim do período, ou imediato) cobra o cliente.
exemplo-metering-stripe.ts
// Seu app usa Claude API
const response = await anthropic.messages.create({
model: "claude-3-5-sonnet-20241022",
max_tokens: 1024,
messages: [{ role: "user", content: userMessage }],
});
// Extrai tokens consumidos
const inputTokens = response.usage.input_tokens;
const outputTokens = response.usage.output_tokens;
const totalTokens = inputTokens + outputTokens;
// Envia para Stripe
await stripe.billing.meterEventAdjustments.create({
event_name: 'tokens_used',
timestamp: Math.floor(Date.now() / 1000),
identifier: customerId, // ID do cliente no seu banco
quantity: totalTokens,
});
console.log(`Registrado: ${totalTokens} tokens para cliente ${customerId}`);No dashboard do Stripe, você configura uma price com tipo usage_based e define o custo por unidade + markup percentual. A cobrança é automática no final do ciclo de faturamento.
Passo 1: Configure a Price com metering no Stripe
Acesse o dashboard do Stripe → Products → Create product (ou edite um existente).
- Nome: ex. "Claude API - tokens consumed"
- Billing model: selecione Usage-based
- Unit label: ex. "token" (usado em fatura)
- Price type: Metered (carrega em tempo real)
- Price per unit: R$ 0,00015 (exemplo: Claude 3.5 Sonnet input é ~0,003 por 1k tokens = 0,000003 por token; com markup de 50%, você cobra 0,0000045, arredondado aqui a 0,00015 por mil tokens)
- Apply markup: abilite Markup pricing e defina 50% (ou o percentual que quiser lucrar)
Cálculo de preço com markup
Se você paga Claude R$ 3 por 1 milhão de tokens e quer 50% de markup: (R$ 3 × 1,5) / 1M = R$ 0,0000045 por token. No Stripe, você pode configurar por 1M tokens (R$ 4,50) e deixar o metering contar cada token individualmente.
Passo 2: Configure a subscription do cliente com essa price
Quando o cliente assina seu SaaS, você cria uma subscription no Stripe que aponta para essa price. Não precisa criar nova subscription por cliente — uma única price_id funciona pra todos.
criar-subscription-com-metering.ts
// Cliente assina seu SaaS
const subscription = await stripe.subscriptions.create({
customer: customerId,
items: [
{
price: 'price_IA_TOKEN_METERED', // ID da price que você configurou
},
],
billing_cycle_anchor: Math.floor(Date.now() / 1000), // Start today
off_session: true, // permite cobrança automática
});
console.log('Subscription criada:', subscription.id);Pronto. A partir de agora, toda vez que seu app chamar a Claude API, você envia um meter_event pro Stripe, e ele acumula consumo.
Passo 3: Envie meter events sempre que houver consumo
Cada vez que o cliente usa a IA no seu produto, você registra o consumo de tokens no Stripe. Isso pode ser feito imediatamente (após a API call) ou em lote (ex. a cada 1 hora).
meter-event-batch.ts
// Envio imediato (recomendado)
async function logTokenUsage(customerId: string, tokensUsed: number) {
try {
await stripe.billing.meterEventAdjustments.create({
event_name: 'tokens_used',
timestamp: Math.floor(Date.now() / 1000),
identifier: customerId,
quantity: tokensUsed,
});
console.log(`✓ ${tokensUsed} tokens registrados para ${customerId}`);
} catch (error) {
console.error('Erro ao registrar tokens:', error);
// Reintente ou armazene em fila
}
}
// Uso dentro da função de chat
const response = await anthropic.messages.create({
model: "claude-3-5-sonnet-20241022",
max_tokens: 1024,
messages: [...],
});
await logTokenUsage(req.user.customerId, response.usage.input_tokens + response.usage.output_tokens);Idempotência: evite contar tokens em dobro
Se você reenviar o mesmo meter_event duas vezes, Stripe pode contar em dobro. Use um ID único (idempotency_key no header da request) ou uma fila com deduplicação pra garantir que cada token é contado uma única vez.
Precificação: quanto cobrar por token
Não existe número "certo" — depende do seu posicionamento, custo de operação e valor para o cliente. Mas existem três estratégias comprovadas:
| Estratégia | Markup | Exemplo (Claude 3.5) | Quando usar |
|---|---|---|---|
| Agressiva | 100% – 200% | Você paga R$ 3/1M; cobra R$ 6–9/1M | Seu produto agrega valor claro (geração de código, análise); cliente tem orçamento |
| Balanceada | 50% – 75% | Você paga R$ 3/1M; cobra R$ 4,5–5,25/1M | Produto competitivo; quer crescimento + margem razoável |
| Loss leader | 20% – 40% | Você paga R$ 3/1M; cobra R$ 3,6–4,2/1M | Estágio inicial; vai ganhar na retenção e upsell de features |
Uma SaaS de código com assistente IA que cobra por token usado está entre R$ 4 e R$ 8 por milhão de tokens. Consumo típico de um dev em 1 hora: 100k–500k tokens = R$ 0,40–4 por hora de uso.
Benchmark real de SaaS IA em 2026
Ferramentas como Cursor, Replit Agent e GitHub Copilot cobram entre R$ 50–150/mês (seat) sem limite de tokens. Assistentes B2B especializados cobram R$ 10–50/mês + R$ 0,01–0,05 por solicitação. Se seu produto é nicho, você pode cobrar mais por token sem soar caro.
Exemplo prático: SaaS de geração de descrição de produto
Você construiu uma SaaS que gera descrição otimizada de produtos em e-commerce usando Claude. Cliente envia: título, categoria, preço, features. Você chama Claude, retorna descrição. Cliente quer pagar por uso, não por mês.
- Custo por requisição: ~400 tokens input + 150 tokens output = 550 tokens = R$ 0,00165 (a R$ 3/1M)
- Seu preço com 100% markup: R$ 0,0033 por requisição (ou R$ 3,30 por 1.000 requisições)
- Cliente usa 500 requisições/mês: pagará ~R$ 1,65/mês em IA
- Fatura do cliente: variável (ex. R$ 0 a R$ 50 dependendo uso); Stripe calcula automaticamente
Na prática: cliente vê na fatura "Geração com IA: 500 requisições × R$ 0,0033 = R$ 1,65" — super transparente, sem surpresas.
Perguntas frequentes
E se meu cliente usar muitos tokens em um dia e quiser cancelar no mês que vem?+
O Stripe cobra pelo período de faturamento completo. Se o cliente cancela em dia 15, ele paga pelo consumo de tokens até dia 15. Qualquer overage após o cancelamento não é cobrado. Você pode configurar datas de faturamento específicas no setup da subscription.
Posso ter múltiplas prices de IA (uma por modelo: Claude, GPT, Gemini)?+
Sim, totalmente. Você cria três prices separadas (`price_claude`, `price_gpt`, `price_gemini`), cada uma com seu próprio metering e markup. Quando o cliente usa Claude, você envia meter do Claude; quando usa GPT, você envia meter do GPT. Stripe soma tudo na mesma fatura.
Quanto tempo demora pra Stripe processar um meter_event?+
Meter events são processados em tempo real ou quasi-real (~segundos). O Stripe agrega o consumo durante o ciclo de faturamento e cobra no final do período. Não há delay na invoice final.
Se meu app falhar na chamada de meter_event, o cliente paga mesmo assim?+
Não. Se você não enviar o meter_event, Stripe não tem registro de consumo, portanto não cobra. É sua responsabilidade garantir que todo token seja registrado — use retry logic, filas e logging.
É possível dar cap/limite de tokens por cliente?+
Sim. No seu app, você controla: se cliente já consumiu 1M tokens neste ciclo, você nega a requisição com mensagem "Limite atingido". Stripe não bloqueia automaticamente — você que implementa a lógica no backend.
Como esse modelo se comporta com múltiplas moedas? Tenho clientes no BR e US.+
Stripe suporta pricing dinâmico por moeda. Você cria a mesma price em BRL e USD com valores diferentes. Cliente vê cobrado em sua moeda local. Exemplos: price_tokens_brl, price_tokens_usd.
Próximos passos: infraestrutura e monitoramento
Seu setup está completo quando você tem:
- Logging robusto de tokens: todo token consumido é registrado no banco + enviado pro Stripe com retry
- Dashboard interno: você vê consumo real vs Stripe, identifica discrepâncias
- Alertas: notificação se cliente consumir muito mais que o esperado (may indicar bug ou abuso)
- Fallback: se Stripe cair, seu app continua funcionando (você disputa charges depois ou reajusta invoice)
- Documentação clara: cliente entende exatamente como funciona a cobrança (adicione à landing page ou onboarding)
Muitos solopreneurs com SaaS de IA rodam esse modelo com Stripe em produção desde 2025 — é seguro, escalável e o Stripe suporta sem limite de volume.
Calcule seu markup de token
Use a calculadora de markup para descobrir o preço final que você deve cobrar por token, dado o custo da API.
Abrir calculadora →Artigos relacionados
Como Calcular Markup para Precificar (2026): Fórmula, Passo a Passo e Exemplos Reais
Guia completo para calcular markup: fórmula, diferença entre multiplicador e divisor, inclusão de impostos e fixos, adaptação por categoria e planilha pronta.
Precificação para Freelancer (2026): Como Calcular seu Valor e Parar de Cobrar Pouco
Guia completo de precificação freelancer: cálculo da hora real, modelos (hora, projeto, valor, retainer), posicionamento, negociação e como subir preço sem perder clientes.
Primeiro cliente como freelancer: do zero à primeira fatura em 90 dias
Passo a passo estruturado para dev/designer conquistar primeiro cliente no Brasil. Validação, proposta, contrato e recebimento seguro.