Custo API ChatGPT
Esta calculadora estima o custo mensal de uso da API da OpenAI (ChatGPT/GPT-4) com base no volume de tokens de entrada e saída processados. O modelo de cobrança da OpenAI é baseado em tokens — unidades de texto equivalentes a ~4 caracteres ou ¾ de uma palavra em inglês. A fórmula base é: Custo = (Tokens de Entrada × Preço/1M entrada) + (Tokens de Saída × Preço/1M saída). É usada por desenvolvedores, startups e empresas que integram modelos GPT em produtos, chatbots, pipelines de IA ou automações, e precisam projetar gastos antes de escalar.
Quando usar esta calculadora
- Startup que quer projetar o custo de um chatbot de atendimento ao cliente que processa 50.000 mensagens/mês antes de lançar o produto
- Desenvolvedor freelancer que precisa precificar um projeto de análise de documentos jurídicos via API GPT-4o para um escritório de advocacia
- Empresa de SaaS que migra de GPT-4 para GPT-4o mini e quer calcular a economia mensal com base no volume atual de tokens
- Gestor de TI que precisa justificar o orçamento anual de IA generativa para a diretoria com base no consumo real de tokens por departamento
- Pesquisador que usa a API para processar grandes volumes de texto acadêmico e precisa estimar o custo antes de submeter o projeto a uma agência de fomento
Exemplo de cálculo
- 10M entrada, 5M saída, GPT-4
- USD ~550
Como funciona
3 min de leituraComo se calcula
O custo da API da OpenAI é cobrado por 1 milhão de tokens processados (notação: por 1M tokens). A fórmula completa é:
Custo Total (USD) =
(Tokens_Entrada_M × Preço_Entrada_por_1M)
+ (Tokens_Saída_M × Preço_Saída_por_1M)
Custo por requisição =
Custo Total / Número_de_RequisiçõesOnde Tokens_Entrada_M e Tokens_Saída_M são os volumes em milhões de tokens. Os preços variam por modelo e são definidos pela OpenAI em USD. Para converter BRL, multiplique pelo câmbio do dia (referência BCB).
> Estimativa prática de tokens: 1.000 palavras em português ≈ 1.300–1.500 tokens. Uma mensagem típica de chatbot (pergunta + resposta) ≈ 300–600 tokens totais.
---
Tabela de referência
Preços vigentes da API OpenAI (referência: maio 2025). Valores em USD por 1 milhão de tokens:
| Modelo | Entrada (USD/1M) | Saída (USD/1M) | Contexto máx. | Uso recomendado |
|---|---|---|---|---|
| GPT-4.1 | 2,00 | 8,00 | 1.047.576 tokens | Tarefas complexas de raciocínio |
| GPT-4.1 mini | 0,40 | 1,60 | 1.047.576 tokens | Uso geral, custo-benefício alto |
| GPT-4.1 nano | 0,10 | 0,40 | 1.047.576 tokens | Volume massivo, tarefas simples |
| GPT-4o | 2,50 | 10,00 | 128.000 tokens | Multimodal, alta qualidade |
| GPT-4o mini | 0,15 | 0,60 | 128.000 tokens | Chatbots leves, classificação |
| GPT-3.5 Turbo | 0,50 | 1,50 | 16.385 tokens | Legado, tarefas simples |
| o3 | 10,00 | 40,00 | 200.000 tokens | Raciocínio avançado (CoT) |
| o4-mini | 1,10 | 4,40 | 200.000 tokens | Raciocínio eficiente |
> ⚠️ Preços sujeitos a alteração pela OpenAI. Sempre verifique em platform.openai.com/docs/pricing.
---
Casos típicos
Caso 1 — Chatbot de suporte com GPT-4o
Uma empresa de e-commerce processa 10M tokens de entrada e 5M tokens de saída por mês com GPT-4o:
Custo = (10 × 2,50) + (5 × 10,00)
Custo = 25,00 + 50,00 = USD 75,00/mêsSe cada conversa tem em média 600 tokens totais → ~25.000 conversas/mês → custo por conversa ≈ USD 0,003 (~R$ 0,017 ao câmbio de R$ 5,70).
Caso 2 — Pipeline de resumo de documentos com GPT-4.1
Escritório jurídico resume 100 documentos/dia (média 3.000 tokens entrada + 500 tokens saída cada):
Tokens entrada/mês = 100 × 3.000 × 22 dias = 6,6M tokens
Tokens saída/mês = 100 × 500 × 22 dias = 1,1M tokens
Custo = (6,6 × 2,00) + (1,1 × 8,00)
Custo = 13,20 + 8,80 = USD 22,00/mêsCaso 3 — Migração para modelo mais barato (GPT-4o → GPT-4o mini)
Mesmo volume (10M entrada + 5M saída):
GPT-4o: (10 × 2,50) + (5 × 10,00) = USD 75,00
GPT-4o mini: (10 × 0,15) + (5 × 0,60) = USD 4,50
Economia: USD 70,50/mês (-94%)Para tarefas simples de classificação ou FAQ, o GPT-4o mini oferece qualidade suficiente com economia drástica.
---
Erros comuns
1. Confundir tokens com palavras: Desenvolvedores frequentemente estimam 1 token = 1 palavra. Na prática, em português, 1 palavra ≈ 1,3–1,5 tokens devido à morfologia rica do idioma (conjugações, acentos), levando a subestimação de custos de 30–50%.
2. Ignorar o prompt do sistema (system prompt): Em aplicações com system prompts longos (ex.: 2.000 tokens de instrução), esse custo se repete em cada requisição. Em 100.000 requisições/mês, seriam 200M tokens extras de entrada não contabilizados.
3. Não separar tokens de entrada e saída: Entrada e saída têm preços diferentes — em geral, a saída custa 3–5× mais. Usar um preço médio único gera erros significativos no orçamento.
4. Esquecer tokens de contexto em conversas multi-turn: Em chatbots que mantêm histórico, o contexto acumulado é reenviado a cada mensagem. Uma conversa de 10 turnos pode consumir 5–10× mais tokens do que uma troca única.
5. Não considerar cache de prompt (Prompt Caching): A OpenAI oferece desconto de 50% em tokens de entrada que são "cacheados" (prompts longos e repetitivos). Ignorar esse recurso pode significar pagar o dobro do necessário em pipelines com system prompts fixos.
---
Calculadoras relacionadas
No momento, não há calculadoras diretamente relacionadas cadastradas. Explore outras ferramentas em hacecuentas.com para finanças, tecnologia e conversões.
Perguntas frequentes
O que é um token na API da OpenAI?
Um token é a unidade mínima de texto processada pelos modelos GPT. Em inglês, 1 token ≈ 4 caracteres ou ¾ de uma palavra. Em português, devido à morfologia mais complexa (palavras maiores, acentos), a média sobe para ~1,3–1,5 tokens por palavra. A frase 'Olá, como posso ajudar?' tem aproximadamente 8 tokens. Você pode testar a tokenização exata usando o Tokenizer oficial da OpenAI em platform.openai.com/tokenizer.
Qual é o modelo mais barato da OpenAI disponível via API em 2025?
O GPT-4.1 nano é o modelo mais econômico da família GPT-4, custando USD 0,10/1M tokens de entrada e USD 0,40/1M tokens de saída (preços de maio 2025). Para comparação, o GPT-4o custa 25× mais na entrada (USD 2,50/1M). O GPT-4o mini (USD 0,15 entrada / USD 0,60 saída) é uma alternativa muito usada por oferecer boa qualidade a custo reduzido para tarefas de chatbot e classificação.
Como converter o custo de USD para BRL?
Multiplique o custo calculado em USD pela taxa de câmbio do dólar comercial do dia, divulgada diariamente pelo Banco Central do Brasil (BCB) em bcb.gov.br. A OpenAI cobra em USD no cartão de crédito internacional, e a operadora aplica o câmbio do dia mais o IOF de 4,38% sobre compras internacionais (alíquota vigente para pessoa física em 2025, conforme Receita Federal). Exemplo: USD 75,00 × R$ 5,70 × 1,0438 ≈ R$ 446,00.
Existe diferença de preço entre a API do ChatGPT e o ChatGPT Plus?
Sim, são produtos distintos. O ChatGPT Plus é uma assinatura de uso humano (interface web/app) que custa USD 20/mês com acesso a GPT-4o e outros recursos. A API é um serviço de desenvolvedor cobrado por tokens consumidos, sem mensalidade fixa (pay-as-you-go). Uma empresa que usa apenas o ChatGPT Plus não tem acesso programático à API — precisa criar uma conta separada em platform.openai.com e recarregar créditos.
O que é Prompt Caching e como ele reduz custos?
Prompt Caching é um recurso da OpenAI que armazena em cache prefixos longos de prompts (mínimo 1.024 tokens) que se repetem entre requisições. Tokens cacheados têm desconto de 50% no preço de entrada. É especialmente útil para aplicações com system prompts extensos e fixos (ex.: documentos de contexto, instruções detalhadas). No GPT-4o, por exemplo, tokens cacheados custam USD 1,25/1M em vez de USD 2,50/1M. O cache é ativado automaticamente sem configuração adicional.
Como estimar o número de tokens de uma aplicação antes de usar a API?
A OpenAI disponibiliza a biblioteca tiktoken (Python) para contar tokens localmente antes de enviar requisições. Para estimativas rápidas: 1.000 palavras em português ≈ 1.400 tokens; uma página A4 de texto ≈ 600–800 tokens; um código-fonte de 100 linhas ≈ 800–1.500 tokens. O Tokenizer online em platform.openai.com/tokenizer permite colar qualquer texto e ver a contagem exata para cada modelo, sem custo.
A API da OpenAI tem algum custo fixo ou taxa mínima mensal?
Não há mensalidade obrigatória para uso da API. O modelo é estritamente pay-as-you-go: você paga apenas pelos tokens consumidos. No entanto, a OpenAI exige um saldo mínimo de crédito pré-pago (a partir de USD 5,00) para começar a usar. Contas com histórico de pagamento podem ter acesso a limites de uso maiores (Tier 2–5). Não há cobranças de inatividade, mas créditos pré-pagos não expiram enquanto a conta estiver ativa.
Modelos de raciocínio como o3 e o4-mini custam muito mais — quando valem a pena?
Os modelos da série 'o' (o1, o3, o4-mini) usam Chain-of-Thought interno, gerando tokens de raciocínio que também são cobrados. O o3 custa USD 10/1M de entrada e USD 40/1M de saída — 4× mais caro que o GPT-4o. Eles valem a pena para tarefas que exigem raciocínio lógico complexo: matemática avançada, programação competitiva, análise científica. Para chatbots, FAQ, resumos e classificação, modelos como GPT-4o mini oferecem qualidade suficiente a uma fração do custo.