Tecnologia

Custo API ChatGPT

Calculadora Grátis · Privado
Esta calculadora foi útil?

Esta calculadora estima o custo mensal de uso da API da OpenAI (ChatGPT/GPT-4) com base no volume de tokens de entrada e saída processados. O modelo de cobrança da OpenAI é baseado em tokens — unidades de texto equivalentes a ~4 caracteres ou ¾ de uma palavra em inglês. A fórmula base é: Custo = (Tokens de Entrada × Preço/1M entrada) + (Tokens de Saída × Preço/1M saída). É usada por desenvolvedores, startups e empresas que integram modelos GPT em produtos, chatbots, pipelines de IA ou automações, e precisam projetar gastos antes de escalar.

Última revisão: 19 de abril de 2026 Verificado por Fonte: OpenAI – Pricing oficial da API (platform.openai.com), Banco Central do Brasil – Taxa de câmbio do dólar (BCB), Receita Federal – IOF sobre compras internacionais no cartão, Wikipedia PT – Processamento de linguagem natural (tokenização) 100% privado

Quando usar esta calculadora

  • Startup que quer projetar o custo de um chatbot de atendimento ao cliente que processa 50.000 mensagens/mês antes de lançar o produto
  • Desenvolvedor freelancer que precisa precificar um projeto de análise de documentos jurídicos via API GPT-4o para um escritório de advocacia
  • Empresa de SaaS que migra de GPT-4 para GPT-4o mini e quer calcular a economia mensal com base no volume atual de tokens
  • Gestor de TI que precisa justificar o orçamento anual de IA generativa para a diretoria com base no consumo real de tokens por departamento
  • Pesquisador que usa a API para processar grandes volumes de texto acadêmico e precisa estimar o custo antes de submeter o projeto a uma agência de fomento

Exemplo de cálculo

  1. 10M entrada, 5M saída, GPT-4
  2. USD ~550
Resultado: Requisição média USD 0,05

Como funciona

3 min de leitura

Como se calcula

O custo da API da OpenAI é cobrado por 1 milhão de tokens processados (notação: por 1M tokens). A fórmula completa é:

Custo Total (USD) =
  (Tokens_Entrada_M × Preço_Entrada_por_1M)
+ (Tokens_Saída_M  × Preço_Saída_por_1M)

Custo por requisição =
  Custo Total / Número_de_Requisições

Onde Tokens_Entrada_M e Tokens_Saída_M são os volumes em milhões de tokens. Os preços variam por modelo e são definidos pela OpenAI em USD. Para converter BRL, multiplique pelo câmbio do dia (referência BCB).

> Estimativa prática de tokens: 1.000 palavras em português ≈ 1.300–1.500 tokens. Uma mensagem típica de chatbot (pergunta + resposta) ≈ 300–600 tokens totais.

---

Tabela de referência

Preços vigentes da API OpenAI (referência: maio 2025). Valores em USD por 1 milhão de tokens:

ModeloEntrada (USD/1M)Saída (USD/1M)Contexto máx.Uso recomendado
GPT-4.12,008,001.047.576 tokensTarefas complexas de raciocínio
GPT-4.1 mini0,401,601.047.576 tokensUso geral, custo-benefício alto
GPT-4.1 nano0,100,401.047.576 tokensVolume massivo, tarefas simples
GPT-4o2,5010,00128.000 tokensMultimodal, alta qualidade
GPT-4o mini0,150,60128.000 tokensChatbots leves, classificação
GPT-3.5 Turbo0,501,5016.385 tokensLegado, tarefas simples
o310,0040,00200.000 tokensRaciocínio avançado (CoT)
o4-mini1,104,40200.000 tokensRaciocínio eficiente

> ⚠️ Preços sujeitos a alteração pela OpenAI. Sempre verifique em platform.openai.com/docs/pricing.

---

Casos típicos

Caso 1 — Chatbot de suporte com GPT-4o


Uma empresa de e-commerce processa 10M tokens de entrada e 5M tokens de saída por mês com GPT-4o:

Custo = (10 × 2,50) + (5 × 10,00)
Custo = 25,00 + 50,00 = USD 75,00/mês

Se cada conversa tem em média 600 tokens totais → ~25.000 conversas/mês → custo por conversa ≈ USD 0,003 (~R$ 0,017 ao câmbio de R$ 5,70).

Caso 2 — Pipeline de resumo de documentos com GPT-4.1


Escritório jurídico resume 100 documentos/dia (média 3.000 tokens entrada + 500 tokens saída cada):

Tokens entrada/mês = 100 × 3.000 × 22 dias = 6,6M tokens
Tokens saída/mês  = 100 × 500 × 22 dias   = 1,1M tokens

Custo = (6,6 × 2,00) + (1,1 × 8,00)
Custo = 13,20 + 8,80 = USD 22,00/mês

Caso 3 — Migração para modelo mais barato (GPT-4o → GPT-4o mini)


Mesmo volume (10M entrada + 5M saída):

GPT-4o:      (10 × 2,50) + (5 × 10,00) = USD 75,00
GPT-4o mini: (10 × 0,15) + (5 × 0,60)  = USD  4,50
Economia: USD 70,50/mês (-94%)

Para tarefas simples de classificação ou FAQ, o GPT-4o mini oferece qualidade suficiente com economia drástica.

---

Erros comuns

1. Confundir tokens com palavras: Desenvolvedores frequentemente estimam 1 token = 1 palavra. Na prática, em português, 1 palavra ≈ 1,3–1,5 tokens devido à morfologia rica do idioma (conjugações, acentos), levando a subestimação de custos de 30–50%.

2. Ignorar o prompt do sistema (system prompt): Em aplicações com system prompts longos (ex.: 2.000 tokens de instrução), esse custo se repete em cada requisição. Em 100.000 requisições/mês, seriam 200M tokens extras de entrada não contabilizados.

3. Não separar tokens de entrada e saída: Entrada e saída têm preços diferentes — em geral, a saída custa 3–5× mais. Usar um preço médio único gera erros significativos no orçamento.

4. Esquecer tokens de contexto em conversas multi-turn: Em chatbots que mantêm histórico, o contexto acumulado é reenviado a cada mensagem. Uma conversa de 10 turnos pode consumir 5–10× mais tokens do que uma troca única.

5. Não considerar cache de prompt (Prompt Caching): A OpenAI oferece desconto de 50% em tokens de entrada que são "cacheados" (prompts longos e repetitivos). Ignorar esse recurso pode significar pagar o dobro do necessário em pipelines com system prompts fixos.

---

Calculadoras relacionadas

No momento, não há calculadoras diretamente relacionadas cadastradas. Explore outras ferramentas em hacecuentas.com para finanças, tecnologia e conversões.

Perguntas frequentes

O que é um token na API da OpenAI?

Um token é a unidade mínima de texto processada pelos modelos GPT. Em inglês, 1 token ≈ 4 caracteres ou ¾ de uma palavra. Em português, devido à morfologia mais complexa (palavras maiores, acentos), a média sobe para ~1,3–1,5 tokens por palavra. A frase 'Olá, como posso ajudar?' tem aproximadamente 8 tokens. Você pode testar a tokenização exata usando o Tokenizer oficial da OpenAI em platform.openai.com/tokenizer.

Qual é o modelo mais barato da OpenAI disponível via API em 2025?

O GPT-4.1 nano é o modelo mais econômico da família GPT-4, custando USD 0,10/1M tokens de entrada e USD 0,40/1M tokens de saída (preços de maio 2025). Para comparação, o GPT-4o custa 25× mais na entrada (USD 2,50/1M). O GPT-4o mini (USD 0,15 entrada / USD 0,60 saída) é uma alternativa muito usada por oferecer boa qualidade a custo reduzido para tarefas de chatbot e classificação.

Como converter o custo de USD para BRL?

Multiplique o custo calculado em USD pela taxa de câmbio do dólar comercial do dia, divulgada diariamente pelo Banco Central do Brasil (BCB) em bcb.gov.br. A OpenAI cobra em USD no cartão de crédito internacional, e a operadora aplica o câmbio do dia mais o IOF de 4,38% sobre compras internacionais (alíquota vigente para pessoa física em 2025, conforme Receita Federal). Exemplo: USD 75,00 × R$ 5,70 × 1,0438 ≈ R$ 446,00.

Existe diferença de preço entre a API do ChatGPT e o ChatGPT Plus?

Sim, são produtos distintos. O ChatGPT Plus é uma assinatura de uso humano (interface web/app) que custa USD 20/mês com acesso a GPT-4o e outros recursos. A API é um serviço de desenvolvedor cobrado por tokens consumidos, sem mensalidade fixa (pay-as-you-go). Uma empresa que usa apenas o ChatGPT Plus não tem acesso programático à API — precisa criar uma conta separada em platform.openai.com e recarregar créditos.

O que é Prompt Caching e como ele reduz custos?

Prompt Caching é um recurso da OpenAI que armazena em cache prefixos longos de prompts (mínimo 1.024 tokens) que se repetem entre requisições. Tokens cacheados têm desconto de 50% no preço de entrada. É especialmente útil para aplicações com system prompts extensos e fixos (ex.: documentos de contexto, instruções detalhadas). No GPT-4o, por exemplo, tokens cacheados custam USD 1,25/1M em vez de USD 2,50/1M. O cache é ativado automaticamente sem configuração adicional.

Como estimar o número de tokens de uma aplicação antes de usar a API?

A OpenAI disponibiliza a biblioteca tiktoken (Python) para contar tokens localmente antes de enviar requisições. Para estimativas rápidas: 1.000 palavras em português ≈ 1.400 tokens; uma página A4 de texto ≈ 600–800 tokens; um código-fonte de 100 linhas ≈ 800–1.500 tokens. O Tokenizer online em platform.openai.com/tokenizer permite colar qualquer texto e ver a contagem exata para cada modelo, sem custo.

A API da OpenAI tem algum custo fixo ou taxa mínima mensal?

Não há mensalidade obrigatória para uso da API. O modelo é estritamente pay-as-you-go: você paga apenas pelos tokens consumidos. No entanto, a OpenAI exige um saldo mínimo de crédito pré-pago (a partir de USD 5,00) para começar a usar. Contas com histórico de pagamento podem ter acesso a limites de uso maiores (Tier 2–5). Não há cobranças de inatividade, mas créditos pré-pagos não expiram enquanto a conta estiver ativa.

Modelos de raciocínio como o3 e o4-mini custam muito mais — quando valem a pena?

Os modelos da série 'o' (o1, o3, o4-mini) usam Chain-of-Thought interno, gerando tokens de raciocínio que também são cobrados. O o3 custa USD 10/1M de entrada e USD 40/1M de saída — 4× mais caro que o GPT-4o. Eles valem a pena para tarefas que exigem raciocínio lógico complexo: matemática avançada, programação competitiva, análise científica. Para chatbots, FAQ, resumos e classificação, modelos como GPT-4o mini oferecem qualidade suficiente a uma fração do custo.

Fontes e referências