Tecnología

Calculadora de tokens y costo por modelo de IA🌎

Actualizado junio de 2026
Calculadora Gratis · Privada
Revisado por: (política editorial ) · Última revisión:
¿Tenés una web? Incrustá esta calculadora gratis Gratis — copiá el código y pegalo en tu web Embeber en tu sitio
<iframe src="https://hacecuentas.com/embed/calculadora-tokens-por-modelo-de-ia-costo" width="100%" height="560" style="border:1px solid #e2e8f0;border-radius:12px;max-width:720px" loading="lazy" title="Calculadora de tokens y costo por modelo de IA"></iframe>
<p style="font-size:13px;text-align:center;margin:8px 0">Powered by <a href="https://hacecuentas.com" target="_blank" rel="noopener">Hacé Cuentas</a> — <a href="https://hacecuentas.com/calculadora-tokens-por-modelo-de-ia-costo" target="_blank" rel="noopener">Calculadora de tokens y costo por modelo de IA</a></p>
Ver preview →

Pegalo en tu sitio. Dejá el link de crédito — gracias por compartir. Más widgets →

¿Cuántos tokens tiene tu texto y cuánto te costaría procesarlo con un modelo de IA? Pegá el texto (o ingresá la cantidad de palabras o caracteres), elegí el modelo —GPT-4o, GPT-4o mini, o3, Claude Opus/Sonnet/Haiku 4.x, Gemini 2.5 Pro/Flash, Llama 3.x o DeepSeek— y te mostramos los tokens estimados y el costo en USD de la entrada (input) y la salida (output). Lo mejor: la tabla comparativa te muestra el mismo texto en TODOS los modelos para que veas de una cuál es el más barato. El conteo es una estimación (cada modelo usa su propio tokenizer BPE), pero te da la magnitud exacta para presupuestar.

Última revisión: 20 de junio de 2026 Revisado por Fuente: , , 100% privado

Cuándo usar esta calculadora

  • Estimar cuánto te va a costar una llamada a la API antes de hacerla
  • Comparar el costo del mismo prompt en GPT, Claude, Gemini y modelos open-weight
  • Decidir qué modelo te conviene según presupuesto (¿vale el modelo premium?)
  • Calcular el costo de procesar un documento largo o un dataset de textos
  • Entender cuántos tokens consume un texto antes de pegarlo en un chatbot con límite
  • Presupuestar un proyecto que llama a una IA miles de veces

Ejemplo: 1.000 palabras en GPT-4o

  1. Texto: ~1.000 palabras (lo pegás o lo cargás en el campo de palabras).
  2. Eso son ~1.330 tokens (1.000 ÷ 0,75).
  3. Modelo: GPT-4o ($2,50 por 1M de tokens de entrada).
  4. Uso: solo entrada.
  5. Resultado: 1.330 ÷ 1.000.000 × $2,50 = ~$0,0033 (un tercio de centavo de dólar).

Cómo funciona

2 min de lectura

Qué es un token

Los modelos de lenguaje no leen palabras ni letras: leen tokens. Un token es un fragmento de texto —puede ser una palabra entera, parte de una palabra, un signo de puntuación o un espacio—. Los modelos los generan con un algoritmo llamado BPE (Byte Pair Encoding), que parte el texto en las piezas más frecuentes del idioma en el que fueron entrenados.

Cómo estimamos los tokens

Usamos una heurística estándar:

1 token ≈ 4 caracteres (inglés)
1 token ≈ 3,5–4 caracteres (español, un poco más denso)
1 token ≈ 0,75 palabras

Si pegás texto, contamos los caracteres y dividimos por ~3,7 (punto medio para español). Si cargás palabras, dividimos por 0,75. Es una estimación: el número exacto depende del tokenizer de cada modelo, y el español, los emojis, el código y los números rinden distinto. Para el conteo exacto, OpenAI tiene su tokenizer y Anthropic/Google los suyos, pero para presupuestar esta aproximación alcanza y sobra.

Cómo se calcula el costo

Los precios se cobran por 1.000.000 (1M) de tokens, y casi siempre hay dos precios distintos:

Costo de entrada = (tokens de entrada ÷ 1.000.000) × precio_input
Costo de salida  = (tokens de salida ÷ 1.000.000) × precio_output
Costo total      = costo de entrada + costo de salida

El output (la respuesta del modelo) casi siempre cuesta más que el input: típicamente 3× a 5× más caro por token. Por eso, en aplicaciones que generan respuestas largas, el costo se va mayormente en la salida.

La tabla comparativa (el corazón de la calc)

Debajo del resultado vas a ver una tabla con el mismo texto en TODOS los modelos, ordenada del más barato al más caro. Ahí se ve clarísimo que para tareas simples un modelo mini o flash puede ser 10× a 50× más barato que un modelo premium, y que los modelos open-weight (Llama, DeepSeek) suelen ser los más económicos. El modelo que elegiste aparece marcado con .

Por qué los precios cambian

Los precios de las APIs de IA bajan seguido (competencia + mejoras de eficiencia). Los valores de esta calculadora son de junio 2026; antes de presupuestar en serio, verificá siempre la página oficial de pricing del proveedor, porque puede haber bajado (o haber un modelo nuevo más barato).

Lo que NO incluye

  • Descuentos por caché de prompt (prompt caching), que pueden abaratar el input hasta 10×.

  • Tokens de razonamiento ocultos: modelos como o3 facturan el 'pensamiento' interno como output, así que el costo real puede ser varias veces el visible.

  • Batch / lotes: muchos proveedores dan 50% de descuento por procesamiento asincrónico.

  • Costos de imágenes, audio o herramientas (la calc es solo texto).
  • Preguntas frecuentes

    ¿Qué es un token exactamente?

    Un token es la unidad mínima que procesa un modelo de IA: un fragmento de texto que puede ser una palabra, parte de una palabra, un signo o un espacio. Los modelos parten el texto en tokens con un algoritmo BPE. Como regla rápida, 1 token equivale a unos 4 caracteres o 0,75 palabras en inglés; en español es un poco más denso (más tokens por palabra).

    ¿El conteo de tokens es exacto?

    No, es una estimación. Cada modelo usa su propio tokenizer (OpenAI, Anthropic y Google tienen tokenizers distintos), así que el número exacto varía según el modelo, el idioma y el tipo de contenido (el código y los números rinden distinto que el texto común). Para presupuestar, la aproximación de ~3,7 caracteres por token alcanza; para el número exacto usá el tokenizer oficial del modelo.

    ¿Por qué la salida (output) cuesta más que la entrada?

    Generar texto es computacionalmente más caro que leerlo, así que casi todos los proveedores cobran el output más caro que el input, típicamente entre 3× y 5×. Por ejemplo, GPT-4o cobra $2,50 por 1M de tokens de entrada pero $10 por 1M de salida. En aplicaciones con respuestas largas, el grueso del costo se va en la salida.

    ¿Cuál es el modelo más barato?

    Depende del texto, pero en general los modelos 'mini' o 'flash' (GPT-4o mini, Gemini 2.5 Flash) y los open-weight (Llama 3.x, DeepSeek) son los más económicos: pueden ser 10× a 50× más baratos que un modelo premium como Claude Opus o GPT-4o. La tabla de la calculadora te los ordena automáticamente del más barato al más caro para tu texto.

    ¿Cuánto cuesta procesar 1.000 palabras?

    Unas 1.000 palabras son ~1.330 tokens. Como entrada, eso cuesta ~$0,0033 en GPT-4o, ~$0,0002 en GPT-4o mini, ~$0,0067 en Claude Opus 4.x y ~$0,0017 en Gemini 2.5 Pro. Son fracciones de centavo por llamada, pero si tu app llama miles de veces por día, se suma rápido.

    ¿Los precios incluyen el caché de prompt o los lotes?

    No. La calculadora usa los precios estándar. Muchos proveedores ofrecen descuentos por caché de prompt (input hasta 10× más barato si repetís contexto) y por procesamiento en lotes/batch (suele ser 50% off con entrega asincrónica). Si usás esas opciones, tu costo real será menor que el que muestra la calc.

    ¿Qué pasa con los modelos de razonamiento como o3?

    Los modelos de razonamiento generan 'pensamiento' interno antes de responder, y ese pensamiento se factura como tokens de salida al precio de output. Por eso una llamada a o3 puede costar varias veces lo que muestra el cálculo visible: el output real incluye los tokens de razonamiento que no ves. Tomá la estimación de o3 como un piso, no como el total.

    ¿Por qué están en dólares y no en pesos?

    Las APIs de IA facturan en USD por 1M de tokens, así que mostramos el costo en dólares para que coincida con tu factura del proveedor. Si necesitás el valor en pesos, multiplicá por el tipo de cambio que uses (oficial, MEP o blue, según cómo pagues).

    ¿Cada cuánto se actualizan los precios?

    Los precios de esta calculadora son de junio 2026 y los revisamos cada trimestre. Las APIs de IA bajan de precio seguido por la competencia, así que antes de presupuestar en serio verificá la página oficial de pricing del proveedor (OpenAI, Anthropic, Google): puede haber bajado o haber un modelo nuevo más conveniente.

    Fuentes y referencias

    Metodología y confianza

    Editorial

    Calculadora de tecnologia revisada por el equipo editorial de Hacé Cuentas, con apego a nuestra política editorial y metodología de cálculo.

    Actualización

    Última revisión: 20 de junio de 2026. Los parámetros fiscales, legales y datos se verifican periódicamente con las fuentes citadas.

    Privacidad

    Los cálculos corren 100% en tu navegador. No guardamos ni transmitimos tus datos. Leé nuestra política de privacidad.

    Limitaciones

    Resultados orientativos. Para decisiones financieras, médicas o legales críticas, consultá con un profesional.