Negocios

Costo vector database: Pinecone, Qdrant, Weaviate — calculadora + tabla comparativa🌎

Actualizado junio de 2026
Calculadora Gratis · Privada
Datos actualizados: · Fuente: Pinecone / Weaviate / Qdrant pricing pages (junio 2026)
Revisado por: (política editorial ) · Última revisión:
M
dims
QPS
USD/GB
USD/M

Una vector database guarda embeddings (vectores de 768 a 3072 dimensiones) y devuelve los más similares a una consulta — el corazón de cualquier sistema RAG, recomendación o búsqueda semántica. Las opciones más usadas en 2026: Pinecone Serverless (managed, fácil de arrancar), Qdrant Cloud (Rust, muy rápido, mejor precio), Weaviate Cloud (open-source + managed, feature-rich), Milvus / Zilliz (alta escala) y pgvector (Postgres, gratis si ya lo tenés). El costo mensual se compone de: storage (USD/GB-mes, calculado como dim × 4 bytes × cantidad de vectores) + queries (USD/millón, donde 10 QPS = 25,9M queries/mes). Esta calculadora hace exactamente eso: estimá storage en GB con float32 y queries/mes a partir del QPS.

Última revisión: 03 de junio de 2026 Revisado por Fuente: Pinecone — Pricing 2026, Weaviate Cloud — Pricing, Qdrant Cloud — Pricing, pgvector — GitHub, Milvus / Zilliz Cloud — Pricing 100% privado

Cuándo usar esta calculadora

  • Estimar el costo mensual de un RAG con N documentos chunkeados.
  • Comparar Pinecone vs Qdrant vs Weaviate Cloud para tu volumen exacto.
  • Decidir si conviene pgvector self-hosted o pasar a managed.
  • Calcular el impacto de subir de 768 a 1536 dimensiones (text-embedding-3-large).
  • Presupuestar el pico de QPS para el lanzamiento de un producto.

Ejemplo: 5M vectores de 1536 dim, 10 QPS en Pinecone Serverless

  1. Storage: 5.000.000 × 1536 × 4 bytes = 30,72 GB.
  2. Costo storage Pinecone: 30,72 GB × USD 0,33/GB-mes = USD 10,14.
  3. Queries/mes: 10 QPS × 86.400 seg/día × 30 días = 25.920.000 queries = 25,92M.
  4. Costo queries Pinecone: 25,92M × USD 8,25/M = USD 213,84.
  5. Total Pinecone Serverless: USD 10,14 + USD 213,84 = ~USD 224/mes.
  6. El mismo workload en Qdrant Cloud: ~USD 80-100/mes (compute-based, queries incluidas).
Resultado: Pinecone ~USD 224/mes · Qdrant Cloud ~USD 80-100/mes · pgvector en Postgres existente: ~USD 0-10/mes extra.

Cómo funciona

4 min de lectura

Fórmulas utilizadas

Storage (GB) = vectores_M × 1.000.000 × dimensión × 4 bytes ÷ 1.073.741.824
Costo storage = GB × USD/GB-mes
Queries/mes = QPS × 86.400 seg/día × 30 días
Costo queries = (queries_mes ÷ 1.000.000) × USD/M_reads
Total mensual = costo_storage + costo_queries

La fórmula usa float32 (4 bytes por componente), que es el formato default de casi todos los providers. Si tu proveedor soporta cuantización int8, dividí el storage por 4.

Tabla comparativa de precios (junio 2026)

ProveedorStorageQueriesPlan freeMejor para
Pinecone ServerlessUSD 0,33/GB-mesUSD 8,25/M readssí (1M vecs)<50M vecs, fácil setup
Pinecone Podfijo por podincluidono>200 QPS sostenido
Qdrant Cloudincluido en computeincluidosí (1 nodo free)mejor precio/QPS
Weaviate Cloud ServerlessUSD 0,12-0,25/GBUSD 4-6/Msí (sandbox)multi-tenant, GraphQL
Milvus / Zilliz Cloudvariablevariable>100M vectores
pgvectorprecio PostgresUSD 0N/A<5M vecs + Postgres existente
Chromainfra propiaUSD 0N/Adev / single-user

Tabla de storage según dimensión y volumen

Vectoresdim 384dim 768dim 1536dim 3072
1M1,4 GB2,9 GB5,7 GB11,4 GB
5M7,2 GB14,3 GB28,6 GB57,2 GB
10M14,3 GB28,6 GB57,2 GB114,4 GB
50M71,5 GB143 GB286 GB572 GB
100M143 GB286 GB572 GB1.144 GB

Consejo: pasar de dim 1536 a 3072 duplica el storage y suele mejorar recall menos de 3% en tareas típicas de RAG. Empezá con 1536.

Costo estimado mensual por escenario (Pinecone Serverless, 10 QPS)

Vectoresdim 1536dim 3072dim 384
1M~USD 218~USD 221~USD 215
5M~USD 224~USD 232~USD 216
20M~USD 240~USD 274~USD 218
50M~USD 308~USD 395~USD 237

Nota: a 10 QPS el costo de queries domina (≈USD 214/mes). Storage entra a pesar a partir de >20M vectores dim 1536.

Tamaño en bytes según dimensión y precisión

ModeloDimfloat32 (default)float16int8
all-MiniLM-L6-v23841,5 KB0,75 KB0,4 KB
OpenAI text-embedding-3-small15366 KB3 KB1,5 KB
OpenAI text-embedding-3-large307212 KB6 KB3 KB
Cohere embed-v310244 KB2 KB1 KB

¿Cuándo conviene cada opción?

pgvector — la más barata para proyectos pequeños

Condición¿Usar pgvector?
Menos de 5M vectoresSí, casi siempre
Ya tenés Postgres activo
Menos de 50 QPS
Necesitás JOINs con tablas SQLSí (ventaja única)
Más de 100M vectoresNo
Latencia <50ms a alto QPSNo, usá managed

Pinecone Serverless vs Pod

AspectoServerlessPod
Modelo de preciopay-per-use storage + readsmensual fijo por pod
Cold startsí (primer query lento)no
Mejor para<100 QPS, traffic variable>200 QPS sostenido
Tendencia 2026empujado por Pineconemodo legacy en descontinuación

Errores que inflan el costo

1. Dimensión innecesariamente alta: dim 3072 cuesta 2× storage que 1536 con mejora marginal de calidad (<3% recall).
2. No filtrar por metadata: buscar sobre 100M vectores cuando podrías pre-filtrar por tenant_id baja 10× el costo de queries.
3. No cachear queries repetidas: Redis/Memcached puede ahorrar 30-50% en apps con consultas frecuentes similares.
4. Re-embeddear todo ante cambios menores: procesá solo los chunks nuevos o modificados.
5. No explorar cuantización: int8 reduce 4× el storage con pérdida típica de <2% en recall@10.

Latencia esperada (p99)

Proveedor<1M vectores10M vectores100M vectores
Pinecone Serverless30-80 ms40-100 ms50-150 ms
Qdrant Cloud15-40 ms25-60 ms40-100 ms
Weaviate Cloud20-50 ms30-70 ms50-120 ms
pgvector (HNSW)10-50 ms30-80 mssuele sufrir

> Aviso: Calculadora educativa. Los precios corresponden a las páginas oficiales de cada proveedor a junio 2026 — verificá antes de comprometer presupuesto. No constituye recomendación de proveedor.

Preguntas frecuentes

¿Cuánto cuesta Pinecone Serverless por mes en 2026?

Pinecone Serverless cobra aproximadamente USD 0,33 por GB-mes de storage y USD 8,25 por millón de reads. Para un workload típico de RAG con 5M vectores de 1536 dim y 10 QPS, el costo es ~USD 224/mes: USD 10 de storage y USD 214 de queries. El plan gratuito incluye hasta 1M vectores.

¿Es Qdrant más barato que Pinecone?

Sí, generalmente 2-3× más barato para workloads medianos (5-50M vectores, <100 QPS). Qdrant Cloud usa un modelo compute-based donde las queries están incluidas en el plan, sin cargo por millón de reads. Para el mismo workload de 5M vectores y 10 QPS, Qdrant suele salir entre USD 80-100/mes frente a ~USD 224/mes de Pinecone Serverless.

¿Cuál es la vector database más barata para 5M vectores?

Si ya tenés Postgres, pgvector (con índice HNSW) sale prácticamente gratis: solo un upgrade de instancia. En managed, Qdrant Cloud suele ser el más barato a esa escala (~USD 60-100/mes), seguido por Weaviate Cloud (~USD 80-130) y Pinecone Serverless (~USD 200+). La calculadora arriba calcula exactamente tu escenario.

¿Cuánto pesa 1 vector? ¿Cómo se calcula el storage?

En float32 (el default): dim × 4 bytes. Un embedding de OpenAI text-embedding-3-small (1536 dim) pesa 6 KB por vector. 1M vectores = 5,7 GB. 5M vectores = 28,6 GB. Si cuantizás a int8, se divide por 4 con pérdida de calidad inferior al 2% en la mayoría de casos.

¿Conviene 384, 768, 1536 o 3072 dimensiones para RAG?

1536 dims (OpenAI text-embedding-3-small) es el sweet spot calidad/costo en 2026 para la mayoría de aplicaciones RAG en español e inglés. 3072 dims (3-large) mejora el recall entre 1-3% pero duplica el storage y la latencia. 384 dims (MiniLM) es 4× más barato y funciona bien para casos de soporte o e-commerce. Empezá con 1536 y bajá si el costo escala.

¿Pinecone Serverless o Pod en 2026?

Serverless para el 90% de los casos: traffic variable, menos de 100 QPS, MVP o producto en crecimiento. Pod solo si tenés más de 200 QPS sostenido y necesitás latencia predecible sin cold starts. Pinecone está empujando a todos hacia Serverless desde 2024 y los pods están en modo legacy.

¿pgvector escala bien a millones de vectores?

Hasta 5-20M vectores con índice HNSW en Postgres 16+, funciona bien (p99 < 80ms). Más allá de 20M, las queries se vuelven lentas y el RAM del servidor sufre. Para más de 50M vectores o más de 50 QPS sostenidos, es mejor migrar a Qdrant, Weaviate o Pinecone. Ventaja única de pgvector: podés hacer JOINs SQL nativos con tus otras tablas.

¿Cuántas queries hace un RAG típico por mes?

Un chatbot con 1.000 usuarios diarios y 5 mensajes/usuario hace 5.000 queries/día = 0,058 QPS promedio = ~150.000 queries/mes. Un producto enterprise con 10.000 usuarios activos puede llegar a 10-100 QPS sostenidos. Estimá: usuarios_día × mensajes_usuario ÷ 86.400 = QPS promedio.

¿Cómo puedo reducir el costo de mi vector database?

Las 5 palancas más efectivas: 1) Pre-filtrá por metadata (tenant_id, fecha) antes del similarity search — puede reducir 10× el costo de queries. 2) Cuantizá a int8 si tu DB lo soporta (4× menos storage). 3) Cacheá queries frecuentes en Redis (ahorro 30-50% en apps con consultas repetidas). 4) Usá modelo de embedding más chico (MiniLM 384 si la calidad alcanza). 5) Procesá solo chunks nuevos al actualizar documentos.

Fuentes y referencias

También te puede interesar

Metodología y confianza

Editorial

Contenido revisado por el equipo editorial de Hacé Cuentas, con apego a nuestra política editorial y metodología de cálculo.

Actualización

Última revisión: 03 de junio de 2026. Los parámetros fiscales, legales y datos se verifican periódicamente con las fuentes citadas.

Privacidad

Los cálculos corren 100% en tu navegador. No guardamos ni transmitimos tus datos. Leé nuestra política de privacidad.

Limitaciones

Resultados orientativos. Para decisiones financieras, médicas o legales críticas, consultá con un profesional.