Matemática

Calculadora de regresión lineal por mínimos cuadrados🌎

Actualizado junio de 2026
Calculadora Gratis · Privada
Revisado por: (política editorial ) · Última revisión:

La regresión lineal por mínimos cuadrados encuentra la recta ŷ = mx + b que minimiza la suma de los cuadrados de los residuos. La pendiente se calcula como m = [n·Σ(xy) − Σx·Σy] / [n·Σx² − (Σx)²] y el intercepto como b = (Σy − m·Σx) / n. El coeficiente R² (0 a 1) mide la bondad de ajuste: R² = 0.90 significa que el modelo explica el 90 % de la variación de y. Ejemplo con (1,2),(2,4),(3,5): m = 1.5, b ≈ 0.67, R² ≈ 0.982 → ŷ = 1.5x + 0.67.

La regresión lineal simple por mínimos cuadrados (MCO) encuentra la recta ŷ = mx + b que mejor ajusta un conjunto de pares de datos (x, y), minimizando la suma de los cuadrados de los errores entre los valores observados y los predichos. Es la herramienta estadística más usada para cuantificar y predecir relaciones lineales entre dos variables: estimación de ventas, modelado de tendencias, calibración de instrumentos, análisis de series de tiempo (IPC, precios, temperatura) y proyecciones académicas.

Última revisión: 03 de junio de 2026 Revisado por Fuente: Khan Academy — Regresión lineal y mínimos cuadrados, NIST/SEMATECH — Engineering Statistics Handbook: Least Squares, Wikipedia ES — Regresión lineal 100% privado

Cuándo usar esta calculadora

  • Estimación de ventas mensuales según precio: cargás los pares (precio, unidades vendidas) de los últimos 12 meses y obtenés la recta para proyectar ingresos futuros.
  • Análisis de tendencia inflacionaria: usás pares (mes, IPC) para modelar la evolución del índice de precios y estimar la variación mensual promedio.
  • Calibración de instrumentos: relacionás la lectura del sensor (x) con el valor real medido (y) para obtener la recta de corrección y el error sistemático.
  • Predicción de notas académicas: relacionás horas de estudio (x) con calificaciones finales (y) para identificar si existe relación lineal significativa (R² alto).

Ejemplo paso a paso

  1. Datos: (1,2), (2,4), (3,5) → X: 1,2,3 y Y: 2,4,5
  2. n = 3, Σx = 6, Σy = 11, Σxy = 25, Σx² = 14
  3. m = (3·25 − 6·11) / (3·14 − 36) = (75−66)/(42−36) = 9/6 = 1.5
  4. b = (11 − 1.5·6) / 3 = 2/3 ≈ 0.667
  5. R² ≈ 0.982 → ajuste muy fuerte
  6. Resultado: ŷ = 1.5x + 0.67
Resultado: ŷ = 1.5x + 0.67, R² = 0.982

Cómo funciona

3 min de lectura

Cómo funciona el método de mínimos cuadrados

El método de mínimos cuadrados ordinarios (MCO) minimiza la función de costo:

S = Σᵢ (yᵢ − ŷᵢ)²   →   minimizar respecto a m y b

De las condiciones de primer orden (igualando las derivadas parciales a cero) se obtienen las fórmulas cerradas:

m = [n·Σ(xᵢ·yᵢ) − Σxᵢ·Σyᵢ] / [n·Σxᵢ² − (Σxᵢ)²]

b = (Σyᵢ − m·Σxᵢ) / n

ŷ = m·x + b

R² = 1 − [Σ(yᵢ − ŷᵢ)²] / [Σ(yᵢ − ȳ)²]

Donde:

  • n = cantidad de pares de datos

  • Σ = sumatoria sobre todos los pares

  • ȳ = media aritmética de los valores y

  • = coeficiente de determinación (0 = ningún ajuste, 1 = ajuste perfecto)
  • ---

    Tabla de interpretación de R²

    Calidad del ajusteUso típico
    0.00 – 0.19Muy débilSin relación lineal apreciable
    0.20 – 0.39DébilCiencias sociales, variables ruidosas
    0.40 – 0.59ModeradoEconomía, demografía
    0.60 – 0.79BuenoEstadística aplicada general
    0.80 – 0.94Muy buenoIngeniería, física experimental
    0.95 – 1.00ExcelenteCalibración, relaciones físicas exactas

    > Nota: los umbrales son convenciones descriptivas (Cohen, 1988). En ciencias sociales R² ≥ 0.30 ya es relevante; en ingeniería de procesos se exige R² ≥ 0.95.

    ---

    Tabla de ejemplos de referencia

    Datos xDatos ymbInterpretación
    1,2,32,4,51.5000.6670.982Ajuste excelente
    1,2,3,4,52,4,5,4,50.7002.2000.544Ajuste moderado
    1,2,3,4,55,1,6,2,50.0003.8000.000Sin relación lineal
    1,2,3,4,51,4,9,16,255.400-5.6000.934Muy bueno (cuadrática approx.)

    ---

    Caso real: análisis de IPC mensual

    Supongamos que el IPC general de 6 meses es: 145, 152, 158, 167, 174, 180 con x = 1…6:

  • m ≈ 7.0 puntos por mes

  • b ≈ 137.7

  • R² ≈ 0.997 → tendencia casi perfectamente lineal
  • Proyección mes 7: ŷ = 7.0·7 + 137.7 ≈ 186.7

    ---

    Errores comunes a evitar

    1. Confundir R² alto con causalidad. Correlación ≠ causalidad. El consumo de helado y los ahogamientos tienen R² alto porque ambos dependen del calor, no porque uno cause el otro.

    2. Extrapolar más allá del rango observado. La recta solo es válida dentro del intervalo de datos. Para x fuera del rango, las predicciones pueden ser absurdas.

    3. Ignorar el gráfico de residuos. Un patrón sistemático en los residuos (forma de U) indica que el modelo lineal no es el adecuado.

    4. Invertir x e y. Cambiar x por y invierte la recta: m_xy ≠ 1/m_yx salvo que R² = 1. Definí bien cuál es la variable explicativa (x) antes de calcular.

    5. Pocos puntos con R² aparentemente perfecto. Con solo 2 puntos, R² = 1 siempre. Necesitás al menos 10 pares para que R² sea estadísticamente informativo.

    Preguntas frecuentes

    ¿Qué es la regresión lineal por mínimos cuadrados?

    Es un método estadístico que encuentra la recta ŷ = mx + b que mejor ajusta un conjunto de datos minimizando la suma de los cuadrados de las diferencias entre los valores observados (y) y los predichos (ŷ). Es el estimador más común en estadística porque es el de mínima varianza entre todos los estimadores lineales insesgados (teorema de Gauss-Markov).

    ¿Qué significa el coeficiente R²?

    R² (coeficiente de determinación) indica qué proporción de la varianza total de y queda explicada por la recta. Un R² = 0.85 significa que el 85 % de la variación en y se explica por la relación lineal con x. Va de 0 (ningún ajuste) a 1 (ajuste perfecto). En ciencias sociales, R² ≥ 0.30 ya es significativo; en ingeniería se exige R² ≥ 0.95.

    ¿Cómo se interpreta la pendiente m?

    La pendiente m indica cuánto varía y por cada unidad que aumenta x. Si m = 2.5, entonces y crece 2.5 unidades por cada incremento de 1 en x. Si m es negativa (ej. m = -1.3), y disminuye cuando x sube (relación inversa). El signo de m determina la dirección y el valor absoluto determina la intensidad del cambio.

    ¿Cómo se interpreta el intercepto b?

    b es el valor predicho de y cuando x = 0. En algunos contextos tiene interpretación directa (ej. costo fijo si x = unidades producidas). En otros, x = 0 puede estar fuera del rango de datos y b es simplemente un parámetro de ajuste. Revisá siempre si x = 0 tiene sentido en tu problema antes de interpretarlo como un valor real.

    ¿Cuántos pares de datos necesito mínimamente?

    Con 2 puntos la recta es exacta pero trivial (R² = 1 siempre). En la práctica se recomienda un mínimo de 10 pares para estimaciones estables. Para tests de hipótesis formales sobre la pendiente, la regla empírica es n ≥ 20; con n ≥ 30 los resultados son más robustos estadísticamente.

    ¿Los datos tienen que estar ordenados de menor a mayor en x?

    No. Las fórmulas de MCO usan sumatorias (Σx, Σy, Σxy, Σx²) que son conmutativas: el resultado es idéntico sin importar el orden. Lo que sí es crítico es que cada valor x esté emparejado con su y correspondiente: no reordenes una columna sin hacer lo mismo con la otra.

    ¿Qué diferencia hay entre regresión lineal simple y múltiple?

    La regresión simple modela la relación entre una variable explicativa (x) y una respuesta (y): ŷ = mx + b. La regresión múltiple incorpora dos o más variables: ŷ = b₀ + b₁x₁ + b₂x₂ + … Esta calculadora resuelve el caso simple. Para el múltiple se necesita álgebra matricial: β = (XᵀX)⁻¹Xᵀy.

    ¿Qué hago si R² es muy bajo (menor a 0.3)?

    Un R² bajo indica que el modelo lineal simple no capta bien la relación. Las opciones son: (1) incorporar más variables (regresión múltiple), (2) explorar transformaciones (logarítmica, polinómica, exponencial), (3) verificar valores atípicos que distorsionan la recta, o (4) concluir que no existe relación lineal predecible entre esas variables. No forzar un modelo lineal si los datos no lo sugieren.

    ¿Puedo usar esta calculadora para series de tiempo?

    Sí. En series de tiempo asignás x = 1, 2, 3, … (período) e y = valor observado. La pendiente m representa la variación promedio por período y b el nivel estimado en el período 0. Ejemplo: con datos de IPC del INDEC podés estimar la tendencia lineal. Tené en cuenta que las series con autocorrelación afectan los tests de significancia, aunque el cálculo puntual de m y b sigue siendo válido.

    Fuentes y referencias

    Metodología y confianza

    Editorial

    Contenido revisado por el equipo editorial de Hacé Cuentas, con apego a nuestra política editorial y metodología de cálculo.

    Actualización

    Última revisión: 03 de junio de 2026. Los parámetros fiscales, legales y datos se verifican periódicamente con las fuentes citadas.

    Privacidad

    Los cálculos corren 100% en tu navegador. No guardamos ni transmitimos tus datos. Leé nuestra política de privacidad.

    Limitaciones

    Resultados orientativos. Para decisiones financieras, médicas o legales críticas, consultá con un profesional.