regresión lineal múltiple (RLM) te permite predecir una variable dependiente ( ) usando dos o más variables independientes (
). Resolver estos ejercicios "a mano" suele implicar trabajar con o fórmulas simplificadas para dos variables explicativas. Ejemplo Práctico: Datos de Ventas Imagina que quieres predecir las ventas ( ) basadas en el gasto en publicidad ( cap X sub 1 ) y el número de vendedores ( cap X sub 2 Observación cap X sub 1 (Publicidad) cap X sub 2 (Vendedores) Paso 1: Definir la Ecuación del Modelo El modelo tiene la forma: Paso 2: Calcular Coeficientes por Mínimos Cuadrados A mano, lo más común es usar la notación matricial
beta hat equals open paren cap X to the cap T-th power cap X close paren to the negative 1 power cap X to the cap T-th power cap Y : Incluye una columna de "1" para el intercepto ( beta sub 0 ) y las columnas de cap X sub 1 cap X sub 2 Cálculo de cap X to the cap T-th power cap X : Multiplicas la transpuesta de por sí misma. Inversa de
: Este es el paso más laborioso a mano; se suele usar el método de Gauss-Jordan o la adjunta para matrices 3x3. Cálculo final : Multiplicas la inversa obtenida por cap X to the cap T-th power cap Y para hallar los valores de beta sub 2 Paso 3: Interpretación de Resultados Multiple linear regression with matrices and by hand
Esta es una guía detallada y práctica sobre la regresión lineal múltiple, enfocada específicamente en la resolución de ejercicios a mano.
Si estás estudiando estadística o econometría, entender el proceso manual es vital para captar la lógica detrás de los algoritmos que usan programas como Excel, R o Python. Regresión Lineal Múltiple: Ejercicios Resueltos a Mano
La regresión lineal múltiple (RLM) busca predecir el valor de una variable dependiente (
) basándose en el valor de dos o más variables independientes ( La Ecuación General La fórmula que intentamos construir es:
Ŷ=β0+β1X1+β2X2+ϵcap Y hat equals beta sub 0 plus beta sub 1 cap X sub 1 plus beta sub 2 cap X sub 2 plus epsilon β0beta sub 0 : Intersección (constante). : Coeficientes de regresión (pendientes). : Error aleatorio.
Metodología: El Método de Mínimos Cuadrados Ordinarios (MCO)
Para resolver esto a mano sin usar matrices complejas, utilizamos el sistema de ecuaciones normales. Para un modelo con dos variables independientes, el sistema es: Ejercicio Resuelto Paso a Paso Enunciado: Queremos predecir la Nota Final ( ) de 5 alumnos en base a las Horas de Estudio ( X1cap X sub 1 ) y la Asistencia a clase ( X2cap X sub 2 ). X1cap X sub 1 Asistencia ( X2cap X sub 2 Paso 1: Crear la tabla de cálculos auxiliares
Necesitamos las sumatorias de cada término de las ecuaciones normales. X1cap X sub 1 X2cap X sub 2 X12cap X sub 1 squared X22cap X sub 2 squared X1X2cap X sub 1 cap X sub 2 X1Ycap X sub 1 cap Y X2Ycap X sub 2 cap Y Σ: 15 Σ: 30 Σ: 320 Σ: 55 Σ: 210 Σ: 106 Σ: 1090 Σ: 2130 Datos adicionales: Paso 2: Sustituir en las ecuaciones normales Sustituimos los totales en el sistema:
Paso 3: Resolver el sistema de ecuaciones (Método de Reducción)
Este es el paso donde la mayoría comete errores. Vamos a simplificar. Dividimos la ecuación (1) por 5:
64=β0+3β1+6β2→64 equals beta sub 0 plus 3 beta sub 1 plus 6 beta sub 2 right arrow Despejamos β0beta sub 0 Sustituimos β0beta sub 0 en las ecuaciones (2) y (3): Para la (2): --- (Ecuación A) Para la (3): --- (Ecuación B)
Ahora resolvemos el sistema pequeño (A y B). Al final de los cálculos aritméticos, obtenemos: Sustituimos en β0beta sub 0 Paso 4: Ecuación Final de Regresión La ecuación resultante es:
Ŷ=24.49+12.27X1+0.45X2cap Y hat equals 24.49 plus 12.27 cap X sub 1 plus 0.45 cap X sub 2 Interpretación de Resultados
Intercepto (24.49): Si un alumno estudia 0 horas y tiene 0 asistencia, su nota estimada sería de 24.49. Coeficiente X1cap X sub 1 regresion lineal multiple ejercicios resueltos a mano
(12.27): Por cada hora extra de estudio, la nota aumenta 12.27 puntos (manteniendo constante la asistencia). Coeficiente X2cap X sub 2
(0.45): Por cada unidad de asistencia extra, la nota sube solo 0.45 puntos. Consejos para resolver estos ejercicios en exámenes
Orden en la tabla: La mayor parte de los fallos ocurren al multiplicar X1X2cap X sub 1 cap X sub 2
o al sumar las columnas. Usa regla y calculadora de doble entrada.
Verificación: Si tienes tiempo, sustituye los valores de un alumno real en tu fórmula. El resultado debería ser cercano al valor real de
Decimales: Trabaja con al menos dos o tres decimales para evitar errores de redondeo acumulados.
¿Te gustaría que resolvamos otro ejercicio enfocado en el cálculo del Coeficiente de Determinación ( R2cap R squared ) para este mismo caso?
Para resolver un ejercicio de regresión lineal múltiple a mano, generalmente se utiliza el enfoque matricial
, que es el método más sistemático para manejar varias variables independientes ( Ejemplo práctico: Predicción de Ventas Imagina que quieres predecir las Ventas (Y) basándote en el Gasto en Publicidad ( cap X sub 1 Número de Vendedores ( cap X sub 2 Ventas (Y) Publicidad ( cap X sub 1 Vendedores ( cap X sub 2 Paso 1: Definir las Matrices El modelo sigue la forma . Primero, construye la matriz de diseño ( ) añadiendo una columna de 1s para el intercepto (
cap X equals the 3 by 3 matrix; Row 1: 1, 2, 1; Row 2: 1, 4, 2; Row 3: 1, 5, 2 end-matrix; comma space cap Y equals the 3 by 1 column matrix; 10, 15, 20 end-matrix; Paso 2: Calcular la Transpuesta ( cap X to the cap T-th power ) y el Producto ( cap X to the cap T-th power cap X
Multiplica la matriz transpuesta por la original para obtener una matriz cuadrada que resuma las relaciones entre variables.
cap X to the cap T-th power cap X equals the 3 by 3 matrix; Row 1: 1, 1, 1; Row 2: 2, 4, 5; Row 3: 1, 2, 2 end-matrix; the 3 by 3 matrix; Row 1: 1, 2, 1; Row 2: 1, 4, 2; Row 3: 1, 5, 2 end-matrix; equals the 3 by 3 matrix; Row 1: 3, 11, 5; Row 2: 11, 45, 20; Row 3: 5, 20, 9 end-matrix; Paso 3: Calcular la Inversa
Este es el paso más laborioso a mano. Debes encontrar la matriz inversa de cap X to the cap T-th power cap X usando métodos como la Gauss-Jordan
. Esta matriz inversa actúa como el "divisor" en el cálculo de los coeficientes. Paso 4: Calcular cap X to the cap T-th power cap Y Multiplica la transpuesta por el vector de resultados.
cap X to the cap T-th power cap Y equals the 3 by 3 matrix; Row 1: 1, 1, 1; Row 2: 2, 4, 5; Row 3: 1, 2, 2 end-matrix; the 3 by 1 column matrix; 10, 15, 20 end-matrix; equals the 3 by 1 column matrix; 45, 180, 80 end-matrix; Paso 5: Obtener los Coeficientes ( Finalmente, los coeficientes se obtienen con la fórmula: Investopedia : Intercepto (valor de Y si todas las X son 0). : El impacto de cada variable en el resultado final. Multiple Linear Regression | Solved Exercise
La regresión lineal múltiple es la extensión de la regresión lineal simple cuando tenemos más de una variable independiente ( ) para predecir una variable dependiente (
A continuación, presento un ejercicio resuelto paso a paso de forma manual, enfocándonos en el método de mínimos cuadrados. 1. El Problema Queremos predecir el rendimiento académico ( ) basándonos en dos variables: Horas de estudio ( X1cap X sub 1 ) y Horas de sueño ( X2cap X sub 2 ). Estudiante X1cap X sub 1 X2cap X sub 2 2. El Modelo Matemático La ecuación que buscamos es: regresión lineal múltiple (RLM) te permite predecir una
Ŷ=β0+β1X1+β2X2cap Y hat equals beta sub 0 plus beta sub 1 cap X sub 1 plus beta sub 2 cap X sub 2
Para resolver esto a mano de forma eficiente, utilizamos la notación matricial:
B=(XTX)-1XTYbold cap B equals open paren cap X to the cap T-th power cap X close paren to the negative 1 power cap X to the cap T-th power cap Y 3. Paso a Paso A. Definir las matrices Añadimos una columna de "1s" a la matriz para representar la intersección ( β0beta sub 0
X=(147125168),Y=(869)cap X equals the 3 by 3 matrix; Row 1: 1, 4, 7; Row 2: 1, 2, 5; Row 3: 1, 6, 8 end-matrix; comma space cap Y equals the 3 by 1 column matrix; 8, 6, 9 end-matrix; B. Calcular la Transpuesta de XTcap X to the cap T-th power
XT=(111426758)cap X to the cap T-th power equals the 3 by 3 matrix; Row 1: 1, 1, 1; Row 2: 4, 2, 6; Row 3: 7, 5, 8 end-matrix; C. Calcular el producto XTXcap X to the cap T-th power cap X Multiplicamos filas por columnas:
XTX=(312201256862086138)cap X to the cap T-th power cap X equals the 3 by 3 matrix; Row 1: 3, 12, 20; Row 2: 12, 56, 86; Row 3: 20, 86, 138 end-matrix; D. Calcular el producto XTYcap X to the cap T-th power cap Y
XTY=(1(8)+1(6)+1(9)4(8)+2(6)+6(9)7(8)+5(6)+8(9))=(2398158)cap X to the cap T-th power cap Y equals the 3 by 1 column matrix; Row 1: 1 open paren 8 close paren plus 1 open paren 6 close paren plus 1 open paren 9 close paren, Row 2: 4 open paren 8 close paren plus 2 open paren 6 close paren plus 6 open paren 9 close paren, Row 3: 7 open paren 8 close paren plus 5 open paren 6 close paren plus 8 open paren 9 close paren end-matrix; equals the 3 by 1 column matrix; 23, 98, 158 end-matrix; E. Invertir la matriz y resolver
Este es el paso más laborioso a mano (usualmente mediante Gauss-Jordan o cofactores). Tras realizar los cálculos, obtenemos los coeficientes (Punto de partida) (Impacto del estudio) (Impacto del sueño) Ecuación final: 4. Interpretación
: Si el estudiante no estudia ni duerme nada, su nota base sería 2.5.
: Por cada hora extra de estudio (manteniendo el sueño constante), la nota sube 0.7 puntos. : Por cada hora extra de sueño, la nota sube 0.4 puntos.
¿Te gustaría que profundicemos en el cálculo de la matriz inversa por el método de Gauss-Jordan o prefieres pasar a la interpretación del coeficiente de determinación ( R2cap R squared )?
Problema:
Un investigador quiere predecir el rendimiento académico (Y = puntaje en examen, 0-100) basado en horas de estudio (X₁) y número de horas de sueño (X₂). Datos (n=5):
| Obs | Y | X₁ | X₂ | |----|----|----|----| | 1 | 75 | 4 | 6 | | 2 | 80 | 5 | 7 | | 3 | 65 | 3 | 5 | | 4 | 90 | 6 | 8 | | 5 | 70 | 4 | 6 |
Encuentre la ecuación de regresión: Ŷ = b₀ + b₁ X₁ + b₂ X₂.
Imagina un mini-conjunto de datos para ver la estructura:
| Y | $X_1$ | $X_2$ | $X_1^2$ | $X_2^2$ | $X_1X_2$ | $X_1Y$ | $X_2Y$ | |---|---|---|---|---|---|---|---| | 10 | 2 | 5 | 4 | 25 | 10 | 20 | 50 | | 20 | 4 | 8 | 16 | 64 | 32 | 80 | 160 | | $\sum$| ... | ... | ... | ... | ... | ... | ... |
Para una regresión con k variables independientes: Llenas las sumas ($\sum$)
Y_i = β_0 + β_1 X_1i + β_2 X_2i + ... + β_k X_ki + ε_i
Donde:
Objetivo: Encontrar b₀, b₁, b₂ (estimadores de β) que minimicen la suma de cuadrados de los residuos:
SCR = Σ (Y_i - Ŷ_i)^2
donde Ŷ_i = b₀ + b₁ X₁ + b₂ X₂.
[ \begincases 375 = 5b_0 + 20b_1 + 32b_2 \quad (1) \ 1550 = 20b_0 + 90b_1 + 123b_2 \quad (2) \ 2375 = 32b_0 + 123b_1 + 210b_2 \quad (3) \endcases ]
det=15, entonces:
A^-1 = (1/15) * [89 25 -28
25 50 -35
-28 -35 26]
Numéricamente:
A^-1 = [5.9333 1.6667 -1.8667
1.6667 3.3333 -2.3333
-1.8667 -2.3333 1.7333]
Resolver regresión lineal múltiple a mano es un ejercicio que:
Para ejercicios resueltos a mano, recomiendo:
Dominar estos cálculos manuales le dará una base sólida para interpretar cualquier salida de regresión múltiple en el futuro.
¿Listo para practicar? Intente con sus propios datos pequeños y siga estos pasos. ¡La paciencia es clave!
Problema: Se tienen datos de 5 empresas. Se quiere explicar las ventas anuales ((Y), en miles de euros) en función del gasto en publicidad en TV ((X_1), en cientos de euros) y el gasto en publicidad en redes sociales ((X_2), en decenas de euros).
| Empresa | (Y) (Ventas) | (X_1) (TV) | (X_2) (RRSS) | |---------|----------------|---------------|----------------| | 1 | 23 | 2 | 3 | | 2 | 26 | 3 | 4 | | 3 | 30 | 5 | 5 | | 4 | 34 | 6 | 6 | | 5 | 37 | 8 | 7 |
Objetivo: Encontrar (\hatY = \hat\beta_0 + \hat\beta_1 X_1 + \hat\beta_2 X_2)
The normal equations for ( Y = b_0 + b_1 X_1 + b_2 X_2 ):
[ \begincases n b_0 + b_1 \sum X_1 + b_2 \sum X_2 = \sum Y \ b_0 \sum X_1 + b_1 \sum X_1^2 + b_2 \sum X_1 X_2 = \sum X_1 Y \ b_0 \sum X_2 + b_1 \sum X_1 X_2 + b_2 \sum X_2^2 = \sum X_2 Y \endcases ]
Substitute:
(1) ( 5 b_0 + 20 b_1 + 36 b_2 = 375 )
(2) ( 20 b_0 + 90 b_1 + 149 b_2 = 1550 )
(3) ( 36 b_0 + 149 b_1 + 262 b_2 = 2725 )