#> Educacion Ingreso
#> 1 1 250
#> 2 2 200
#> 3 3 250
#> 4 4 300
#> 5 5 400
#> 6 6 350
#> 7 7 400
#> 8 8 350

Sesión 8: Regresión lineal
Regresión lineal
R2
Inferencia
Valores predichos
Regresión lineal
R2
Inferencia
Valores predichos
¿Se relaciona la variación de una variable, con la variación de otra variable?

¿En qué rango varía una correlación?


Se usa para:

#> Educacion Ingreso
#> 1 1 250
#> 2 2 200
#> 3 3 250
#> 4 4 300
#> 5 5 400
#> 6 6 350
#> 7 7 400
#> 8 8 350
\[\widehat{Y}=b_{0} +b_{1}X\]
Donde
\(\widehat{Y}\) es el valor estimado de \(Y\)
\(b_{0}\) es el intercepto de la recta (el valor de Y cuando X es 0)
\(b_{1}\) es el coeficiente de regresión, que nos dice cuánto aumenta Y por cada punto que aumenta X
\[b_{1}=\frac{Cov(XY)}{VarX}\]
\[b_{1}=\frac{\frac{\sum_{i=1}^{n}(x_i - \bar{x})(y_i - \bar{y})} {n-1}}{\frac{\sum_{i=1}^{n}(x_i - \bar{x})(x_i - \bar{x})} {n-1}}\]
Y simplificando
\[b_{1}=\frac{\sum_{i=1}^{n}(x_i - \bar{x})(y_i - \bar{y})} {\sum_{i=1}^{n}(x_i - \bar{x})(x_i - \bar{x})}\]
#>
#> Call:
#> lm(formula = Ingreso ~ Educacion, data = data)
#>
#> Coefficients:
#> (Intercept) Educacion
#> 200 25
\[\bar{Y}=b_{0}+b_{1}\bar{X}\] Reemplazando:
\[\bar{Y}=b_{0}+25\bar{X}\]
Despejando el valor de \(b_{0}\)
\[b_{0}=200-0\bar{X}\]
Por cada unidad que aumenta educación, ingreso aumenta en 25 unidades


Regresión lineal
R2
Inferencia
Valores predichos
El ajuste del modelo a los datos se relaciona con la proporción de residuos generados por el modelo respecto de la varianza total de Y (R2)


Repaso sesión anterior
Regresión lineal
R2
Inferencia
Valores predichos
| Model 1 | |
|---|---|
| (Intercept) | 200.00** |
| (35.57) | |
| Educacion | 25.00* |
| (7.04) | |
| R2 | 0.68 |
| Adj. R2 | 0.62 |
| Num. obs. | 8 |
| ***p < 0.001; **p < 0.01; *p < 0.05 | |
| Model 1 | |
|---|---|
| (Intercept) | 106.12* |
| (33.92) | |
| Educacion | 7.07 |
| (6.57) | |
| edad | 5.48* |
| (1.56) | |
| R2 | 0.91 |
| Adj. R2 | 0.87 |
| Num. obs. | 8 |
| ***p < 0.001; **p < 0.01; *p < 0.05 | |

| Model 1 | |
|---|---|
| Intercepto | 233.33*** |
| (23.57) | |
| Educación media | 116.67* |
| (37.27) | |
| Educación superior | 133.33* |
| (33.33) | |
| R2 | 0.78 |
| Adj. R2 | 0.70 |
| Num. obs. | 8 |
| ***p < 0.001; **p < 0.01; *p < 0.05 | |
Las personas que tienen educación media ganan $116mil más en comparación con quienes tienen educación básica, efecto que es estadísticamente significativo (p<0.01)
Repaso sesión anterior
Regresión lineal
R2
Inferencia
Valores predichos
| Model 1 | |
|---|---|
| Intercepto | 233.33*** |
| (23.57) | |
| Educación media | 116.67* |
| (37.27) | |
| Educación superior | 133.33* |
| (33.33) | |
| R2 | 0.78 |
| Adj. R2 | 0.70 |
| Num. obs. | 8 |
| ***p < 0.001; **p < 0.01; *p < 0.05 | |
\[\bar{Y}=b_{0}+b_{1}\bar{X}\]
Reemplazando:
\[\bar{Y}=233+b_{1}\bar{X}\]
¿Si una persona tuviera un nivel de educación superior?
\[\bar{Y}=233+133\] \[\bar{Y}=366\]
| Model 1 | |
|---|---|
| (Intercept) | 96.44* |
| (33.14) | |
| edad | 6.78*** |
| (0.99) | |
| R2 | 0.89 |
| Adj. R2 | 0.87 |
| Num. obs. | 8 |
| ***p < 0.001; **p < 0.01; *p < 0.05 | |

\[\bar{Y}=b_{0}+b_{1}\bar{X}\]
Reemplazando:
\[\bar{Y}=96.44+b_{1}*6,78\]
¿Una persona de edad 40?
\[\bar{Y}=96,44+40*6,78\] \[\bar{Y}=367.64\]

Sesión 8: Regresión lineal
![]()