class: front <!--- Para correr en ATOM - open terminal, abrir R (simplemente, R y enter) - rmarkdown::render('static/docpres/07_interacciones/7interacciones.Rmd', 'xaringan::moon_reader') About macros.js: permite escalar las imágenes como [scale 50%](path to image), hay si que grabar ese archivo js en el directorio. ---> .pull-left[ # R para el análisis de datos ## **Kevin Carrasco** ## Sociología - UAH ## 1er Sem 2024 ## [.green[R-data-analisis.netlify.com]](https://R-data-analisis.netlify.com) ] .pull-right[ .right[ <br> ## .yellow[Sesión 8: Regresión lineal y valores predichos] ![:scale 70%](../../files/img/eval-hires.png) ] ] --- class: inverse, bottom, right # .red[Sesión 8] <br> .yellow[Repaso sesión anterior] Valores predichos <br> <br> <br> <br> --- layout: true class: animated, fadeIn --- # Asociación: covarianza / correlación .pull-left[ _¿Se relaciona la variación de una variable, con la variación de otra variable?_ ] .pull-right[ .center[![:scale 100%](../../files/img/ingresoeduc.png)] ] --- .pull-left[* Pero ojo, **correlación no implica causalidad**] .pull-right[![:scale 100%](../../files/img/causalidad.png)] --- ## ¿Qué es la regresión lineal? -- * Es un modelo estadístico que se usa para: - **Conocer**: La relación de una variable dependiente de acuerdo a una/otras independiente(s) - **Predecir**: Estimar el valor de una variable dependiente de acuerdo al valor de otras - **Inferir**: si estas relaciones son estadísticamente significativas --- ## ¿Qué es la regresión lineal? * Dos tipos de regresión: - Regresión lineal simple (una variable independiente) - Regresión lineal múltiple (más de una variable independiente) --- .pull-left-narrow[ ### Ejemplo ] .pull-right-wide[ ``` ## Educacion Ingreso ## 1 1 250 ## 2 2 200 ## 3 3 250 ## 4 4 300 ## 5 5 400 ## 6 6 350 ## 7 7 400 ## 8 8 350 ``` ] --- .pull-left-narrow[ ### Ejemplo ] .pull-right-wide[ ![](08-clase8_files/figure-html/unnamed-chunk-4-1.png)<!-- --> ] --- .pull-left-narrow[ ### Ejemplo ] .pull-right-wide[ ![](08-clase8_files/figure-html/unnamed-chunk-5-1.png)<!-- --> ] --- .pull-left-narrow[ ### La recta de regresión] .pull-right-wide[ `$$\widehat{Y}=b_{0} +b_{1}X$$` Donde - `\(\widehat{Y}\)` es el valor estimado de `\(Y\)` - `\(b_{0}\)` es el intercepto de la recta (el valor de Y cuando X es 0) - `\(b_{1}\)` es el coeficiente de regresión, que nos dice cuánto aumenta Y por cada punto que aumenta X ] --- # Estimación de los coeficientes de la ecuación: `$$b_{1}=\frac{Cov(XY)}{VarX}$$` `$$b_{1}=\frac{\frac{\sum_{i=1}^{n}(x_i - \bar{x})(y_i - \bar{y})} {n-1}}{\frac{\sum_{i=1}^{n}(x_i - \bar{x})(x_i - \bar{x})} {n-1}}$$` Y simplificando `$$b_{1}=\frac{\sum_{i=1}^{n}(x_i - \bar{x})(y_i - \bar{y})} {\sum_{i=1}^{n}(x_i - \bar{x})(x_i - \bar{x})}$$` --- ### Pero este es un curso de R, así que: ``` ## ## Call: ## lm(formula = Ingreso ~ Educacion, data = data) ## ## Coefficients: ## (Intercept) Educacion ## 200 25 ``` --- ### Estimación de los coeficientes de la ecuación: `$$\bar{Y}=b_{0}+b_{1}\bar{X}$$` Reemplazando: `$$\bar{Y}=b_{0}+25\bar{X}$$` Despejando el valor de `\(b_{0}\)` `$$b_{0}=200-0\bar{X}$$` --- .pull-left-narrow[ ### Ejemplo *Por cada unidad que aumenta educación, ingreso aumenta en 25 unidades* ] .pull-right-wide[ ![](08-clase8_files/figure-html/unnamed-chunk-7-1.png)<!-- --> ] --- ## Varianza explicada - ¿Qué porcentaje de la varianza de Y logramos explicar con X? -- * .red[R2] = Porcentaje de la variación de Y puede ser asociado a la variación de X --- .pull-left-narrow[ ### Ejemplo El ajuste del modelo a los datos se relaciona con la proporción de residuos generados por el modelo respecto de la varianza total de Y (R2) ] .pull-right-wide[ ![](08-clase8_files/figure-html/unnamed-chunk-8-1.png)<!-- --> ] --- ## Inferencia estadística * ¿Cómo sabemos si `\(b_{1}\)` es estadísticamente significativo? -- * ¿Nuestros datos se pueden extrapolar a la población? --- ## Inferencia estadística - Según criterios muestrales: * Distribución normal * Desviación estándar - Error estándar --- <table class="texreg" style="margin: 10px auto;border-collapse: collapse;border-spacing: 0px;caption-side: bottom;color: #000000;border-top: 2px solid #000000;"> <thead> <tr> <th style="padding-left: 5px;padding-right: 5px;"> </th> <th style="padding-left: 5px;padding-right: 5px;">Model 1</th> </tr> </thead> <tbody> <tr style="border-top: 1px solid #000000;"> <td style="padding-left: 5px;padding-right: 5px;">(Intercept)</td> <td style="padding-left: 5px;padding-right: 5px;">200.00<sup>**</sup></td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">(35.57)</td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;">Educacion</td> <td style="padding-left: 5px;padding-right: 5px;">25.00<sup>*</sup></td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">(7.04)</td> </tr> <tr style="border-top: 1px solid #000000;"> <td style="padding-left: 5px;padding-right: 5px;">R<sup>2</sup></td> <td style="padding-left: 5px;padding-right: 5px;">0.68</td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;">Adj. R<sup>2</sup></td> <td style="padding-left: 5px;padding-right: 5px;">0.62</td> </tr> <tr style="border-bottom: 2px solid #000000;"> <td style="padding-left: 5px;padding-right: 5px;">Num. obs.</td> <td style="padding-left: 5px;padding-right: 5px;">8</td> </tr> </tbody> <tfoot> <tr> <td style="font-size: 0.8em;" colspan="2"><sup>***</sup>p < 0.001; <sup>**</sup>p < 0.01; <sup>*</sup>p < 0.05</td> </tr> </tfoot> </table> --- <table class="texreg" style="margin: 10px auto;border-collapse: collapse;border-spacing: 0px;caption-side: bottom;color: #000000;border-top: 2px solid #000000;"> <thead> <tr> <th style="padding-left: 5px;padding-right: 5px;"> </th> <th style="padding-left: 5px;padding-right: 5px;">Model 1</th> </tr> </thead> <tbody> <tr style="border-top: 1px solid #000000;"> <td style="padding-left: 5px;padding-right: 5px;">(Intercept)</td> <td style="padding-left: 5px;padding-right: 5px;">106.12<sup>*</sup></td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">(33.92)</td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;">Educacion</td> <td style="padding-left: 5px;padding-right: 5px;">7.07</td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">(6.57)</td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;">edad</td> <td style="padding-left: 5px;padding-right: 5px;">5.48<sup>*</sup></td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">(1.56)</td> </tr> <tr style="border-top: 1px solid #000000;"> <td style="padding-left: 5px;padding-right: 5px;">R<sup>2</sup></td> <td style="padding-left: 5px;padding-right: 5px;">0.91</td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;">Adj. R<sup>2</sup></td> <td style="padding-left: 5px;padding-right: 5px;">0.87</td> </tr> <tr style="border-bottom: 2px solid #000000;"> <td style="padding-left: 5px;padding-right: 5px;">Num. obs.</td> <td style="padding-left: 5px;padding-right: 5px;">8</td> </tr> </tbody> <tfoot> <tr> <td style="font-size: 0.8em;" colspan="2"><sup>***</sup>p < 0.001; <sup>**</sup>p < 0.01; <sup>*</sup>p < 0.05</td> </tr> </tfoot> </table> --- ## Parcialización .center[![:scale 50%](../../files/img/ingresoeducexp.png)] --- ¿y la interpretación para variables categóricas? .pull-left[ .small[ <table class="texreg" style="margin: 10px auto;border-collapse: collapse;border-spacing: 0px;caption-side: bottom;color: #000000;border-top: 2px solid #000000;"> <thead> <tr> <th style="padding-left: 5px;padding-right: 5px;"> </th> <th style="padding-left: 5px;padding-right: 5px;">Model 1</th> </tr> </thead> <tbody> <tr style="border-top: 1px solid #000000;"> <td style="padding-left: 5px;padding-right: 5px;">Intercepto</td> <td style="padding-left: 5px;padding-right: 5px;">233.33<sup>***</sup></td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">(23.57)</td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;">Educación media</td> <td style="padding-left: 5px;padding-right: 5px;">116.67<sup>*</sup></td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">(37.27)</td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;">Educación superior</td> <td style="padding-left: 5px;padding-right: 5px;">133.33<sup>*</sup></td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">(33.33)</td> </tr> <tr style="border-top: 1px solid #000000;"> <td style="padding-left: 5px;padding-right: 5px;">R<sup>2</sup></td> <td style="padding-left: 5px;padding-right: 5px;">0.78</td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;">Adj. R<sup>2</sup></td> <td style="padding-left: 5px;padding-right: 5px;">0.70</td> </tr> <tr style="border-bottom: 2px solid #000000;"> <td style="padding-left: 5px;padding-right: 5px;">Num. obs.</td> <td style="padding-left: 5px;padding-right: 5px;">8</td> </tr> </tbody> <tfoot> <tr> <td style="font-size: 0.8em;" colspan="2"><sup>***</sup>p < 0.001; <sup>**</sup>p < 0.01; <sup>*</sup>p < 0.05</td> </tr> </tfoot> </table> ] ] -- .pull-right[ *Las personas que tienen educación media ganan $116mil más en comparación con quienes tienen educación básica, efecto que es estadísticamente significativo (p<0.01)* ] --- class: inverse, bottom, right # .red[Sesión 7] <br> Repaso sesión anterior .yellow[Valores predichos] <br> <br> <br> <br> --- ¿Cómo podemos predecir el valor esperado de una variable para una persona en particular? .pull-left-narrow[ .small[ <table class="texreg" style="margin: 10px auto;border-collapse: collapse;border-spacing: 0px;caption-side: bottom;color: #000000;border-top: 2px solid #000000;"> <thead> <tr> <th style="padding-left: 5px;padding-right: 5px;"> </th> <th style="padding-left: 5px;padding-right: 5px;">Model 1</th> </tr> </thead> <tbody> <tr style="border-top: 1px solid #000000;"> <td style="padding-left: 5px;padding-right: 5px;">Intercepto</td> <td style="padding-left: 5px;padding-right: 5px;">233.33<sup>***</sup></td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">(23.57)</td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;">Educación media</td> <td style="padding-left: 5px;padding-right: 5px;">116.67<sup>*</sup></td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">(37.27)</td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;">Educación superior</td> <td style="padding-left: 5px;padding-right: 5px;">133.33<sup>*</sup></td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">(33.33)</td> </tr> <tr style="border-top: 1px solid #000000;"> <td style="padding-left: 5px;padding-right: 5px;">R<sup>2</sup></td> <td style="padding-left: 5px;padding-right: 5px;">0.78</td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;">Adj. R<sup>2</sup></td> <td style="padding-left: 5px;padding-right: 5px;">0.70</td> </tr> <tr style="border-bottom: 2px solid #000000;"> <td style="padding-left: 5px;padding-right: 5px;">Num. obs.</td> <td style="padding-left: 5px;padding-right: 5px;">8</td> </tr> </tbody> <tfoot> <tr> <td style="font-size: 0.8em;" colspan="2"><sup>***</sup>p < 0.001; <sup>**</sup>p < 0.01; <sup>*</sup>p < 0.05</td> </tr> </tfoot> </table> ] ] .pull-right-wide[ `$$\bar{Y}=b_{0}+b_{1}\bar{X}$$` Reemplazando: `$$\bar{Y}=233+b_{1}\bar{X}$$` ¿Si una persona tuviera un nivel de educación superior? `$$\bar{Y}=233+133$$` `$$\bar{Y}=366$$` ] --- ## Graficando ![](08-clase8_files/figure-html/unnamed-chunk-15-1.png)<!-- --> --- ## Variables numéricas <table class="texreg" style="margin: 10px auto;border-collapse: collapse;border-spacing: 0px;caption-side: bottom;color: #000000;border-top: 2px solid #000000;"> <thead> <tr> <th style="padding-left: 5px;padding-right: 5px;"> </th> <th style="padding-left: 5px;padding-right: 5px;">Model 1</th> </tr> </thead> <tbody> <tr style="border-top: 1px solid #000000;"> <td style="padding-left: 5px;padding-right: 5px;">(Intercept)</td> <td style="padding-left: 5px;padding-right: 5px;">96.44<sup>*</sup></td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">(33.14)</td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;">edad</td> <td style="padding-left: 5px;padding-right: 5px;">6.78<sup>***</sup></td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">(0.99)</td> </tr> <tr style="border-top: 1px solid #000000;"> <td style="padding-left: 5px;padding-right: 5px;">R<sup>2</sup></td> <td style="padding-left: 5px;padding-right: 5px;">0.89</td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;">Adj. R<sup>2</sup></td> <td style="padding-left: 5px;padding-right: 5px;">0.87</td> </tr> <tr style="border-bottom: 2px solid #000000;"> <td style="padding-left: 5px;padding-right: 5px;">Num. obs.</td> <td style="padding-left: 5px;padding-right: 5px;">8</td> </tr> </tbody> <tfoot> <tr> <td style="font-size: 0.8em;" colspan="2"><sup>***</sup>p < 0.001; <sup>**</sup>p < 0.01; <sup>*</sup>p < 0.05</td> </tr> </tfoot> </table> --- .pull-left[ ![](08-clase8_files/figure-html/unnamed-chunk-17-1.png)<!-- --> ] .pull-right[ `$$\bar{Y}=b_{0}+b_{1}\bar{X}$$` Reemplazando: `$$\bar{Y}=96.44+b_{1}*6,78$$` ¿Una persona de edad 40? `$$\bar{Y}=96,44+40*6,78$$` `$$\bar{Y}=367.64$$` ] --- class: front .pull-left[ # R para el análisis de datos ## **Kevin Carrasco** ## Sociología - UAH ## 1er Sem 2024 ## [.green[R-data-analisis.netlify.com]](https://R-data-analisis.netlify.com) ] .pull-right[ .right[ <br> ## .yellow[Sesión 6: Índices y escalas] ![:scale 70%](../../files/img/eval-hires.png) ] ]