class: front <!--- Para correr en ATOM - open terminal, abrir R (simplemente, R y enter) - rmarkdown::render('static/docpres/07_interacciones/7interacciones.Rmd', 'xaringan::moon_reader') About macros.js: permite escalar las imágenes como [scale 50%](path to image), hay si que grabar ese archivo js en el directorio. ---> .pull-left[ # R para el análisis de datos ## **Kevin Carrasco** ## Sociología - UAH ## 1er Sem 2024 ## [.green[R-data-analisis.netlify.com]](https://R-data-analisis.netlify.com) ] .pull-right[ .right[ <br> ## .yellow[Sesión 5: Asociación de variables] ![:scale 70%](../../files/img/eval-hires.png) ] ] --- class: inverse, bottom, right # .red[Sesión 5] <br> .yellow[Repaso sesión anterior] Asociación entre variables <br> <br> <br> <br> --- layout: true class: animated, fadeIn --- ## Datos * Los datos miden al menos una *característica* de a los menos una *unidad* en a lo menos *un punto en el tiempo* -- + Ejemplo: La esperanza de vida en Chile el 2017 fue de 79,9 años - Característica (variable) : esperanza de vida - Unidad: Años - Punto en el tiempo: 2017 --- ## Base de Datos * Forma "rectangular" de almacenamiento de datos: .center[![:scale 60%](../../files/img/ObservacionesyVariables.png)] --- ## Base de Datos - cada .blue[fila] representa una unidad o caso (ej: un entrevistad_) - cada .orange[columna] una variable (ej: edad) - cada .purple[variable] posee valores numéricos - los valores numéricos pueden estar asociados a una etiqueta (ej: 1=Mujer) --- ## Ejemplos de estudios / bases de datos 1. [Encuesta Centro de Estudios Públicos](https://www.cepchile.cl/cep/site/edic/base/port/encuestacep.html) 2. [Encuesta CASEN](http://observatorio.ministeriodesarrollosocial.gob.cl/casen-multidimensional/casen/casen_2017.php) 3. [Encuesta Lapop](https://www.vanderbilt.edu/lapop-espanol/) 4. [ELSOC](https://coes.cl/encuesta-panel/) --- ## Variables - Una variable representa cualquier cosa o propiedad que varia y a la cuál se le asigna un valor. Es decir: - `\(Variable \neq Constante\)` - Pueden ser visibles o no visibles/latentes. (Ej: peso / inteligencia) --- ## Variables - discretas (Rango finito de valores): - Dicotómicas - Politómicas - continuas: - Rango (teóricamente) infinito de valores. --- ## Escalas de medición de variables - NOIR: Nominal, Ordinal, Intervalar, Razón .small[ | Tipo | Características | Propiedad de números | Ejemplo| |------------ |----------------------------------------------|--------------- |----------- | | *Nominal* | Uso de números en lugar de palabras | Identidad | Nacionalidad | | *Ordinal* | Números se usan para ordenar series | + ranking | Nivel educacional | | *Intervalar* | Intervalos iguales entre números | + igualdad | Temperatura | | *Razón* | Cero real | + aditividad | Distancia | ] --- ## Tipos de datos en relación a escalas de medición. * **Datos categóricos**: - pueden ser medidos sólo mediante escalas nominales, u ordinales en caso de orden de rango * **Datos continuos**: - Medidos en escalas intervalares o de razón - Pueden ser transformados a datos categóricos --- ## Descriptivos según tipo de variable <br> .small[ | | Categórica | Continua | Categ.(y)/Categ.(x) | Cont.(y)/Categ.(x) | |------------- |--------------------------------- |------------------------- |------------------------------------------------ |------------------------------------------ | | **Ejemplo** | **Estatus Ocupacional** | **Ingreso** | **Estatus Ocupacional (Y) / Género (X)** | **Ingreso (Y) / Género (X)** | | Tabla | Frecuencias / porcentajes | `\(\bar{X}\)`/sd ... o recodificar en categorías | Tabla de Contingencia | Clasificar Y | | Gráfico | Barras | Histograma / boxplot | Gráfico de barras condicionado | Histograma, box plot condicionado | ] --- ## Tipos de análisis estadístico bivariado - Variable dependiente (y) : lo que quiero explicar - Variable independiente (x): lo que me permite explicar la dependiente .small[ | Variable independiente x | Variable dependiente Categórica | Variable dependiente Continua | |-------------------------- |----------------------------------- |-------------------------------------- | | Categórica | Análisis de tabla de Contigencia, Chi2 | Análisis de Varianza ANOVA, Prueba T | | Continua | Regresión Logística | Correlación / Regresión Lineal | ] --- class: inverse, bottom, right # .red[Sesión 5] <br> Repaso sesión anterior .yellow[Asociación entre variables] <br> <br> <br> <br> --- class: inverse, center <br> ## ¿Cómo puedo saber si una variable se encuentra asociada a otra variable? -- ### Si ambas varían de manera **similar** (covarían) --- # Asociación: covarianza / correlación .pull-left[ _¿Se relaciona la variación de una variable, con la variación de otra variable?_ ] .pull-right[ .center[![:scale 100%](../../files/img/ingresoeduc.png)] ] --- # Correlación - Medida de co-variación lineal estandarizada -- <br> <br> .center[¿En qué rango varía una correlación?] -- - Varía entre -1 y +1 --- ## Correlación - Da cuenta de: - *Intesidad*: mientras más cercana a |1|, más intensa - *Sentido*: positiva o negativa -- - Gráficamente se expresa en *nubes de puntos* --- .center[![:scale 80%](../../files/img/correlacion2.png)] --- <br> <br> <br> <br> ## Adivina la correlación - [http://guessthecorrelation.com/](guessthecorrelation.com) --- class: inverse # RESUMEN - Datos y variables - Introducción correlación --- class: front .pull-left[ # R para el análisis de datos ## **Kevin Carrasco** ## Sociología - UAH ## 1er Sem 2024 ## [.green[R-data-analisis.netlify.com]](https://R-data-analisis.netlify.com) ] .pull-right[ .right[ <br> ## .yellow[Sesión 5: Asociación de variables] ![:scale 70%](../../files/img/eval-hires.png) ] ]