R para el análisis de datos


Kevin Carrasco

Sociología - UAH

1er Sem 2026

R-data-analisis.netlify.com

Presentación

Este curso

  • Unidad 1: Elementos y herramientas de R

  • Unidad 2: Operacionalización y análisis descriptivo de datos

  • Unidad 3: Análisis estadístico inferencial en R

  • Unidad 4: Regresión lineal y regresión logística

Evaluación

  • Para presentarse a examen se requiere una nota promedio igual o superior a 3,5 y un 70% de asistencia al curso. Esta regla solo podrá alterarse en caso de inasistencias por causas serias y justificadas de acuerdo con el criterio de la carrera.

  • 4 trabajos (15% c/u). En parejas

  • Presentación final de investigación (10%)

  • Examen Final (30%)

  • Foco en reproducibilidad, reporte, visualización y análisis de resultados.

Sitio web del curso

R-data-analisis.netlify.app

  • Ventajas: Todo en un mismo lugar, permite combinar texto y código, reproducible, gratis, acceso abierto, etc.

Sitio web

Ciencia abierta

Investigación reproducible

Reproducibilidad

  • Es la posibilidad de regenerar de manera independiente los resultados usando los materiales originales de una investigación ya publicada.

  • En términos simples: obtener los mismos resultados de una investigación utilizando los mismos datos.

¿Qué porcentaje de los estudios publicados son reproducibles?

Alrededor de un 40%! dependiendo de la disciplina

¿Hay crisis de reproducibilidad?

¿y en la práctica cómo afecta la reproducibilidad?

Breznau, et. al, (2023) coordinó una investigación con 161 investigadores de 73 equipos de investigación.

Los equipos informaron tanto hallazgos numéricos como conclusiones sustanciales muy diversas

Flujos de investigación reproducible

  • Texto plano
  • Carpetas y archivos
  • Autocontenido
  • Abierto

Ejemplo con procesador de texto tradicional

Ejemplo con procesador de texto tradicional

Algunas limitaciones

  • Barrera de pago/licencia para acceder a contenidos (propiedad)

  • Difícil versionamiento y llevar registro de quién hizo qué cambio, barrera a la reproducibilidad y colaboración

  • No permite un documento enteramente reproducible que combine texto y código de análisis (en caso de utilizarlo)

Propuesta: escritura libre y abierta

Introducción a R y RStudio

Así se ve Rstudio

fuente: Guía de campo de R

¿Por qué usar R?

  • Gratis: No es necesario pagar licencias

  • Multiplataforma (Windows, Mac-OS, Linux): Los códigos de análisis pueden ser usados en distintas plataformas

  • Investigación reproducible: Permite documentar los resultados obtenidos paso a paso, mostrando el flujo completo de procesamiento de los datos por medio de scripts

  • Integración con otros softwares

Documentos en Quarto

¿Qué es markdown?

  • Forma de escritura simple con pocas marcas de formato

  • Conversión a distintos formatos de salida (html, pdf)

  • Soporta encabezados, tablas, imágenes, tablas de contenidos, ecuaciones, links…

  • Filosofía: foco en contenido primero, el formato después.

¿Qué es Quarto?

  • Quarto es un sistema moderno de creación de documentos dinámicos, informes, presentaciones, libros, sitios web y más, a partir de archivos de texto plano y por medio del conversor universal de documentos Pandoc.

  • Evolución de los sistemas de autoría como Jupyter, R Markdown, todo dentro del mismo documento.

Características Principales

  • Multiplataforma

  • Basado en Markdown

  • Soporte para múltiples lenguajes

  • Multitud de formatos de salida

  • Soporte para publicación científica

  • Integración entornos de desarrollo (RStudio, VSC, etc)

  • Extensible

Características principales

  • Lenguaje que combina código (R) y texto (Markdown): Al igual que RMarkdown (.Rmd), Quarto permite combinar texto plano markdown y código de análisis R.

  • Provee una serie de herramientas para generar documentos dinámicos y publicarlos

Estructura de un documento

  • Archivo .qmd

  • Encabezado YAML:

    title: "Mi documento"
    author: "Kevin Carrasco"
    date: today
    format: html
  • Cuerpo:

    • Markdown para secciones, énfasis, listas, etc.
    • Bloques de código
    • Bibliografía

Ejemplo

---
title: "Tutorial Quarto"
author: "Kevin Carrasco"
date: "2026-03-10"
format: html
lang: es
---

# Bienvenidos a este tutorial de **Quarto**.

Quarto está especialmente diseñado para elaborar documentos
científicos y técnicos reproducibles

Base de escritura: Markdown

  • Encabezados: #, ##, ###
  • Listas:
    • Viñetas: - o *
    • Numeradas: 1., 2.
  • Énfasis: *cursiva*, **negrita**
  • Código en línea: `código`
  • Enlaces: [texto](url)

Ejemplo

---
title: "Tutorial Quarto"
author: "Kevin Carrasco"
date: "2026-03-10"
format: html
lang: es
---

# Bienvenidos a este tutorial de **Quarto**.

Quarto está especialmente diseñado para elaborar documentos
científicos y técnicos reproducibles

## Este es un subtítulo

Ahora vamos a ensayar **negritas** y _cursivas_

### Y un título de tercer orden

Y una lista

- con viñetas
- ...
- ...

Y otra numerada:

1. punto 1
2. punto 2
3. ...

## Links e imágenes

[Este es un link a Github](https://github.com/)  

![Imagen online](https://upload.wikimedia.org/wikipedia/commons/thumb/3/33/Gutenberg.jpg/330px-Gutenberg.jpg)

Personalización visual del HTML

  • Temas: cosmo, flatly, lux, darkly, etc.

  • Opciones comunes en YAML:

    toc: true
    number-sections: true
    code-fold: true
  • Personalización con CSS externo:

    css: estilos.css

Ejemplo

---
title: "Tutorial Quarto"
author: "Kevin Carrasco"
date: "2026-03-10"
format: html
lang: es
toc: true
number-sections: true
theme: darkly
css: estilos.css
---

# Bienvenidos a este tutorial de **Quarto**.

Quarto está especialmente diseñado para elaborar documentos
científicos y técnicos reproducibles

## Este es un subtítulo

Ahora vamos a ensayar **negritas** y _cursivas_

### Y un título de tercer orden

Y una lista

- con viñetas
- ...
- ...

Y otra numerada:

1. punto 1
2. punto 2
3. ...

Extensiones

  • Integración con R
  • Referencias bibliográficas
  • Renderizado a pdf, word
  • Sitios web
  • Presentaciones

Recursos

Así se ve Quarto en Rstudio

Así se ve Quarto renderizado

Protocolo de flujo de investigación reproducible

Alternativas

A. ad-hoc

  • cada investigador define numero de archivos, nombres, carpetas y organización

  • explicar al resto cómo se organiza

  • documentar en un archivo cómo se organiza

  • –> reproducibilidad y transparencia LIMITADA

B. Protocolo reproducible

  • estructura de carpetas y archivos interconectados que refieren a reglas conocidas (estándares)

  • autocontenido: toda la información necesaria para la reproducibilidad se encuentra en la carpeta raíz o directorio de trabajo.

Propuesta: Protocolo IPO

Estructura IPO

Mayores detalles y plantilla de carpetas:

Carpeta autocontenida

  • proyecto autocontenido: reproducible sin necesidad de archivos externos

  • requisito: establecer directorio de trabajo

    • posición de referencia de todas las operaciones al interior del proyecto

    • también llamado directorio raíz

Directorio de trabajo

  • ej. forma tradicional en hoja de código R:

    • setwd(ruta-a-carpeta-de-proyecto)

    • problemas: hace referencia a ruta local en el computador donde se está trabajando, por lo tanto no es reproducible y se debe evitar

  • alternativa sugerida en R: RStudio Projects

RStudio Projects

  • La funcionalidad Projects de RStudio permite establecer claramente un directorio de trabajo de manera eficiente

  • Para ello, genera un archivo de extensión .Rproj en el directorio raiz de la carpeta del proyecto

  • Luego se facilita acceder a la carpeta del proyecto en RStudio ejecutando desde el administrador de archivos del computador (file manager) el archivo .Rproj

  • para comprobar, ejecutar getwd() y debería dar la ruta hacia la carpeta del proyecto

Repositorios y apertura

La escritura en texto simple (como Markdown o Quarto) permite implementar un sistema de control de versiones, además de herramientas de respaldo, colaboración y comunicación

El origen: Abriendo un sistema operativo

  • Linus Torvalds, 1991 (21 años)

  • Crea sistema operativo libre (Linux) y lo abre a la colaboración. Postea:

    • “I’m doing a (free) operating system (just a hobby, won’t be big and professional…”
  • TED talk

Git

  • es una especie de memoria o registro local que guarda información sobre:

    • quién hizo un cambio
    • cuándo lo hizo
    • qué hizo
  • mantiene la información de todos los cambios en la historia de la carpeta / repositorio local

  • se puede sincronizar con un repositorio remoto (ej. Github)

Git/github

  • actualmente, Git / Github posee más de 100 millones de repositorios

  • mayor fuente de código en el mundo

  • ha transitado desde el mundo de desarrollo de software hacia distintos ámbitos de trabajo colaborativo y abierto

  • entorno de trabajo que favorece la ciencia abierta

Git no es un registro de versiones de archivos específicos, sino de una carpeta completa

Guarda “fotos” de momentos específicos de la carpeta, y esta foto se saca mediante un commit

Commits

  • El commit es el procedimiento fundamental del control de versiones

  • Git no registra cualquier cambio que se “guarda”, sino los que se “comprometen” (commit).

  • En un commit

    • se seleccionan los archivos cuyo cambio se desea registrar (stage)
    • se registra lo que se está comprometiendo en el cambio (mensaje de commit)

¿Cuándo hacer un commit?

  • según conveniencia

  • sugerencias:

    • que sea un momento que requiera registro (momento de foto)

    • no para cambios menores

    • no esperar muchos cambios distintos que puedan hacer perder el sentido del commit

Uso de inteligencia artificial en el curso

Inteligencia artificial

  • Se puede usar inteligencia artificial para generar código, pero es importante revisar y entender el código generado, ya que puede contener errores o no ser óptimo.

  • Se recomienda usar inteligencia artificial como una herramienta de apoyo, pero no como un sustituto del aprendizaje y la comprensión de los conceptos fundamentales de R y el análisis de datos.

  • Se pueden usar herramientas como ChatGPT, pero es importante ser crítico con las respuestas generadas y verificar su precisión.

Ejemplo de uso de inteligencia artificial

  • Ingresa a la aplicación o web de IA generativa de tu preferencia (ej. ChatGPT, Gemini, Claude, Grok, etc.)

  • Utiliza el siguiente prompt:

    • Completa la siguiente frase y entrega un solo resultado: Un hombre utilizó…
  • y luego…

    • Completa la siguiente frase y entrega un solo resultado: Una mujer se vistió de…

Taller práctico

https://r-data-analisis.netlify.app/practicos/01-content

R para el análisis de datos


Kevin Carrasco

Sociología - UAH

1er Sem 2026

R-data-analisis.netlify.com