Prontuario del curso: Métodos para desarrollar modelos de regresión estadística

Objetivo general

Desarrollar una comprensión sólida de los algoritmos estadísticos aplicados al análisis de regresión, mediante la enseñanza de métodos para el desarrollo, evaluación y selección de modelos estadísticos, con un enfoque particular en variables respuesta continuas. Además, se implementarán ejemplos prácticos en el entorno de R, proporcionando una base teórica que pueda ser aplicada en cualquier paquete estadístico.

Requisito del curso

  1. Instalar el paquete estadístico R y el entorno de desarrollo integrado (IDE) RStudio en su computadora antes del inicio del curso para garantizar una experiencia fluida.

Contenido del curso

Módulo 1: Introducción a los algoritmos estadísticos y el análisis de regresión

  • Conceptos fundamentales de los algoritmos estadísticos
  • Introducción al análisis de regresión lineal: fundamentos y aplicaciones

Módulo 2: Regresión lineal simple

  • Desarrollo y aplicación de modelos de regresión lineal simple
  • Evaluación de los supuestos del modelo lineal
    • Verificación y validación de los supuestos fundamentales
  • Evaluación de la calidad de la línea de regresión
    • Técnicas para medir la precisión y ajuste del modelo
  • Análisis de correlación
    • Estudio de la relación entre variables

Módulo 3: Análisis de varianza (ANOVA) y calidad del modelo

  • Métodos para evaluar la varianza y su significado en modelos de regresión
  • Estrategias para mejorar la calidad de la línea de regresión

Módulo 4: Regresión múltiple y evaluación de modelos

  • Desarrollo y evaluación de modelos con múltiples variables predictoras
  • Interpretación de resultados de un modelo de regresión lineal
  • Técnicas de validación y diagnóstico del modelo

Módulo 5: Extensiones del modelo lineal

  • No linealidad en los modelos de regresión
  • Confusión en modelos estadísticos
  • Heterogeneidad de la medida de efecto (interacción)

Módulo 6: Selección y optimización de modelos

  • Compensación entre sesgo y varianza
  • Métodos de remuestreo para validación y mejora de modelos
  • Estrategias y criterios para la selección del modelo más adecuado

Módulo 7: Modelos no lineales y transformación de variables

  • Introducción y aplicación de modelos de regresión no lineales
  • Métodos para transformar variables continuas y mejorar el ajuste del modelo

Referencias

  • Dalgaard, P. (2008). Introductory Statistics with R (Second ed.). Springer. 10.1007/978-0-387-79054-1

  • Harrell, F. E. (2001). Regression modeling strategies: with applications to linear models, logistic regression, and survival analysis (Vol. 608). New York: springer.

  • James, G., Witten, D., Hastie, T., & Tibshirani, R. (2023, June 21). An Introduction to Statistical Learning. Trevor Hastie. https://www.statlearning.com/

  • Kleinbaum, D. G., Kupper, L. L., Nizam, A., & Rosenberg, E. S. (2013). Applied Regression Analysis and Other Multivariable Methods (D. G. Kleinbaum, L. L. Kupper, A. Nizam, & E. S. Rosenberg, Eds.; 5th ed.). Cengage Learning.

  • Kuhn, M., & Johnson, K. (2019). Feature engineering and selection: A practical approach for predictive models. CRC Press.

  • Porta, M. S., Greenland, S., Hernán, M., Silva, I. d. S., & Last, J. M. (Eds.). (2014). A Dictionary of Epidemiology (6th ed.). Oxford University Press. 10.1093/acref/9780199976720.001.0001

  • R Core Team, R. (2013). R: A language and environment for statistical computing. https://apps.dtic.mil/sti/citations/AD1039033

  • Rosner, B. (2016). Fundamentals of Biostatistics (8th ed.). Cengage Learning. https://www.cengage.com/c/fundamentals-of-biostatistics-8e-rosner/9781305268920/