Profesor | Luis Miguel Burciaga Cifuentes | ma | 8 a 11 | B008 |
Profesor | Abraham Aldair Alvarez Galicia | ju | 8 a 11 | Sala de Cómputo II |
Manejo de datos y estadística univariada con R
Profesor: Luis Miguel Burciaga Cifuentes cifuentes.luismiguel@ciencias.unam.mx
Profesor: Abraham Aldair Alvarez Galicia aldair_alvarez@ciencias.unam.mx
Bienvenidos a todos los alumnos a esta nueva materia optativa
Nuestro propósito como profesores es que los alumnos adquieran los conocimientos teórico-prácticos esenciales para el uso de R como herramienta para el análisis de datos.
Nos enfocaremos para que ustedes logren los siguientes objetivos:
Evaluación
|
40% |
|
40% |
|
20% |
Escala de evaluaciones
0 - 5.9 --> NA
6.0 - 6.5 --> 6
6.6 – 7.4 --> 7
7.5 – 8.3 --> 8
8.4 – 9.2 --> 9
9.3 – 10 --> 10
Forma de trabajo
Recursos y plataformas requeridos
Temario
I. Introducción a R y R-Studio
I.1. ¿Qué es R y para qué sirve?
I.2. Instalación de R y R-Studio
I.3. Interfaz (script, consola y ambiente)
I.4. R-Markdown
I.5. Instalación de librerías
I.6. Tipos de objetos (variables, vectores, matrices, bases de datos)
I.7. Funciones básicas (operadores, funciones, argumentos)
I.8. Importación de datos
I.9. Paquete “dplyr” para el manejo eficiente de bases de datos
II. Conceptos básicos de estadística
II.1. Concepto de estadística (muestreo, parámetros y estadísticos)
II.2. Estadística exploratoria, descriptiva e inferencial
II.3. Medidas de tendencia central (media, mediana y moda)
II.4. Medidas de dispersión (rango, varianza, desviación estándar)
II.5. Distribuciones de probabilidad
II.6. Estimación de parámetros por intervalos de confianza
II.7. Nivel de significancia y tipos de error (I y II)
III. Visualización de datos con la paquetería “ggplot2”
III.1. Importancia de la visualización de los datos
III.2. Exploración rápida de los datos con “ggplot2”
III.3. Estética de los gráficos (visualización de grupos por colores y/o por tipografía)
III.4. Generación de dos o más graficas en una ventana (anidación de gráficos)
III.5. Diseño (anotaciones, escalas, ejes, leyendas, colores y temas)
IV. Pruebas de hipótesis
IV.1. Hipótesis nula y alternativa
IV.2. Prueba de hipótesis de una muestra
IV.3. Prueba de hipótesis de dos muestras independientes
IV.4. Prueba de hipótesis de dos muestras pareadas
IV.5. Pruebas equivalentes para datos no paramétricos
V. Análisis de varianza (ANOVA) de un factor
V.1. Conceptos (factores, niveles y tratamientos)
V.2. Uso del ANOVA para el contraste de hipótesis
V.3. Pruebas de comparación múltiple (post-hoc)
V.4. ANOVA robusto para muestras con datos influyentes
V.5. Verificación de supuestos
V.6. Pruebas equivalentes para datos no paramétricos
VI. Análisis de correlación y regresión lineal simple
VI.1. Uso del análisis de correlación
VI.2. Coeficiente de correlación de Pearson (r)
VI.3. Coeficientes de correlación por rangos ordenados de Spearman y Kendall
VI.4. Uso de la regresión lineal simple
VI.5. La ecuación de una recta (concepto de pendiente y ordenada al origen)
VI.6. Estimación de la pendiente y la ordenada al origen por mínimos cuadrados
VI.7. Coeficiente de determinación (r2)
VI.8. Verificación de supuestos
VI.9. Regresión lineal robusta para muestras con datos influyentes
Bibliografía recomendada