Encabezado Facultad de Ciencias
Presentación

Biología (plan 1997) 2024-1

Optativas, Temas Selectos de Biología I

Grupo 5272, 25 lugares. 18 alumnos.
Manejo de datos y estadística univariada con R
Profesor Luis Miguel Burciaga Cifuentes ma 8 a 11 B008
Profesor Abraham Aldair Alvarez Galicia ju 8 a 11 Sala de Cómputo II
 

Manejo de datos y estadística univariada con R

Profesor: Luis Miguel Burciaga Cifuentes cifuentes.luismiguel@ciencias.unam.mx

Profesor: Abraham Aldair Alvarez Galicia aldair_alvarez@ciencias.unam.mx

Bienvenidos a todos los alumnos a esta nueva materia optativa

Nuestro propósito como profesores es que los alumnos adquieran los conocimientos teórico-prácticos esenciales para el uso de R como herramienta para el análisis de datos.

Nos enfocaremos para que ustedes logren los siguientes objetivos:

  • Comprender el lenguaje de programación de R.
  • Reconocer la interfase de R y conocer las ventajas y desventajas de su uso en el manejo y análisis de datos respecto a otros programas estadísticos.
  • Repasar conceptos básicos de estadística que le permitan un correcto análisis de datos.
  • Conocer las herramientas visuales que ofrece R y generar gráficos y figuras de la más alta calidad.
  • Seleccionar, ejecutare interpretar pruebas estadísticas que se adecuen a distintos tipos de datos.

Evaluación

  • Proyecto semestral

40%

  • Prácticas y tareas

40%

  • Asistencia y participación

20%

Escala de evaluaciones

0 - 5.9 --> NA

6.0 - 6.5 --> 6

6.6 – 7.4 --> 7

7.5 – 8.3 --> 8

8.4 – 9.2 --> 9

9.3 – 10 --> 10

Forma de trabajo

  • Se utilizará Classroom para subir materiales y enviar tareas y prácticas asignadas.
  • Todas la prácticas y tareas asignadas serán evaluados individualmente y no se recibirán después de la fecha de entrega.
  • No se realizarán exámenes parciales durante el semestre, por lo tanto, no habrá derecho a reposiciones.
  • Se realizarán prácticas para la obtención de datos en el laboratorio de Ecofisiología Animal y el espacio escultórico.
  • El proyecto semestral tendrá tres revisiones parciales por escrito, así como una revisión final y una presentación oral.

Recursos y plataformas requeridos

  • Google Classroom
  • Excel, R y RStudio

Temario

I. Introducción a R y R-Studio

I.1. ¿Qué es R y para qué sirve?

I.2. Instalación de R y R-Studio

I.3. Interfaz (script, consola y ambiente)

I.4. R-Markdown

I.5. Instalación de librerías

I.6. Tipos de objetos (variables, vectores, matrices, bases de datos)

I.7. Funciones básicas (operadores, funciones, argumentos)

I.8. Importación de datos

I.9. Paquete “dplyr” para el manejo eficiente de bases de datos

II. Conceptos básicos de estadística

II.1. Concepto de estadística (muestreo, parámetros y estadísticos)

II.2. Estadística exploratoria, descriptiva e inferencial

II.3. Medidas de tendencia central (media, mediana y moda)

II.4. Medidas de dispersión (rango, varianza, desviación estándar)

II.5. Distribuciones de probabilidad

II.6. Estimación de parámetros por intervalos de confianza

II.7. Nivel de significancia y tipos de error (I y II)

III. Visualización de datos con la paquetería “ggplot2”

III.1. Importancia de la visualización de los datos

III.2. Exploración rápida de los datos con “ggplot2”

  • Gráficos de dispersión
  • Gráfico de cajas y bigotes
  • Gráfico de barras
  • Histogramas

III.3. Estética de los gráficos (visualización de grupos por colores y/o por tipografía)

III.4. Generación de dos o más graficas en una ventana (anidación de gráficos)

III.5. Diseño (anotaciones, escalas, ejes, leyendas, colores y temas)

IV. Pruebas de hipótesis

IV.1. Hipótesis nula y alternativa

IV.2. Prueba de hipótesis de una muestra

IV.3. Prueba de hipótesis de dos muestras independientes

IV.4. Prueba de hipótesis de dos muestras pareadas

IV.5. Pruebas equivalentes para datos no paramétricos

V. Análisis de varianza (ANOVA) de un factor

V.1. Conceptos (factores, niveles y tratamientos)

V.2. Uso del ANOVA para el contraste de hipótesis

V.3. Pruebas de comparación múltiple (post-hoc)

V.4. ANOVA robusto para muestras con datos influyentes

V.5. Verificación de supuestos

V.6. Pruebas equivalentes para datos no paramétricos

VI. Análisis de correlación y regresión lineal simple

VI.1. Uso del análisis de correlación

VI.2. Coeficiente de correlación de Pearson (r)

VI.3. Coeficientes de correlación por rangos ordenados de Spearman y Kendall

VI.4. Uso de la regresión lineal simple

VI.5. La ecuación de una recta (concepto de pendiente y ordenada al origen)

VI.6. Estimación de la pendiente y la ordenada al origen por mínimos cuadrados

VI.7. Coeficiente de determinación (r2)

VI.8. Verificación de supuestos

VI.9. Regresión lineal robusta para muestras con datos influyentes

Bibliografía recomendada

  • Crawley, M. J. (2014). Statistics: an introduction using R. John Wiley & Sons.
  • Sokal, R. R., & Rohlf, F. J. (1987). Biostatistics. Francise & Co, New York.
  • Venables, W. N., Smith, D. M., & R Development Core Team. (2009). An introduction to R.
  • Winter, B. (2019). Statistics for linguists: An introduction using R. Routledge.
  • Xia, Y., Sun, J., & Chen, D. G. (2018). Introduction to R, RStudio and ggplot2. In Statistical Analysis of Microbiome Data with R (pp. 77-127). Springer, Singapore.
  • Zuur, A. F., Ieno, E. N., Walker, N. J., Saveliev, A. A., & Smith, G. M. (2009). Mixed effects models and extensions in ecology with R (Vol. 574). New York: Springer

 


Hecho en México, todos los derechos reservados 2011-2016. Esta página puede ser reproducida con fines no lucrativos, siempre y cuando no se mutile, se cite la fuente completa y su dirección electrónica. De otra forma requiere permiso previo por escrito de la Institución.
Sitio web administrado por la Coordinación de los Servicios de Cómputo de la Facultad de Ciencias. ¿Dudas?, ¿comentarios?. Escribenos. Aviso de privacidad.