Encabezado Facultad de Ciencias
Presentación

Actuaría (plan 2015) 2020-2

Optativas, Seminario de Estadística I

Grupo 9319, 46 lugares. 12 alumnos.
Herramientas estadísticas para ciencia de datos
Profesor Sofía Villers Gómez lu mi vi 11 a 12 304 (Yelizcalli)
Ayudante David Alberto Mateos Montes de Oca ma ju 11 a 12 304 (Yelizcalli)
 

Requisitos

Haber cursado y aprobado Inferencia estadística (Estadística I) y Modelos no Paramétricos y de Regresión (Estadística II).

Evaluación

• 50% tareas, prácticas y exámenes. (Las tareas y prácticas pequeñas para entregar la siguiente clase. A lo largo del curso habrá entre 4-5 de cada una)

• 30% Proyecto (evaluación escrita)

• 20% Presentación del proyecto (evaluación oral)

Temario

Revisión de conocimientos básicos de R

• Elementos Básicos de R: Consola, Script, Librerías y CRAN.

• Manipulación y Creación de Objetos

• Lectura y exportación de archivos, csv, txt, etc.

• Gráficas: Histogramas, Pie Charts, Dispersión, Box Plot. - Introducción a la librería “ggplot2”.

• Funciones Estadísticas y Simulación de Densidades.

Programación avanzada en R

• Creación de funciones

• Visualización de datos

• Documentos ejecutivos

• Dashboards

Regresión Lineal y Logística

• Regresión lineal simple

• Regresión lineal múltiple

• Regresión Logística

• Modelos lineales generalizados

• Selección de Modelos Criterios AIC, BIC y divergencia de Kullback-Leibler

Estadística no paramétrica y técnicas de calibración

• Estadísticos muestrales

• Curvas CAP y ROC

• Information Value

• Matriz de confusión

• Boostrap

• Validación cruzada

Modelos avanzados de regresión

• Regresión polinomial

• Redes Neuronales

• Regresión de Soporte Vectorial

• Arboles de regresión

• Random Forest

Modelos de clasificación

• K-Medias

• Clusterización jerárquica

• Arboles de clasificación

• Random Forest

• Máquinas de Soporte Vectorial

Bibliografía

• The Art of R Programming. no starch press, 1a edición. N. Matloff.

• Machine Learning: The Art and Science of Algorithms that Make Sense of Data. Cambridge, 1a edición. P. Flatch.

• An Introduction to Statistical Learning with applications in R. Springer, 1a edición. G. James, D. Witten, T. Hastie and R. Tibshirani.

• The Elements of Statistical Learning. Data Mining, Inference, and Prediction, 2nd ed., Springer. T. Hastie, R. Tibshirani, J. Friedman.

• Statistical Learning with Sparsity. The lasso and generalizations. Chapman and Hall, T. Hastie, R. Tibshirani, M. Wainwright.

• Machine Learning, Neural and Statistical Classification. D. Michie, D.J. Spiegelhalter, C.C. Taylor.

• Applied Multivariate Statistical Analysis. Wiley, 6ta edición. R. Johnson y D. Wichern.

• An Introduction to Applied Multivariate Analysis with R. Springer, 1a edición. B. Everitt y T. Horton.

 


Hecho en México, todos los derechos reservados 2011-2016. Esta página puede ser reproducida con fines no lucrativos, siempre y cuando no se mutile, se cite la fuente completa y su dirección electrónica. De otra forma requiere permiso previo por escrito de la Institución.
Sitio web administrado por la Coordinación de los Servicios de Cómputo de la Facultad de Ciencias. ¿Dudas?, ¿comentarios?. Escribenos. Aviso de privacidad.