Encabezado Facultad de Ciencias
Presentación

Actuaría (plan 2006) 2019-1

Optativas, Seminario de Aplicaciones Actuariales

Grupo 9301, 35 lugares. 4 alumnos.
Estadística Computacional y Machine Learning
Profesor Jimmy Hernández Morales lu mi vi 20 a 21 104 (Nuevo Edificio)
Ayudante Rodrigo Quijón Hipólito ma ju 20 a 21 104 (Nuevo Edificio)
 

Temario de Estadística Computacional y Machine Learning

El curso pretende ser una introducción a lo que actualmente se conoce como Machine Learning, que son un conjunto de técnicas estadísticas que junto con el desarrollo de algoritmos computacionales ha tenido gran auge en los últimos años. Todos los temas serán estudiados desde el punto de vista estadístico formal, pero haciendo mucho énfasis en la implementación computacional. Los lenguajes principales que usaremos serán Python o Java y como auxiliar R. Las bibliotecas esenciales que usaremos son Matplotlib, Scipy, Numpy, Pandas, Scikit-Learn y MLlib. Se cali ficará mediante tareas, proyectos y dependiendo del tamaño del grupo exposiciones. El repositorio del curso es:
https://github.com/jimmyhm/ML-FCiencias

Temas

1. Regresión Lineal y Logística
1.1 Regresión Lineal Simple
1.2 Regresión Múltiple
1.3 Selección de Modelos
1.3.1 Criterios AIC, BIC y divergencia de Kullback-Leibler
1.4 Regresión Logística
2. Aprendizaje Supervisado(Clasifi cación)
2.1 Clasi cadores Lineales y Gausianos.
2.2 Regresión Lineal y Logística
2.3 Discriminante Lineal(LDA)
2.3 Naive Bayes
2.4 Maquinas soporte vectorial
2.5 Kernelización
2.6 Ejemplos, caso de estudio: redes neuronales.
3. Modelos Aditivos, Arboles y Boosting
3.1 Modelos aditivos Generalizados.
3.2 Arboles de regresión
3.3 Arboles de clasi ficación
3.4 Métodos boosting
3.5 Ajuste boosting y modelos aditivos.
3.5 Arboles boosting
4. Aprendizaje no Supervisado(Clustering)
4.1 Reglas de asociación
4.2 Análisis de Clúster
4.3 Componentes principales.
5. Estadística de Altas Dimensiones y Big Data
5.1 Algoritmos de optimización
5.1.1 Gradiente descendiente
5.1.1 Coordenadas descendientes
5.2 Regresión Contraída
5.2.1 Regresión Lasso
5.2.1 Regresión Ridge
5.3 Correlación Espuria
5.4 Endogeneidad incidental
5.4.1 GMM
5.4.2 FGMM
5.5 Acumulación de ruido
5.6 Introducción al framework Apache Hadoop

Bibliografía

[1] Hastie, T., Tibshirani, R., Friedman, J The Elements of Statistical Learning. Data Mining, Inference, and Prediction, 2nd ed., Springer.
[2] G. James, D. Witten, T. Hastie and R. Tibshirani An Introduction to Statistical Learning, with Application in R Springer, 2013.
[3] Diggle, P Statistical Learning with Sparsity. The lasso and generalizations. Chapman and Hall.
[4] T. W. Anderson An Introduction to Multivariate Statistical Analysis, John Wiley and Sons Inc; Edición: 3rd Edition .
[5] Michie, Spiegelhalter y Taylor y Petrick J. Heagarty , Machine Learning, Neural and Statistical Classi cation.
[6] Alan Agresti , Categorical Data Analysis, Wiley-Interscience Publication.
[7] Andreas Muller, Sarah Guido, Introduction to Machine Learning with Python, a guide for data Scientist Springer.

 


Hecho en México, todos los derechos reservados 2011-2016. Esta página puede ser reproducida con fines no lucrativos, siempre y cuando no se mutile, se cite la fuente completa y su dirección electrónica. De otra forma requiere permiso previo por escrito de la Institución.
Sitio web administrado por la Coordinación de los Servicios de Cómputo de la Facultad de Ciencias. ¿Dudas?, ¿comentarios?. Escribenos. Aviso de privacidad.