Actuaría (plan 2015) 2021-1
Optativas, Seminario de Estadística I
Grupo 9267, 60 lugares. 3 alumnos.
Introducción al Aprendizaje Estadístico
.¿Que es el aprendizaje estadístico?
El aprendizajes estadístico se refiere a un conjunto de herramientas empleadas para modelar y entender conjuntos de datos complejos. Esta es un área de la estadística relativamente reciente y tiene sus principales aplicaciones en machine learning y big data.
.
Objetivo. El seminario pretende asentar los fundamentos teóricos de los distintos modelos usados en el aprendizaje estadísticos y a su vez llevar estos a su ejecución práctica mediante ejemplos empleando R programming a través de bases de datos involucradas en la solución de diversos problemas referentes a distintas áreas.
.
Al finalizar el curso el alumno será capaz de:
-
Entender que es el aprendizaje estadístico y que tipo de problemas puede ayudar a solucionar.
-
Entender la diferencia entre un problema de inferencia y uno de predicción.
-
Saber diferenciar entre un problema de aprendizaje supervisado y de aprendizaje no supervisado, así como tener el conocimiento para poder resolver cualquiera de ellos.
-
Entender y ser capaces de resolver problemas de regresión y de clasificación.
-
Entender como los conceptos de ajuste, sego-varianza y predictibilidad-interpretabilidad afectan la implementación de un modelo.
-
Ser capaces de realizar análisis exploratorios de los datos y a partir de estos decidir los posibles modelos que pueden ser empleados para la solución del problema en cuestión.
-
Ser capaces de elegir el mejor de modelo dentro de una colección de modelos que solucionan un mismo problema.
.
Dinámica de la Clase.
-
Las clases serán síncronas en los horarios establecidos por la facultad. Para este fin utilizaremos la plataforma ZOOM.
-
Las clases serán grabadas y subidas a la página web del curso para que de considerarlo necesario puedan consultarlas posteriormente.
-
Todo el material de la clase (notas, presentaciones, scripts, tareas, etc.) les será proporcionado mediante la página web del curso y google classroom.
-
Se dejaran tareas cortas regularmente (aproximadamente cada 2 semanas siendo a lo más 8), quizes (examenes cortos en linea principalemente conceptuales) y algunas lecturas a casa.
Evaluación.
Se dejaran 1 o 2 proyectos (dependiendo el avance que se tenga en el curso) en los cuales se abordará la solución de un problema real utilizando las técnicas vistas en el seminario. Este o estos representarán la mayor parte de la calificación de acuerdo a la siguiente ponderación.
-
Proyectos-50%
-
Tareas-40%
-
Quizes-10%
Contacto.
Si requieres mayor información o tienes alguna duda puedes contactarme a través de mi correo institucional raf.mir.cor@ciencias.unam.mx.
Temario y bibliografía.
.
1. Introducción
-
¿Qué es el aprendizaje estadístico?
-
El Trade-Off entre Exactitud de Predicción e Interpretabilidad del Modelos
-
Aprendizaje Supervisado y no Supervisado
-
Problemas de Regresión y de Clasificación
-
Evaluación del Modelo
2. Métodos Lineales de Regresión y Clasificación
-
Regresión Lineal Simple
-
Regresión Lineal Múltiple
-
Comparación de la Regresión Lineal con K vecinos
-
Regresión Logística
-
Regresión Logística Múltiple
-
Análisis de Discriminantes (LDA y QDA)
3. Métodos de Remuestreo
-
Validación Cruzada
-
Bootstrap
4. Selección y Regularización en Modelos Lineales
-
Forward y Backward Stepwise Selection
-
Ridge Regression
-
Lasso
-
Métodos de Reducción de Dimensión (Componentes Principales).
5. Expansión en Bases y Regularización
-
Regresión Polinomial
-
Regresión con Spline
-
Regresión Local
-
Modelos Aditivos Generalizados
6. Métodos Basados en Árboles
-
Árboles de Regresión
-
Árboles de Clasificación
-
Bagging
-
Bosques Aleatorios
-
Boosting
7. Máquinas de Soporte Vectorial
-
Clasificador del Margen Máximo
-
Clasificadores de Soporte Vectorial
-
Máquinas de Soporte Vectorial (SVM)
-
Función de Estimación y Núcleos Reproductores
-
Regresión y SVM
8. Redes Neuronales
-
Projection Pursuit Regression
-
Ajustando Redes Neuronales
-
Algunas Cuestiones del Entrenamiento de Redes Neuronales
9. Aprendizaje No Supervisado
-
Análisis de Componentes Principales
-
Clustering
.