Presentación

Actuaría (plan 2015) 2021-1

Optativas, Seminario de Estadística I

Grupo 9267, 60 lugares. 3 alumnos.

Introducción al Aprendizaje Estadístico

Profesor	Rafael Miranda Cordero	lu mi vi	7 a 8
Ayudante		ma ju	7 a 8

.¿Que es el aprendizaje estadístico?

El aprendizajes estadístico se refiere a un conjunto de herramientas empleadas para modelar y entender conjuntos de datos complejos. Esta es un área de la estadística relativamente reciente y tiene sus principales aplicaciones en machine learning y big data.

Objetivo. El seminario pretende asentar los fundamentos teóricos de los distintos modelos usados en el aprendizaje estadísticos y a su vez llevar estos a su ejecución práctica mediante ejemplos empleando R programming a través de bases de datos involucradas en la solución de diversos problemas referentes a distintas áreas.

Al finalizar el curso el alumno será capaz de:

Entender que es el aprendizaje estadístico y que tipo de problemas puede ayudar a solucionar.
Entender la diferencia entre un problema de inferencia y uno de predicción.
Saber diferenciar entre un problema de aprendizaje supervisado y de aprendizaje no supervisado, así como tener el conocimiento para poder resolver cualquiera de ellos.
Entender y ser capaces de resolver problemas de regresión y de clasificación.
Entender como los conceptos de ajuste, sego-varianza y predictibilidad-interpretabilidad afectan la implementación de un modelo.
Ser capaces de realizar análisis exploratorios de los datos y a partir de estos decidir los posibles modelos que pueden ser empleados para la solución del problema en cuestión.
Ser capaces de elegir el mejor de modelo dentro de una colección de modelos que solucionan un mismo problema.

Dinámica de la Clase.

Las clases serán síncronas en los horarios establecidos por la facultad. Para este fin utilizaremos la plataforma ZOOM.
Las clases serán grabadas y subidas a la página web del curso para que de considerarlo necesario puedan consultarlas posteriormente.
Todo el material de la clase (notas, presentaciones, scripts, tareas, etc.) les será proporcionado mediante la página web del curso y google classroom.
Se dejaran tareas cortas regularmente (aproximadamente cada 2 semanas siendo a lo más 8), quizes (examenes cortos en linea principalemente conceptuales) y algunas lecturas a casa.

Evaluación.

Se dejaran 1 o 2 proyectos (dependiendo el avance que se tenga en el curso) en los cuales se abordará la solución de un problema real utilizando las técnicas vistas en el seminario. Este o estos representarán la mayor parte de la calificación de acuerdo a la siguiente ponderación.

Proyectos-50%
Tareas-40%
Quizes-10%

Contacto.

Si requieres mayor información o tienes alguna duda puedes contactarme a través de mi correo institucional raf.mir.cor@ciencias.unam.mx.

Temario y bibliografía.

Puedes consultar el temario y la bibliografía completos aquí o en la página web del curso.

1. Introducción

¿Qué es el aprendizaje estadístico?
El Trade-Off entre Exactitud de Predicción e Interpretabilidad del Modelos
Aprendizaje Supervisado y no Supervisado
Problemas de Regresión y de Clasificación
Evaluación del Modelo

2. Métodos Lineales de Regresión y Clasificación

Regresión Lineal Simple
Regresión Lineal Múltiple
Comparación de la Regresión Lineal con K vecinos
Regresión Logística
Regresión Logística Múltiple
Análisis de Discriminantes (LDA y QDA)

3. Métodos de Remuestreo

Validación Cruzada
Bootstrap

4. Selección y Regularización en Modelos Lineales

Forward y Backward Stepwise Selection
Ridge Regression
Lasso
Métodos de Reducción de Dimensión (Componentes Principales).

5. Expansión en Bases y Regularización

Regresión Polinomial
Regresión con Spline
Regresión Local
Modelos Aditivos Generalizados

6. Métodos Basados en Árboles

Árboles de Regresión
Árboles de Clasificación
Bagging
Bosques Aleatorios
Boosting

7. Máquinas de Soporte Vectorial

Clasificador del Margen Máximo
Clasificadores de Soporte Vectorial
Máquinas de Soporte Vectorial (SVM)
Función de Estimación y Núcleos Reproductores
Regresión y SVM

8. Redes Neuronales

Projection Pursuit Regression
Ajustando Redes Neuronales
Algunas Cuestiones del Entrenamiento de Redes Neuronales

9. Aprendizaje No Supervisado

Análisis de Componentes Principales
Clustering

La información aquí presente la puedes consultar también en la página web del curso (https://sites.google.com/a/ciencias.unam.mx/probabilidad-i-9028/).

Ciencias en:

Facebook

Twitter

Youtube

Hecho en México, todos los derechos reservados 2011-2016. Esta página puede ser reproducida con fines no lucrativos, siempre y cuando no se mutile, se cite la fuente completa y su dirección electrónica. De otra forma requiere permiso previo por escrito de la Institución.

Sitio web administrado por la Coordinación de los Servicios de Cómputo de la Facultad de Ciencias. ¿Dudas?, ¿comentarios?. Escribenos. Aviso de privacidad.

Comunidad

Licenciatura

Docencia

Investigación

Posgrado

Extensión

Servicios

Nosotros

Eventos

Actuaría (plan 2015) 2021-1

Optativas, Seminario de Estadística I