Encabezado Facultad de Ciencias
Presentación

Actuaría (plan 2015) 2021-1

Optativas, Seminario de Estadística I

Grupo 9267, 60 lugares. 3 alumnos.
Introducción al Aprendizaje Estadístico
Profesor Rafael Miranda Cordero lu mi vi 7 a 8
Ayudante ma ju 7 a 8
 


.¿Que es el aprendizaje estadístico?

El aprendizajes estadístico se refiere a un conjunto de herramientas empleadas para modelar y entender conjuntos de datos complejos. Esta es un área de la estadística relativamente reciente y tiene sus principales aplicaciones en machine learning y big data.

.

Objetivo. El seminario pretende asentar los fundamentos teóricos de los distintos modelos usados en el aprendizaje estadísticos y a su vez llevar estos a su ejecución práctica mediante ejemplos empleando R programming a través de bases de datos involucradas en la solución de diversos problemas referentes a distintas áreas.

.

Al finalizar el curso el alumno será capaz de:
  • Entender que es el aprendizaje estadístico y que tipo de problemas puede ayudar a solucionar.
  • Entender la diferencia entre un problema de inferencia y uno de predicción.
  • Saber diferenciar entre un problema de aprendizaje supervisado y de aprendizaje no supervisado, así como tener el conocimiento para poder resolver cualquiera de ellos.
  • Entender y ser capaces de resolver problemas de regresión y de clasificación.
  • Entender como los conceptos de ajuste, sego-varianza y predictibilidad-interpretabilidad afectan la implementación de un modelo.
  • Ser capaces de realizar análisis exploratorios de los datos y a partir de estos decidir los posibles modelos que pueden ser empleados para la solución del problema en cuestión.
  • Ser capaces de elegir el mejor de modelo dentro de una colección de modelos que solucionan un mismo problema.

.

Dinámica de la Clase.
  • Las clases serán síncronas en los horarios establecidos por la facultad. Para este fin utilizaremos la plataforma ZOOM.
  • Las clases serán grabadas y subidas a la página web del curso para que de considerarlo necesario puedan consultarlas posteriormente.
  • Todo el material de la clase (notas, presentaciones, scripts, tareas, etc.) les será proporcionado mediante la página web del curso y google classroom.
  • Se dejaran tareas cortas regularmente (aproximadamente cada 2 semanas siendo a lo más 8), quizes (examenes cortos en linea principalemente conceptuales) y algunas lecturas a casa.
Evaluación.
Se dejaran 1 o 2 proyectos (dependiendo el avance que se tenga en el curso) en los cuales se abordará la solución de un problema real utilizando las técnicas vistas en el seminario. Este o estos representarán la mayor parte de la calificación de acuerdo a la siguiente ponderación.
  • Proyectos-50%
  • Tareas-40%
  • Quizes-10%
Contacto.
Si requieres mayor información o tienes alguna duda puedes contactarme a través de mi correo institucional raf.mir.cor@ciencias.unam.mx.

Temario y bibliografía.

Puedes consultar el temario y la bibliografía completos aquí o en la página web del curso.

.

1. Introducción

  • ¿Qué es el aprendizaje estadístico?
  • El Trade-Off entre Exactitud de Predicción e Interpretabilidad del Modelos
  • Aprendizaje Supervisado y no Supervisado
  • Problemas de Regresión y de Clasificación
  • Evaluación del Modelo

2. Métodos Lineales de Regresión y Clasificación

  • Regresión Lineal Simple
  • Regresión Lineal Múltiple
  • Comparación de la Regresión Lineal con K vecinos
  • Regresión Logística
  • Regresión Logística Múltiple
  • Análisis de Discriminantes (LDA y QDA)

3. Métodos de Remuestreo

  • Validación Cruzada
  • Bootstrap

4. Selección y Regularización en Modelos Lineales

  • Forward y Backward Stepwise Selection
  • Ridge Regression
  • Lasso
  • Métodos de Reducción de Dimensión (Componentes Principales).

5. Expansión en Bases y Regularización

  • Regresión Polinomial
  • Regresión con Spline
  • Regresión Local
  • Modelos Aditivos Generalizados

6. Métodos Basados en Árboles

  • Árboles de Regresión
  • Árboles de Clasificación
  • Bagging
  • Bosques Aleatorios
  • Boosting

7. Máquinas de Soporte Vectorial

  • Clasificador del Margen Máximo
  • Clasificadores de Soporte Vectorial
  • Máquinas de Soporte Vectorial (SVM)
  • Función de Estimación y Núcleos Reproductores
  • Regresión y SVM

8. Redes Neuronales

  • Projection Pursuit Regression
  • Ajustando Redes Neuronales
  • Algunas Cuestiones del Entrenamiento de Redes Neuronales

9. Aprendizaje No Supervisado

  • Análisis de Componentes Principales
  • Clustering

.

La información aquí presente la puedes consultar también en la página web del curso (https://sites.google.com/a/ciencias.unam.mx/probabilidad-i-9028/).

 


Hecho en México, todos los derechos reservados 2011-2016. Esta página puede ser reproducida con fines no lucrativos, siempre y cuando no se mutile, se cite la fuente completa y su dirección electrónica. De otra forma requiere permiso previo por escrito de la Institución.
Sitio web administrado por la Coordinación de los Servicios de Cómputo de la Facultad de Ciencias. ¿Dudas?, ¿comentarios?. Escribenos. Aviso de privacidad.