Encabezado Facultad de Ciencias
Presentación

Ciencias de la Computación (plan 2013) 2024-1

Optativas, Almacenes y Minería de Datos

Grupo 7100, 40 lugares. 34 alumnos.
Profesor Gerardo Avilés Rosas lu mi vi 10 a 11 303 (Yelizcalli)
Ayudante Gerardo Uriel Soto Miranda ma ju 10 a 11 303 (Yelizcalli)
Ayud. Lab. Ricardo Badillo Macías ma 14 a 16 Taller de Ingeniería de Software
 

Almacenes y Minería de Datos

Semestre 2024-1

Importancia de los Almacenes y la MInería de Datos

Las empresas usualmente generan una base de datos con toda la información relevante de sus procesos, clientes, finanzas, etc. El Almacén de Datos es una base de datos analítica que organiza la información, la procesa y la expresa en un análisis de datos entendible que estará a la disposición de los usuarios. Se asegura de que la información mantenga su consistencia e integridad. Los Almacenes de Datos es a menudo parte de una estrategia de gestión de datos más amplia y enfatiza la captura de datos de diferentes fuentes para su acceso y análisis por parte de analistas de negocios, científicos de datos y otros usuarios finales.
Por otro lado, los diferentes mercados y organizaciones hoy en día requirieren de estudios de mayor profundidad que les permitan descubrir y generar conocimiento a partir de las grandes las cantidades de información que generan. Gracias a la integración de algoritmos computacionales y estadísticos de la Minería de Datos con aspectos de la Inteligencia de Negocios es posible ofrecer de manera automatizada e inteligente conocimiento que puede ser de suma importancia para ejecutar acciones para la solución de problemas organizacionales o bien, para fomentar el crecimiento de la misma. Lo se busca es tener una combinación de tecnología, herramientas y procesos que permiten transformar los datos almacenados en información, la información en conocimiento y el conocimiento en un plan o una estrategia comercial.

Objetivos del curso

  • - El alumno identificará los conceptos generales de la tecnología de almacenes de datos.
  • - El alumno explicará los procesos ETL que son fundamentales para la creación de un Almacen de Datos.
  • - El alumno empleará los conceptos del Modelo Multidimensional para definir un cubo de datos.
  • - El alumno explicará las principales técnicas y enfoques de Minería de Datos.
  • - El alumno explicará las principales tareas de Minería de Datos: Asociación, Clasificación y Agrupación.

Metodología de trabajo

El curso de Almacenes y Minería de Datos se trabajará de forma presencial, a través de sesiones semanales con profesor/ayudantes, con el fin de facilitar el estudio, ritmo y organización de cada alumno. Esta sesiones permitirán presentar temas, resolver dudas, aclarar conceptos, resolver ejercicios y realizar las prácticas del laboratorio para cada uno de los temas del curso. Las sesiones siempre se llevarán a cabo, dentro de los días y horario que se tienen asignados en los horarios para la materia. Se dejará abierta la posibilidad de tener sesiones virtuales directamente con los alumnos/equipos, a fin de que los alumnos incritos en el grupo dispongan de espacios adicionales para resolver dudas (esta sesiones se organizarán y programarán de acuerdo a las necesidades que se vayan presentando).

Para llevar el material del curso, se trabajará con notas, presentaciones, ejemplos, ejercicios, diagramas, etc. que se podrán revisar en las sesiones semanales en formato PDF (principalmente).

Herramientas para administración del curso

El curso se administrará con apoyo de Google Classroom, donde se publicará todo el contenido referente al curso: información del profesor, ayudantes, temario, dinámica del curso, material para clase, tareas, prácticas de laboratorio y forma de evaluación. Para mantener contacto con los alumnos y que puedan recibir notificaciones e información de la materia, se utilizará exclusivamente el canal de comunicación que proporciona Google Classroom.

Dinámica del curso

  • - Se pondrá a disposición de los alumnos el material (notas de clase, lecturas, presentaciones, etc.) correspondientes al tema que se revisará durante la semana en curso.
  • - Los ayudantes trabajará con ejercicios/ejemplos resueltos, o bien, presentará algún concepto y/o subtema relevante para el curso, que sea complementario a las clases que se tengan con el profesor.
  • - Los alumnos deberán participar en los foros de dudas, para que el profesor y los ayudantes puedan elaborar material que dé respuesta a las inquietudes de los alumnos o bien permitan profundizar en algún aspecto particular. Todo esto se hará a través de Google Classroom.
  • - El profesor resumirá el tema y resolverá dudas, se encargará de dar introducción cada uno de los temas del curso, brindará comentarios generales sobre el material que se proporcionará y la dinámica a seguir.
  • - Se aplicarán exámenes parciales sobre los conceptos clave del tema estudiado durante las semanas que abarque alguno de los temas.
  • - Se trabajará con tareas y prácticas que sobre los temas del curso, a fin de ir construyendo una evaluación sumativa a lo largo del semestre.
  • - Las prácticas de laboratorio, se llevaran a cabo dentro del día y horario estipulado, procurando que su desarrollo no interfiera de manera sustancial con las actividades programadas para este curso.
  • - Los alumnos deberán desarrollar un proyecto final, que integre de forma práctica, todos los temas revisados a lo largo del curso, el cual se entregará en la última semana de clases del semestre 2024-1.

Temario y distribución del material

Los temas que se revisarán en durane el semestre para la materia de Almacenes y Minería de Datos serán:

  1. Las Bases de Datos y sus problemas
  2. Conceptos generales de los Almacenes de Datos
  3. Procesos ETL
  4. Creación y explotación de Cubos OLAP
  5. Recuperación de información y creación de reportes a partir de un Cubo OLAP
  6. Conceptos Generales de la Minería de Datos y el proceso CRISP-DM
  7. Análisis Exploratorio de Datos
  8. Preprocesamiento de datos
  9. Asociación de patrones frecuentes
  10. Clasificación y Predicción
  11. Agrupación

La logística por semana se ajustará de acuerdo al avance y las necesidades particulares del grupo.

Actividades para evaluación

  1. Tareas.
  2. Prácticas de laboratorio
  3. Exámenes parciales
  4. Lecturas/Exposiciones/Trabajos de Investigación
  5. Un proyecto final de aplicación, que cubra los aspectos del proceso CRISP-DM para desarrollar un proyecto de Minería de Datos.

Nota: El porcentaje que se asignará a cada actividad, se definirá el primer día de clases.

Restricciones importantes del curso

  • - Para NO TENER que presentar el examen final será necesario tener calificación promedio aprobatoria en exámenes y tareas.
  • - La entrega del proyecto final es obligatoria para todos los alumnos.
  • - Para APROBAR el curso será necesario tener calificación promedio aprobatoria todas las actividades del curso.
  • - En caso de NO CUMPLIR con alguno de los puntos anteriores se tendrá calificación automática de 5 (cinco).

Nota

Deberán asegurarse de TENER ACTUALIZADO SU CORREO ELECTRÓNICO dentro de la información que administra la Facultad, procurando que sea uno que revisen constantemente, ya que por ese medio se puede hacer llegar en cualquier momento información importante para del curso.

 


Hecho en México, todos los derechos reservados 2011-2016. Esta página puede ser reproducida con fines no lucrativos, siempre y cuando no se mutile, se cite la fuente completa y su dirección electrónica. De otra forma requiere permiso previo por escrito de la Institución.
Sitio web administrado por la Coordinación de los Servicios de Cómputo de la Facultad de Ciencias. ¿Dudas?, ¿comentarios?. Escribenos. Aviso de privacidad.