Encabezado Facultad de Ciencias
Presentación

Ciencias de la Computación (plan 2013) 2022-2

Optativas, Recuperación y Búsqueda de Información en Textos

Grupo 7136, 60 lugares. 10 alumnos.
Profesor Víctor Germán Mijangos de la Cruz lu mi vi 12 a 13
Ayudante Emilio Alejandro Morales Juárez ma ju 12 a 13
Ayud. Lab. ma 14 a 16
 

Presentación del curso

Este curso tiene como objetivo conocer y aplicar las teorías y algoritmos de los sistemas de recuperación de información en textos. Es un acercamiento a las metodologías, los métodos y algoritmos que permiten obtener información a partir de datos textuales (no estructurados) para así poder representar el conocimiento que estos contienen.

En el curso, se revisarán diferentes problemáticas de la recuperación de información, como la extracción de términos. el etiquetado y la clasificación de documentos. También se verán aplicaciones específicas como los sistemas de búsqueda, sistemas de recomendación y minería de opiniones.

Finalmente, dentro del curso se verán diferentes tipos de algoritmos, como los booleanos, los basados en aprendizaje automático y, particularmente, en aprendizaje neuronal.

Evaluación del curso

El curso se evaluará a partir de la presentación de un proyecto final que desarrollará los temas presentados en el curso.

Temario

  1. Introducción

    1. Definición de recuperación de información

    2. Representación de información en textos

    3. Corpus y lingüística de corpus

  2. Métodos formales de búsqueda de información en textos

    1. Uso de expresiones regulares

    2. Stemming y lematización

    3. Recuperación booleana

    4. Similitud formal y métricas entre cadenas

  3. Información en textos

    1. Introducción a la teoría de la información

    2. Extracción de términos

    3. Extracción multi-palabra y multi-documento

    4. Vinculación de términos

    5. Extracción de entidades nombradas

    6. Etiquetado de partes de la oración

  4. Representación de significado

    1. Ontologías para representación semántica

    2. Modelos distribucionales

    3. Semántica latente

    4. Representación de documentos con tf-idf

    5. Representación de documentos con redes neuronales

  5. Clasificación de textos

    1. El problema de la clasificación de textos

    2. Agrupamiento de documentos

    3. Evaluación de clasificación y agrupamiento de documentos

  6. Aplicaciones

    1. Sistemas de búsqueda

    2. Sistemas de recomendación

    3. Minería de opiniones

Classroom: https://classroom.google.com/c/NDY0MzQ1MDU5Mjg2?cjc=mrmdtlu

Github: https://github.com/VMijangos/InformationRetrieval

Bibliografía básica

  • Manning, CRaghavan, P. y Schütze, H. (2018). Introduction to Information Retrieval. Cambridge University Press.
  • Zhai, C. y Massung, S. (2016). Text Data Management and Analysis: A Practical Introduction to Information Retrieval and Text Mining. ACM Books.
  • Mitra, B. y Craswell, N. (2018). “An Introduction to Neural Information Retrieval”. Foundations and Trends® in Information Retrieval

 


Hecho en México, todos los derechos reservados 2011-2016. Esta página puede ser reproducida con fines no lucrativos, siempre y cuando no se mutile, se cite la fuente completa y su dirección electrónica. De otra forma requiere permiso previo por escrito de la Institución.
Sitio web administrado por la Coordinación de los Servicios de Cómputo de la Facultad de Ciencias. ¿Dudas?, ¿comentarios?. Escribenos. Aviso de privacidad.