Profesor | Víctor Germán Mijangos de la Cruz | lu mi vi | 12 a 13 |
Ayudante | Emilio Alejandro Morales Juárez | ma ju | 12 a 13 |
Ayud. Lab. | ma | 14 a 16 |
Presentación del curso
Este curso tiene como objetivo conocer y aplicar las teorías y algoritmos de los sistemas de recuperación de información en textos. Es un acercamiento a las metodologías, los métodos y algoritmos que permiten obtener información a partir de datos textuales (no estructurados) para así poder representar el conocimiento que estos contienen.
En el curso, se revisarán diferentes problemáticas de la recuperación de información, como la extracción de términos. el etiquetado y la clasificación de documentos. También se verán aplicaciones específicas como los sistemas de búsqueda, sistemas de recomendación y minería de opiniones.
Finalmente, dentro del curso se verán diferentes tipos de algoritmos, como los booleanos, los basados en aprendizaje automático y, particularmente, en aprendizaje neuronal.
Evaluación del curso
El curso se evaluará a partir de la presentación de un proyecto final que desarrollará los temas presentados en el curso.
Temario
Introducción
Definición de recuperación de información
Representación de información en textos
Corpus y lingüística de corpus
Métodos formales de búsqueda de información en textos
Uso de expresiones regulares
Stemming y lematización
Recuperación booleana
Similitud formal y métricas entre cadenas
Información en textos
Introducción a la teoría de la información
Extracción de términos
Extracción multi-palabra y multi-documento
Vinculación de términos
Extracción de entidades nombradas
Etiquetado de partes de la oración
Representación de significado
Ontologías para representación semántica
Modelos distribucionales
Semántica latente
Representación de documentos con tf-idf
Representación de documentos con redes neuronales
Clasificación de textos
El problema de la clasificación de textos
Agrupamiento de documentos
Evaluación de clasificación y agrupamiento de documentos
Aplicaciones
Sistemas de búsqueda
Sistemas de recomendación
Minería de opiniones
Classroom: https://classroom.google.com/c/NDY0MzQ1MDU5Mjg2?cjc=mrmdtlu
Github: https://github.com/VMijangos/InformationRetrieval
Bibliografía básica