Objetivos Generales
El tratamiento de lenguaje natural por computadora intenta dar respuesta a las preguntas fundamentales de la intersección de lenguajes humanos y computación. ¿Cómo pueden las computadoras adquirir, comprender y producir oraciones en lenguajes naturales, tales como el español, el inglés? ¿Cómo pueden los métodos de cómputo darnos entendimiento de los fenómenos observados del lenguaje humano?Este curso presenta una introducción al tratamiento de lenguaje natural, cuyo interés primario es el estudio del uso del lenguaje humano desde una perspectiva de cómputo. Los objetivos principales del curso son: proveer a los estudiantes de una amplia descripción del campo, y prepararlos para el estudio profundo del procesamiento del lenguaje natural. No se asume ningún conocimiento anterior de la teoría lingüística y de usos lingüísticos. En esta introducción se presentan las técnicas, la literatura, las tecnologías y los desafíos actuales del tratamiento de lenguaje natural por computadora, usando el español como lengua de ejemplos.
Contenido
1.Introducción
1.1 Lenguaje, pensamiento y comprensión
1.2 Ambigüedad
1.3 Historia
2.Fonología y fonética
2.1 Los fonemas
2.2 Mapeo de señales acústicas a fonemas
2.3 Mapeo de fonemas a palabras
3.Morfología y transductores de estados finitos
3.1 Morfología (flexiva, derivacional)
3.2 Morfotáctica y diccionarios
3.3 Transductores y reglas
4.Marcado de categorías gramaticales
4.1 Métodos lingüísticos y estadísticos
4.2 Desambiguación de marcas morfológicas
4.3 Algoritmo de Viterbi
5.Sintaxis
5.1 Gramática de estructura de frases (verbales, nominales, adjetivales, etc.)
5.2 Gramática independiente del contexto para el español
5.3 Subcategorización
5.4 Gramáticas de dependencias
6.Análisis sintáctico
6.1 Como búsqueda (ascendente, descendente)
6.2 Ambigüedad
6.4 Métodos: Transductores de estados finitos y Tipo Chart
6.5 Concordancia y unificación
6.6 Métodos probabilísticos
7.Semántica
7.1 Representación del sentido (no ambiguas, forma canónica, expresividad)
7.2 Estructura predicado – argumento
7.3 Lógica de primer orden (elementos, semántica, cuantificadores, inferencia)
8.Análisis semántico
8.1 Dirigido por la sintaxis
8.2 Cálculo lambda
8.3 Restricciones de selección
9.Aplicaciones
10.1 Traducción automática
10.2 Desambiguación de sentidos
10.3 Recuperación de información
Bibliografía básica
Bibliografía complementaria
Evaluación
50%Exámenes (3)
20%Tareas (3 o 4)
30%Proyecto de programación