Encabezado Facultad de Ciencias
presentacion

Presentación del grupo 7027 - 2012-1.

Objetivos Generales

El tratamiento de lenguaje natural por computadora intenta dar respuesta a las preguntas fundamentales de la intersección de lenguajes humanos y computación. ¿Cómo pueden las computadoras adquirir, comprender y producir oraciones en lenguajes naturales, tales como el español, el inglés? ¿Cómo pueden los métodos de cómputo darnos entendimiento de los fenómenos observados del lenguaje humano?

Este curso presenta una introducción al tratamiento de lenguaje natural, cuyo interés primario es el estudio del uso del lenguaje humano desde una perspectiva de cómputo. Los objetivos principales del curso son: proveer a los estudiantes de una amplia descripción del campo, y prepararlos para el estudio profundo del procesamiento del lenguaje natural. No se asume ningún conocimiento anterior de la teoría lingüística y de usos lingüísticos. En esta introducción se presentan las técnicas, la literatura, las tecnologías y los desafíos actuales del tratamiento de lenguaje natural por computadora, usando el español como lengua de ejemplos.

Contenido

1.Introducción

1.1 Lenguaje, pensamiento y comprensión

1.2 Ambigüedad

1.3 Historia

2.Fonología y fonética

2.1 Los fonemas

2.2 Mapeo de señales acústicas a fonemas

2.3 Mapeo de fonemas a palabras

3.Morfología y transductores de estados finitos

3.1 Morfología (flexiva, derivacional)

3.2 Morfotáctica y diccionarios

3.3 Transductores y reglas

4.Marcado de categorías gramaticales

4.1 Métodos lingüísticos y estadísticos

4.2 Desambiguación de marcas morfológicas

4.3 Algoritmo de Viterbi

5.Sintaxis

5.1 Gramática de estructura de frases (verbales, nominales, adjetivales, etc.)

5.2 Gramática independiente del contexto para el español

5.3 Subcategorización

5.4 Gramáticas de dependencias

6.Análisis sintáctico

6.1 Como búsqueda (ascendente, descendente)

6.2 Ambigüedad

6.4 Métodos: Transductores de estados finitos y Tipo Chart

6.5 Concordancia y unificación

6.6 Métodos probabilísticos

7.Semántica

7.1 Representación del sentido (no ambiguas, forma canónica, expresividad)

7.2 Estructura predicado – argumento

7.3 Lógica de primer orden (elementos, semántica, cuantificadores, inferencia)

8.Análisis semántico

8.1 Dirigido por la sintaxis

8.2 Cálculo lambda

8.3 Restricciones de selección

9.Aplicaciones

10.1 Traducción automática

10.2 Desambiguación de sentidos

10.3 Recuperación de información

Bibliografía básica

  • Daniel Jurafsky, James H. Martin, Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition. 2nd edition Prentice Hall, 2008(Instituto de Ingeniería)
  • Daniel Jurafsky, James H. Martin, Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition. Prentice Hall, 2000(Bib. IIMAS)
  • Allen, J. F., Natural Language Understanding, The Benjamin/Cummings Publishing Company, Inc., 1995(Bib. Ciencias)

Bibliografía complementaria

  • Beristáin, H. Gramática estructural de la lengua española. Universidad Autónoma de México. LIMUSA Noriega Editores. 1984 (Bib. FyL)
  • Charniak, E. Statistical Language Learning, MIT, Cambridge, MA. 1993. (Bib. Ciencias)
  • Chomsky, N. Some Concepts and Consequences of the theory of Government and Binding. MIT Press, 1982. Editada bajo el título de La nueva sintaxis. Teoría de la rección y el ligamento. Ediciones Paidós, 1988 (Bib. IIMAS)
  • Grishman, R. Computational linguistics An introduction. Cambridge University Press. 1986 (Bib. Central)
  • Manning, C. & Schütze, H. Foundations of Statistical Natural Language Processing. MIT Press. Cambridge, Mass. 1999 (Bib. IIMAS)
  • Mel’cuk, I. A. Dependency Syntax: Theory and Practice. State University of New York Press. Albany (Bib. CIC-IPN)
  • Sag, I. A. and Wasow, T. Syntactic Theory: A Formal Introduction. Center for the Study of Language and Information, 1999 (Bib. IIMAS)
  • Seco, M. Gramática esencial del español Aguilar ediciones. 1972 (Bib. Central)

Evaluación

50%Exámenes (3)

20%Tareas (3 o 4)

30%Proyecto de programación

 


Hecho en México, todos los derechos reservados 2011-2016. Esta página puede ser reproducida con fines no lucrativos, siempre y cuando no se mutile, se cite la fuente completa y su dirección electrónica. De otra forma requiere permiso previo por escrito de la Institución.
Sitio web administrado por la Coordinación de los Servicios de Cómputo de la Facultad de Ciencias. ¿Dudas?, ¿comentarios?. Escribenos. Aviso de privacidad.