Dra. Aiala Ros� | ||
Grupo Procesamiento de Lenguaje Natural | ||
El �rea de procesamiento de lenguaje natural es por su naturaleza un espacio interdisciplinario entre la Inform�tica y la Ling��stica. La vinculaci�n corresponde a una confluencia en el objeto de estudio, el lenguaje humano, ya sea con el prop�sito de conocer a fondo su estructura y funcionamiento como con el prop�sito de construir aplicaciones inform�ticas con capacidad de realizar comprensi�n y extraer informaci�n de enunciados ling��sticos.
En la Universidad de la Rep�blica este espacio interdisciplinario se ha concretado en el trabajo conjunto de dos grupos acad�micos: el Grupo de Procesamiento de Lenguaje Natural (GPLN) del Instituto de Computaci�n de la Facultad de Ingenier�a y el Departamento de Teor�a del Lenguaje y Ling��stica General (DTTLG), de la Facultad de Humanidades y Ciencias de la Educaci�n. M�s de diez a�os de trabajo conjunto se han concretado en varios proyectos de an�lisis de textos: modelo de discurso, reconocimiento de proposiciones, reconocimiento de eventos y expresiones temporales y otros. El hecho de procesar textos en forma autom�tica, cualquiera sea la finalidad con que se realiza tal tarea (extraer informaci�n, responder preguntas, realizar res�menes, traducir), implica enfrentarse con ciertas propiedades del discurso que es necesario aprehender. Nuestra l�nea de trabajo ha sido la de adoptar una estructura modular para dar cuenta de esas propiedades complejas, expres�ndolas mediante el an�lisis en distintos ejes o m�dulos independientes, capaces, sin embargo, de interactuar entre s�. Esta estructura, si bien no aporta en principio una visi�n hol�stica del discurso, permite, sin embargo, trabajar independientemente en cada eje, al mismo tiempo que habilita la incorporaci�n de otros nuevos, a medida que se vayan desarrollando. La metodolog�a de trabajo incorpora los diferentes tipos de formaci�n involucradas en el �rea. Un ejemplo ilustrativo es el caso de desarrollo de sistemas basados en corpus, que se ha aplicado a distintos fen�menos. En particular, podemos citar el reconocimiento de eventos y expresiones temporales y el reconocimiento de opiniones en textos. En ambos casos la metodolog�a incluye una primera etapa de an�lisis conceptual del fen�meno, que concluye en la definici�n de un esquema de anotaci�n. En esta etapa es fundamental el aporte de la formaci�n ling��stica. La etapa siguiente consiste en la anotaci�n concreta de un corpus seg�n el esquema de anotaci�n. Esta tarea, que implica a menudo la toma de decisiones para la resoluci�n de casos dif�ciles, ha sido realizada con la participaci�n conjunta de linguistas e inform�ticos. Como etapa posterior, se explotan los resultados del corpus anotado, ya sea mediante m�todos de aprendizaje autom�tico, mediante reglas manuales o mediante combinaci�n de los anteriores. Algunos modelos utilizados para el primer caso son Conditional Random Fields, Support Vector Machines y Na�f Bayes. Un elemento importante en el aprendizaje supervisado es una adecuada elecci�n de atributos, este tema es propicio para la interacci�n entre las distintas formaciones. |
||
Volver a Programa |