Últimas publicaciones

Acceda aquí a la lista completa de publicaciones del grupo.

Proyectos recientes

PeríodoProyectoPrograma/FinanciadorDetalle
2021 - 2022Búsqueda de respuestas a partir de textos en españolCSIC-UdelaREn este proyecto nos proponemos profundizar la investigación en las áreas QA e IR, con el objetivo de llegar a definir un enfoque genérico aplicable a diferentes dominios. Algunos de los problemas que se abordarán son: investigación en el área IR para mejorar la identificación de documentos relevantes para una pregunta; modelos neuronales entrenado sobre corpus genéricos o específicos de dominio; estudio de enfoques alternativos a los modelos neuronales, basados en análisis sintáctico o patrones de respuestas, y su posible combinación; evaluación de la calidad de las respuestas obtenidas; interacción con aspectos extraproposicionales del significado.
2021Desarrollo de herramientas de apoyo a la enseñanza de lenguas aplicando técnicas de Inteligencia ArtificialANII-FSEDEsta propuesta busca continuar con una línea de trabajo desarrollada desde 2018, en el marco de una colaboración entre el grupo Procesamiento de Lenguaje Natural (PLN) del Instituto de Computación, Facultad de Ingeniería (Udelar), y el Programa de Políticas Lingüísticas de ANEP. En 2020 se incorpora al equipo de trabajo la Facultad de Información y Comunicación (Udelar) con el objetivo de fortalecer los aspectos específicos relacionados con la enseñanza de inglés como lengua extranjera. En estos años se desarrollaron diferentes aplicaciones para la generación automática de recursos educativos para apoyar la enseñanza de la lengua inglesa, aprovechando el potencial de las herramientas y los métodos actuales del PLN. En ocasión de este llamado se propone trabajar en la extensión y adaptación de las herramientas implementadas, de forma que puedan ser utilizadas en forma remota y sean fácilmente accesibles desde las ceibalitas y la plataforma CREA, e investigar nuevas técnicas de PLN para mejorar algunos aspectos de las aplicaciones.
2018 - 2020Curación automática de sentencias de la Base Nacional de JurisprudenciaANII - Fondo de Datos
Video de difusión
El proyecto propone la automatización de varias tareas de curación de datos abiertos de sentencias judiciales. El proceso fundamental es la anonimización de datos sensibles (Nombres de personas y eventualmente de lugares y organizaciones). Los otros procesos son la generación de metadatos dedescripción temática y el reconocimiento de citaciones a especialistas de prestigio (“doctrinos”). Elproyecto se realiza en completo acuerdo con el Poder Judicial, Suprema Corte de Justicia e incluye un convenio de interés mutuo y salvaguarda de la confidencialidad de los datos entre el Poder Judicial y la UDELAR
2018 - 2020Diseño de un mecanismo para mejorar la información para productores ganaderos mediante Procesamiento de Lenguaje NaturalBIDEste proyecto busca mejorar y facilitar la búsqueda, el acceso y el uso por parte de los usuarios de los datos, la información, las aplicaciones y las tecnologías disponibles en INIA, con énfasis en esta primera etapa en la producción ganadera familiar, desarrollando un piloto de una plataforma informática que, a través del Procesamiento de Lenguaje Natural (PLN) y otras tecnologías de inteligencia artificial, estructure automáticamente dichos contenidos (producción de pasturas,manejo de ganado, condiciones ambientales, guías y recomendaciones sanitarias, etc.) y haga ergonómica la interacción con los usuarios. Proyecto en colaboración con ICT4V, INIA y Quanam, participa Horacio Saggion (Pompeu Fabra)

Proyectos en los que participamos

PeríodoProyectoPrograma/FinanciadorEquipos con los que colaboramos
2021 - 2023Cobertura informativa y procesos de (des)información en los medios de comunicación uruguayosCSIC-UdelaRFacultad de Información y Comunicación de la UdelaR
2021 - 2023Expectativas e indicadores de sentimiento económico: estudio del caso uruguayoCSIC-UdelaRFacultad de Ciencias Económicas de la UdelaR
2021De la ley de seguridad ciudadana (1995) a la ley de urgente consideración (2020): análisis de las agendas de seguridad durante los últimos 25 años en UruguayFacultad de Ciencias Sociales
2019 - 2020E-Participación: Desarrollo de un Marco de Referencia y Plataforma Tecnológica para apoyar procesos de participación ciudadanaBIDFacultad de Ciencias Sociales, AGESIC
2017 -CRUZAR : proyecto de sistematización de información de archivos del pasado reciente vinculados al terrorismo de estado y graves violaciones a los Derechos Humanos.UdelaRFacultad de Información y Comunicación, Facultad de Ingeniería, UdelaR

Tesis de Doctorado

Tesis de Maestría

Estudiantes de posgrado

EstudiantePosgradoTesisOrientación)
Lucía BouzaMaestría en Ciencia de DatosGuillermo Moncecchi
Mathias EtcheverryDoctorado en InformáticaDina Wonsever
Diego GaratDoctorado en InformáticaDina Wonsever
Pablo GrillMaestría en InformáticaProcesamiento de Lenguaje Natural aplicado a juicios escritos de maestrosAiala Rosá, Guillermo Moncecchi
Gonzalo HerreraMaestría en InformáticaEstudio de modelos neuronales de lenguaje y sus aplicaciones a diferentes problemas del área PLNAiala Rosá, Luis Chiruzzo
Rodrigo LagunaMaestría en InformáticaCurriculum LearningGuillermo Moncecchi
Juan MachadoMaestría en Ciencia de DatosAiala Rosá
Benjamín MachínMaestría en InformáticaGuillermo Moncecchi
Gabriel MordeckiMaestría en InformáticaDetección y respuesta de títulos clickbait en prensaJavier Couto, Guillermo Moncecchi

Proyectos anteriores

PeríodoProyectoPrograma/FinanciadorDetalle
2014 - 2015RITA: RIch Text Analysis through Enhanced Tools based on Lexical ResourcesSTIC-AmSudThe objective of the project is the development of tools for the syntactico-semantic analysis of Spanish and Portuguese. To do this, we aim to build a framework to integrate the different capabilities and resources of the groups involved. In particular, we want to integrate different lines of work on compositional semantics and enriched lexica: the Lexicon-Grammar tables, verbal subcategorization frames, multiword expressions, grammatical formalisms with enough expressivity to integrate this information, and learning mechanisms capable of building complex models from examples at these levels of analysis
2012 - 2014ECOS PU11H02: Modelado de Opiniones y de su anclaje calendario y realización de sistemas cronológicos con polaridadECOS-SUDProyecto de colaboración con el laboratorio MoDyCo de la Universidad Paris Ouest. La problemática del proyecto se sitúa en la recuperación y modelado de opiniones y de expresiones de calendario en textos. Se inscribe en el área de Procesamiento de Lenguaje Natural, apoyándose sobre dos modalidades de análisis: tratamiento simbólico y explotación de técnicas de aprendizaje automático. Actualmente, la recuperación de opiniones y de expresiones temporales está siendo abordada separadamente por equipos en Uruguay y Francia. Este proyecto apunta a reunir ambos enfoques de modo de poder recuperar opiniones emitidas en un período temporal dado. Esto permitiría responder a una pregunta del tipo: “Cuál es la opinión de X / acerca de X antes del 2010?”
2009 - 2010Temantex: Análisis temporal de textosI+D, CSIC-UdelaREl objetivo del proyecto es el análisis temporal de textos en español. Esto involucra el reconocimiento de los eventos y las expresiones temporales en textos y el reconocimiento de relaciones temporales entre eventos y de eventos con intervalos o instantes denotados por expresiones temporales
2008 - 2009Merging, InduCing and Reasoning with Ontologies in BIOinformatics: The MICROBIO ProjectSTIC-AmSudProyecto de colaboración con Pontificia Universidade Católica do Rio Grande do Sul, Faculdade de Informatica. Brasil, Universidad de Concepción. Chile, LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications. France,Facultad de Matemática, Astronomía y Física. Universidad Nacional de Córdoba. Argentina, Institut Pasteur de Montevideo. Uruguay.
2006 - 2008U05H01: Modèle de discours et outils informatiques pour l’analyse, la recherche d’information, la visualisation et la navigation textuelleECOS-SUDProyecto de cooperación con la Université Paris X - Nanterre (France)
2006 - 2008SIBILA: Sistema automático de respuestas basado en un modelo del discursoPDT - MEC
2000 - 2002CLATEX: Construcción de una herramienta informática para la segmentación en cláusulas de textos en españolCSIC - UdelaREste proyecto incluye el desarrollo de un formalismo de reglas contextuales para el reconocimiento de cláusulas
1998 - 2001U97E01:Adquisición de conocimientos a partir de textos: representación y tratamientos informáticoECOS-SUDProyecto de cooperación con la Université Sorbonne (Paris IV). En el marco de este proyecto se desarrolló una plataforma de exploración contextual (ContextO). Esta plataforma incluye un amplio rango de aplicaciones: extracción de definiciones y relaciones de causalidad en texto libre, construcción automática de resúmenes, filtrado semántico de información, etc.