Pasar al contenido principal

IA: Desafíos de Procesamiento de Lenguaje Natural en IdM

En el marco del evento Ingeniería de Muestra2023 se realizarán dos Desafíos de Procesamiento de Lenguaje Natural abiertos a toda persona con conocimientos en el área. El objetivo es experimentar con redes neuronales, grandes modelos de lenguaje (como ChatGPT o LLaMa), entre otros enfoques. No es necesario inscribirse previamente.  El lanzamiento se realizará en el salón C11 del Polifuncional a las 20h.

Los dos desafíos son:

1) Jeporoheka - Clasificación de palabras en español y guaraní

  • Nivel principiante: conocimientos de Programación.
  • Se debe desarrollar un sistema que, dada una palabra, indique si está en guaraní o en español. Para eso se cuenta con un conjunto de palabras en ambos idiomas, etiquetadas con el idioma de cada una. La tarea se puede resolver utilizando sistemas de reglas o aprendizaje automático. El primer día de IdeM se liberarán las colecciones de datos de entrenamiento y desarrollo, y al final de la competencia se liberarán los datos de test (sin anotaciones) para ser procesados por los sistemas participantes.

2) HAHA - Clasificación de humor 

  • Nivel avanzado: conocimientos de Aprendizaje Automático.
  • Se deben desarrollar sistemas que, dado un tweet cualquiera, determinen si tiene contenido humorístico y de qué tipo de humor se trata. En base a un dataset de tweets ya clasificados, que será distribuido el primer día de IdeM, se pueden entrenar modelos de aprendizaje automático para resolver la tarea.

Fechas importantes:

  • Viernes 6 de octubre: presentación de los desafíos en IdM y publicación de datos de entrenamiento y desarrollo.
  • Miércoles 18 de octubre: publicación de datos de test.
  • Viernes 20 de octubre: publicación de resultados y anuncio de los ganadores.

Foro para consultas y comentarios: https://groups.google.com/g/pln-desafios-idm
Más información en: https://www.fing.edu.uy/inco/grupos/pln/desafiosPLN/
Organiza: Grupo PLN (Inco - Fing - Udelar)