En el marco del evento Ingeniería de Muestra2023 se realizarán dos Desafíos de Procesamiento de Lenguaje Natural abiertos a toda persona con conocimientos en el área. El objetivo es experimentar con redes neuronales, grandes modelos de lenguaje (como ChatGPT o LLaMa), entre otros enfoques. No es necesario inscribirse previamente. El lanzamiento se realizará en el salón C11 del Polifuncional a las 20h.
Los dos desafíos son:
1) Jeporoheka - Clasificación de palabras en español y guaraní
- Nivel principiante: conocimientos de Programación.
- Se debe desarrollar un sistema que, dada una palabra, indique si está en guaraní o en español. Para eso se cuenta con un conjunto de palabras en ambos idiomas, etiquetadas con el idioma de cada una. La tarea se puede resolver utilizando sistemas de reglas o aprendizaje automático. El primer día de IdeM se liberarán las colecciones de datos de entrenamiento y desarrollo, y al final de la competencia se liberarán los datos de test (sin anotaciones) para ser procesados por los sistemas participantes.
2) HAHA - Clasificación de humor
- Nivel avanzado: conocimientos de Aprendizaje Automático.
- Se deben desarrollar sistemas que, dado un tweet cualquiera, determinen si tiene contenido humorístico y de qué tipo de humor se trata. En base a un dataset de tweets ya clasificados, que será distribuido el primer día de IdeM, se pueden entrenar modelos de aprendizaje automático para resolver la tarea.
Fechas importantes:
- Viernes 6 de octubre: presentación de los desafíos en IdM y publicación de datos de entrenamiento y desarrollo.
- Miércoles 18 de octubre: publicación de datos de test.
- Viernes 20 de octubre: publicación de resultados y anuncio de los ganadores.
Foro para consultas y comentarios: https://groups.google.com/g/pln-desafios-idm
Más información en: https://www.fing.edu.uy/inco/grupos/pln/desafiosPLN/
Organiza: Grupo PLN (Inco - Fing - Udelar)