Paleta para primitivas de reconocimiento de voz en tortuga
Contenido
Integrantes
- Mercedes Marzoa
- Florencia Clerici
Tutor
- Andrés Aguirre
Introducción
A continuación presentamos el proyecto Paleta para primitivas de reconocimiento de voz en tortuga.
Motivación
El proyecto surge a partir de una reunión del Proyecto Butiá en la que una maestra que trabaja en la escuela (?) planteo la necesidad de contar con una herramienta que le permitiera trabajar a sus alumnos con TurtleBot y el robot butiá. Si bien el proyecto no puede resolver toda la problemática, la idea es que se pueda extender y que quede planteado el problema para motivar otras soluciones.
Objetivos
- Tener un módulo de reconocimiento de voz
- Definir un gramática básica para poder usar las operaciones básicas del robot butiá en el TurtleBot
- Integrar el módulo en el TurtleBot
Desarrollo del problema
Hay dos tipos de modelos para describir un lenguaje: gramáticos o estáticos. Los modelos gramáticos son muy simples y se utilizan para reconocer comandos y controles. En este caso como se quiere reconocer comandos se define un modelo de lenguaje gramático.
Para poder utilizar la biblioteca de reconocimiento tienen que estar definidos:
- butia-listens.gram: es donde se define la gramática.
- butia-listens.dic: es donde se define el diccionario (todas las palabras que se reconocerán).
- modelo acustico: es lo que va a utilizar la biblioteca como fuente de datos para hacer el reconocimiento.
Una vez se tiene definido lo anterior, podemos empezar a desarrollar el modulo de reconocimiento. El primer paso es instalar la biblioteca y sus dependencias. Para eso hay que descargar: Pocketsphinx y Sphinxbase, siguiendo el tutorial en [1].
La estructura básica del programa que usamos para reconocer se encuentra publicada en [2].
- Describir modulo de escucha
- Describir proceso de entrenamiento del modelo acústico
- butia-listens.transcription: es donde asociamos los comandos a reconocer con los archivos de audio.
- Describir paleta
- Recorte y video de un ejemplo
Conclusiones
Trabajo a futuro
- Ampliar la gramática para abarcar mas funcionalidades del TurtleBot
- Seguir entrenando el modelo acústico
Referencias
[1] http://cmusphinx.sourceforge.net/wiki/tutorialpocketsphinx [2] http://cmusphinx.sourceforge.net/wiki/gstreamer