Diferencia entre revisiones de «Paleta para primitivas de reconocimiento de voz en tortuga»

De Proyecto Butiá
Saltar a: navegación, buscar
(Página creada con '==Integrantes== * Mercedes Marzoa * Florencia Clerici ==Tutor== * Andrés Aguirre ==Introducción== A continuación presentamos el proyecto Paleta para primitivas de reconoci...')
 
(Página blanqueada)
Línea 1: Línea 1:
==Integrantes==
 
  
* Mercedes Marzoa
 
* Florencia Clerici
 
 
==Tutor==
 
* Andrés Aguirre
 
 
==Introducción==
 
A continuación presentamos el proyecto Paleta para primitivas de reconocimiento de voz en tortuga.
 
 
==Motivación==
 
El proyecto surge a partir de una reunión del Proyecto Butiá en la que una maestra que trabaja en la escuela (?) planteo la necesidad de contar con una herramienta que le permitiera trabajar a sus alumnos con TurtleBot y el robot butiá. Si bien el proyecto no puede resolver toda la problemática, la idea es que se pueda extender y que quede planteado el problema para motivar otras soluciones.
 
 
==Objetivos==
 
* Tener un módulo de reconocimiento de voz
 
* Definir un gramática básica para poder usar las operaciones básicas del robot butiá en el TurtleBot
 
* Integrar el módulo en el TurtleBot
 
 
==Desarrollo del problema==
 
 
Hay dos tipos de modelos para describir un lenguaje: gramáticos o estáticos. Los modelos gramáticos son muy simples y se utilizan para reconocer comandos y controles. En este caso como se quiere reconocer comandos se define un modelo de lenguaje gramático.
 
 
Para poder utilizar la biblioteca de reconocimiento tienen que estar definidos:
 
*''butia-listens.gram:'' es donde se define la gramática.
 
*''butia-listens.dic:'' es donde se define el diccionario (todas las palabras que se reconocerán).
 
*''modelo acustico:'' es lo que va a utilizar la biblioteca como fuente de datos para hacer el reconocimiento.
 
 
 
Una vez se tiene definido lo anterior, podemos empezar a desarrollar el modulo de reconocimiento. El primer paso es instalar la biblioteca y sus dependencias. Para eso hay que descargar: Pocketsphinx y Sphinxbase, siguiendo el tutorial en [1].
 
 
La estructura básica del programa que usamos para reconocer se encuentra publicada en [2].
 
 
* Describir modulo de escucha
 
* Describir proceso de entrenamiento del modelo acústico
 
*''butia-listens.transcription:'' es donde asociamos los comandos a reconocer con los archivos de audio.
 
* Describir paleta
 
* Recorte y video de un ejemplo
 
 
 
==Conclusiones==
 
 
 
==Trabajo a futuro==
 
* Ampliar la gramática para abarcar mas funcionalidades del TurtleBot
 
* Seguir entrenando el modelo acústico
 
 
 
==Referencias==
 
[1] http://cmusphinx.sourceforge.net/wiki/tutorialpocketsphinx
 
[2] http://cmusphinx.sourceforge.net/wiki/gstreamer
 

Revisión del 12:53 18 jun 2014