Paleta para primitivas de reconocimiento de voz en tortuga

De Proyecto Butiá
Revisión del 18:40 24 may 2014 de Florencia Clerici (Discusión | contribuciones) (Página creada con '==Integrantes== * Mercedes Marzoa * Florencia Clerici ==Tutor== * Andrés Aguirre ==Introducción== A continuación presentamos el proyecto Paleta para primitivas de reconoci...')

(dif) ← Revisión anterior | Revisión actual (dif) | Revisión siguiente → (dif)
Saltar a: navegación, buscar

Integrantes

  • Mercedes Marzoa
  • Florencia Clerici

Tutor

  • Andrés Aguirre

Introducción

A continuación presentamos el proyecto Paleta para primitivas de reconocimiento de voz en tortuga.

Motivación

El proyecto surge a partir de una reunión del Proyecto Butiá en la que una maestra que trabaja en la escuela (?) planteo la necesidad de contar con una herramienta que le permitiera trabajar a sus alumnos con TurtleBot y el robot butiá. Si bien el proyecto no puede resolver toda la problemática, la idea es que se pueda extender y que quede planteado el problema para motivar otras soluciones.

Objetivos

  • Tener un módulo de reconocimiento de voz
  • Definir un gramática básica para poder usar las operaciones básicas del robot butiá en el TurtleBot
  • Integrar el módulo en el TurtleBot

Desarrollo del problema

Hay dos tipos de modelos para describir un lenguaje: gramáticos o estáticos. Los modelos gramáticos son muy simples y se utilizan para reconocer comandos y controles. En este caso como se quiere reconocer comandos se define un modelo de lenguaje gramático.

Para poder utilizar la biblioteca de reconocimiento tienen que estar definidos:

  • butia-listens.gram: es donde se define la gramática.
  • butia-listens.dic: es donde se define el diccionario (todas las palabras que se reconocerán).
  • modelo acustico: es lo que va a utilizar la biblioteca como fuente de datos para hacer el reconocimiento.


Una vez se tiene definido lo anterior, podemos empezar a desarrollar el modulo de reconocimiento. El primer paso es instalar la biblioteca y sus dependencias. Para eso hay que descargar: Pocketsphinx y Sphinxbase, siguiendo el tutorial en [1].

La estructura básica del programa que usamos para reconocer se encuentra publicada en [2].

  • Describir modulo de escucha
  • Describir proceso de entrenamiento del modelo acústico
  • butia-listens.transcription: es donde asociamos los comandos a reconocer con los archivos de audio.
  • Describir paleta
  • Recorte y video de un ejemplo


Conclusiones

Trabajo a futuro

  • Ampliar la gramática para abarcar mas funcionalidades del TurtleBot
  • Seguir entrenando el modelo acústico


Referencias

[1] http://cmusphinx.sourceforge.net/wiki/tutorialpocketsphinx [2] http://cmusphinx.sourceforge.net/wiki/gstreamer