Tecnología

Reconocimiento de voz ¿el secreto mejor guardado de Kinect?

·

Hoy he asistido a Casa Kinect (el local que Microsoft ha utilizado para promocionar el lanzamiento desde hace semanas en Alberto Aguilera 1, Madrid) y lo he hecho con el objetivo de poderle sacar toda la información posible a Alex Acero, uno de los responsables del lanzamiento de este ingenio y un verdadero «coquito». Acero es teleco por la UPM, pero tras terminar la carrera completó sus estudios en un par de prestigiosas universidades para luego dar el salto al terreno profesional en empresas como Apple, Telefónica I+D y, finalmente, Microsoft Research.

En todas ellas el centro de su trabajo ha sido único: el reconocimiento de voz, con un área de especialización muy curiosa: el reconocimiento del lenguaje natural, o lo que es lo mismo: tratar de hacer que las máquinas puedan entender lo que queremos mientras les hablamos como si habláramos a la vecina. En lugar de utilizar comandos específicos para ciertas acciones («Cargar – Juego – FIFA 2011») podríamos decir «Quiero jugar al FIFA 2011» o «partida al FIFA», por ejemplo.

Hoy por hoy eso no es posible, y eso que Kinect ya ha comenzado a integrar el reconocimiento de voz para un conjunto -aún limitado- de órdenes concretas de voz -que además tienes que decirse de forma exacta-, pero todo apunta a que no estamos tan lejos de que Kinect entienda nuestra forma natural de hablar. Puede que no siempre acierte, pero el futuro de este sistema parece destinado a dar un paso muy importante en la interfaz de usuario a la que estamos acostumbrados.

Podéis ver el artículo con la entrevista al completo en MuyComputer. Que mi trabajo me ha costado 😉

¿Quieres recibir un correo de aviso cuando publique nuevas entradas?

Standard

1 comentario en “Reconocimiento de voz ¿el secreto mejor guardado de Kinect?

  1. Es increible como te haz vendido… Jajaj mentiras.. Buen post. Por cierto, será que quieren primero crear una base de datos con variaciones de voz para realizar el paso a Windows de forma mas transparente.

    Así hizo Google con 1-800-GOOG-411 que fue la base del reconocimiento de voz en Android.

Comentarios cerrados