Tecnología

Siri y el futuro de la telefonía móvil

·

El iPhone 4S se está vendiendo como rosquillas (el doble de rápido que el iPhone 4), y su característica más destacada para todos los medios es Siri, ese asistente que reconoce órdenes de voz y nos contesta de forma bastante ocurrente, acertada e incluso con cierta ironía en ocasiones. La inteligencia artificial de este sistema parece estar bastante lograda para esta primera iteración de Siri, y de hecho han surgido todo tipo de artículos e incluso webs (como esta tan simpática llamada «Shit that Siri Says«) en los que este aspirante a convertirse en HAL 9000  es absoluto protagonista.

Lo curioso es que el tema del reconocimiento de voz se haya puesto de moda justo ahora. Porque, niños y niñas, el reconocimiento de voz no es nuevo. Hace años que está disponible para PCs y portátiles, y Google lleva tiempo ofreciendo su Búsqueda por Voz y sus Acciones de Voz, incluso en el navegador. Pero como dicen en TechCrunch con bastante acierto, la diferencia entre lo que había y Siri es importante:

So if the stuff Siri is doing is old, and if others did do it FIRST, then why is everyone so damn excited about the feature?

There are a few reasons. But the simplest answer is one that has played out time and time again over the past several years: Apple did it right.

¿Sólo eso? ¿Simplemente, Apple lo hizo bien? Eso parece, desde luego. Igual que ocurrió con los reproductores de MP3 -sí, sí, existían antes de los iPod, recuerdo aquellos Archos Jukebox 6000-, igual que ocurrió con los smartphones -ay, Microsoft, cómo la cagaste-, o con los ultraportátiles -los VAIO Z llevan años en el mercado, pero eran tan chulos como prohibitivos-. Apple cogió tendencias y tecnologías que no acababan de funcionar, y consiguió que funcionasen.

Y eso es lo que ha hecho con Siri. La cuestión es: ¿acabaremos usando órdenes de voz en todo momento?

Sinceramente, me parece algo totalmente inevitable, y la solución de Apple ha sido la primera que parece haberse «empaquetado» de la forma adecuada para que la gente la use. Hasta ahora el reconocimiento de voz parecía algo muy destinado a ciertos escenarios -dictar largos textos en ciertas profesiones, minimizar problemas de accesibilidad-, pero con Siri lo del reconocimiento de voz no solo se ha vuelto útil. También es divertido.

No es que hable por hablar: he probado de forma extensiva estas tecnologías en el PC. Durante un par de meses intenté trabajar solo a base de dictar los artículos que escribía con Dragon Naturally Speaking 11, pero la experiencia fue bastante decepcionante.

El fallo estaba en la falta de entrenamiento, sobre todo cuando uno no hace más que mezclar frases normales con palabras técnicas y nombres de empresas o tecnologías que Dragon Naturally Speaking simplemente no pilla. Ni siquiera a base de repetir logré minimizar lo suficiente los fallos como para hacer que el reconocimiento fuese cómodo, así que acabé abandonando mi voz de machote español para los artículos y recurriendo al viejo teclado de perfil bajo.

Obviamente el fallo pudo haber sido también mío, y puede que mi entrenamiento no fuese el adecuado y mi mecánica de aprendizaje fuera perezosa, pero a estas alturas uno esperaría que alguien facilitase la tarea, como Apple parece haberlo hecho con Siri.

Siri no está disponible aún en español -veremos si lo logran sacar rápido, pero yo diría que tardarán una buena temporadita-, pero tras leer unos cuantos artículos sobre el tema decidí a rebuscar un poco en aplicaciones para mi HTC Desire que pudieran darme una experiencia similar. La de las Acciones de Voz de Google para Android es probablemente lo más parecido a Siri, y de hecho en SearchEngineLand han comparado el rendimiento de ambos motores de reconocimiento con una conclusión peculiar:

The introduction of Siri as a marquee feature on the iPhone will change the way people interact with their phones and how competitors are forced to respond. Google, with its already powerful voice assets, doesn€™t have far to go to match or nearly match Siri€™s capabilities. Microsoft also has formidable speech assets but there€™s nothing like Siri or Google Voice Actions on Windows Phones currently. RIM will be compelled to develop something comparable or be left further behind.

Así es: los motores no son tan diferentes en rendimiento, y ambos se comportaron bien. Y teniendo en cuenta que Microsoft ya dispone de una tecnología bastante maja (¿alguien ha oído hablar de Kinect?) yo diría que esta es la gran moda de futuro para terminales móviles.

Lo mejor de todo, queridos niños y niñas, es que por fin tendremos ante nosotros una moda práctica que sí nos cambiará un poquito la vida para mejor, y que nos permitirá ahorrar tiempo y esfuerzo a la hora de interactuar con nuestros terminales móviles.

Bien por Apple y por abrir la veda. Ahora, que los demás se pongan a competir, como está mandado.

Suscríbete a Incognitosis

¡Recibe en tu correo las nuevas entradas!

Standard

7 thoughts on “Siri y el futuro de la telefonía móvil

  1. Por cierto, no es la primera iteración de Siri. Siri como tal es un producto que empezó como tal en 2007, y sacaron su primera versión pública el año pasado. Según recuerdo, tardaron muy poco en Apple en comprar toda la empresa 🙂

    Como Informático «especializado» en Inteligencia Artificial, es muy bueno que el gran público se entusiasme con estas cosas (que como dices tienen bastantes años, pero Apple lo ha puesto todo junto y bonito), eso significa más dinero de I+D.

  2. Alex says:

    Pues parece que sí, que Apple ha vuelto a dar esa vuelta de tuerca a algo que existía pero que no terminaba de ser usable. Los que tenemos en el coche el control de voz al final no lo usamos porque no siempre te acuerdas de los comandos para cada cosa, por ejemplo. Pero si le pudiéramos decir al coche cosas como:

    – Sintoniza los 40, o EuropaFM, o la que sea
    – Hace calor, baja dos grados la temperatura
    – Enciende las luces
    – Pon música clásica, o quiero escuchar a mi grupo preferido

    El secreto está en que Siri no atiende a comandos de voz preestablecidos para entender al ser humano. Le entiende cuando habla de manera natural. Y esto tampoco lo ha inventado Apple, ya existe hace algún tiempo. La culminación de esa IA es el IBM Watson.

    Cada vez que Apple hace algún movimiento coge con el pie cambiado a los competidores. Ahora se habían centrado todos en superar al iPhone en las cosas que éste llevaba ventaja desde hacía años. Y como parece que no debe de quedar ya mucho margen de mejora en esos aspectos, Apple nos vuelve a abrir una puerta a otra dimensión. Google empezó a dar pasos por este camino pero sin la determinación necesaria. Y es que parece que nadie termina de encontrar el camino idóneo hasta que Apple dibuja la carretera.

    Y que todavía haya gente que lo niegue…

    Y quizás el año que viene android disponga de «su propio Siri» mejor que el de Apple incluso…

  3. fartus says:

    ¿Alguien ha verificado el funcionamiento de Siri? ¿Va realmente bien? Mucho hablar de Siri pero no he visto todavía ninguna revisión o prueba a fondo.

  4. lc says:

    ¿Seguro que la gente se lo compra por Siri?
    No creo que nadie me puede acusar de fanboy de Apple, ni de movilitis aguda, pero es que es un buen telefono, incluso sin Siri. Al menos, desde el punto de vista tecnico, el iphone 4 se habia quedado detras del Samsung Galaxy II S, pero es que el iphone 4S esta a su nivel, diferencia aqui, diferencia alli. Seguro que mucha gente que deseaba un iphone estaba esperando la salida de un nuevo iphone y, otros que ya tenian algun iphone anterior, y son usuarios fieles de apple, no se cortan a la hora de comprar. Quizas se estabilicen las ventas cuando el grupo que estaba esperando el cambio tenga sus iphone 4S, o no, je,je, porque como no entiendo lo que esta pasando con Apple.

    saludos

  5. Pingback: El futuro de la telefonía móvil con Apple - Total iOS

  6. miguel jesus rojas caseres says:

    bueno que tal a todos los expertos : mi pregunta y mi duda es la siguiente con tanta tecnologia que esta al servicio de personas normales yo tengo una gran molestia porque escucho tan poco que el telefono celular ya no me sirve de asen tres años y quisiera que saliera un telefono movil capas de traducir la voz a texto en tiempo real vale desir mientras yo voy leyendo lo que me estan ablando del otro lado de la ciudad yo en cambio puedo ablar y la otra persona me escuchara como a cualquier persona normal lo inmensamente grande que lograria una tecnologia de estas caracteristicas seria que incorporaria a muchas personas sordas o ipoacusicas que por accidentes an perdido su audicion como es mi caso pero se leer y ablar sin embargo estoy incomunicado y estoy leyendo pero no logro encontrar algo realmente una solucion ustedes que son muy sabidos en el tema pueden ayudarme y yo podria porfin comprarme mi telefono celular que me escribe en tiempo real mientras alguien se comunica por voz gracias .

Comments are closed.