Tecnología

Auge y caída de los asistentes de voz

Todos nos veíamos en plan Joaquin Phoenix. Ya sabéis, hablando con una máquina. Igual no enamorándonos de ella, pero sí hablando con ella como si tal cosa. Era 2013 y el auge de los asistentes de voz estaba en ciernes.

De hecho existía una clara apuesta por esa tecnología. Siri debutó en 2011, Google Now en 2012 (se convertiría en un mucho más potente Google Assistant en 2016), Cortana en 2013 y Alexa en 2014. Habría otros (cof, Bixby, cof), y lo que parecía un elemento simpático para interactuar con el ordenador se convirtió en un elemento aún más simpático para interactuar con el móvil.

Y de repente fue más allá. De algo accesorio se convirtió en el argumento para crear una nueva división de dispositivos: los altavoces inteligentes. Como todo lo que suele llevar ese calificativo, de inteligentes esos altavoces tenían (y tienen) poco. Aún así, los asistentes de voz iban mejorando y puliéndose. Iban haciendo cada vez más cosas y mejor hechas. Bueno, menos Siri, que iba a lo suyo.

Pero Alexa y Google Assistant, desde luego, nos asombraban cada poco tiempo. El primero, por su modularidad: la posibilidad de crear y usar «Skills» para adaptar su uso a ciertas situaciones era una chulada, mientras que Google iba aún más allá con un asistente que no solo conversaba cada vez mejor, sino que era capaz de adoptar rasgos del habla humana.

De repente, todo empezó a incluir soporte para asistentes de voz. No eran ya solo los altavoces, los ordenadores, los móviles y tabletas o los relojes. Eran las bombillas, los enchufes, los robots aspiradores, las neveras, las Smart TVs, y los dongles HDMI tipo Chromecast o Fire TV. Qué maravilla: podíamos hablarle a todos ellos.

Pero… ¿lo hacemos? No.

Esa es la triste conclusión. No hablamos con nuestros asistentes de voz. Como mucho les preguntamos el tiempo y les decimos que nos pongan una canción. Todo el esfuerzo de las Amazon y Google del mundo se ha quedado limitado a peticiones súper básicas que distan mucho de ese futuro utópico que nos pintan las películas. Uno en los que hablamos con las máquinas para cualquier cosa porque pulsar botones está sobrevalorado.

Pues resulta que no. Preferimos pulsar botones. Fïsicos o virtuales, da igual. O teclas, claro. Lo de usar la voz con las máquinas no es de momento lo nuestro, y esa apuesta le está saliendo muy mal a quienes la han hecho.

Lo confirmaba Amazon recientemente, que calificaba a Alexa de un «fallo colosal» con el que perderían 10.000 millones de dólares este año. Se dice pronto. La crisis de esa división de Amazon es terrible y tal y como están las cosas en la economía, perder esa cantidad de pasta (o cualquier otra) no es ya asumible. ¿Qué ocurrirá entonces? Pues que por lo visto Amazon se cargará la división (o gran parte de ella).

Eso plantea un futuro muy negro para los dispositivos de la familia Echo. No tengo claro que dentro de 5 o 10 años esos altavoces tan monos puedan funcionar como lo hacen hoy en día, porque si Amazon está tan cansada del tema puede que acabe desactivando los servidores que se usaban para las funciones de Alexa, a saber. Me imagino la conversación:

– Alexa, ¿qué tiempo va a hacer hoy?

-Error 500.

Y así con todo. O quizás no. Google no parece haber movido ficha, pero Microsoft ya mató Cortana al no poder competir -probablemente estén aliviados ahora mismo- y Apple nunca se ha esforzado demasiado con Siri. Ni siquiera han invertido demasiado en sus HomePod con ese asistente de voz, quizás porque detectaron que nadie usaba demasiado su asistente.

Yo quería creer en los asistentes de voz, pero ya decía en 2015 que me daba vergüenza hablarle a mi smartphone. Y lo mismo me pasa con los altavoces inteligentes que tengo en casa: parece que estoy enfadado con el Amazon Echo de 4ª generación y el Nest Mini, pero no es así. Simplemente, no los uso. Los compré casi como experimento, pero siempre los tengo con el micrófono desactivado por mi particular paranoia con la privacidad y me cuesta un horror activarlo y decirles algo.

Sé positivamente que hay gente que los usa. Que se pone la música, las noticias, la radio o un podcast mientras cocina. O que le grita a la tele para que reproduzca una serie. Pero diría que son la minoría, y no estoy seguro de que las nuevas generaciones estén cambiando ese hábito. Es cierto que mis hijos se llevan algo mejor con el Amazon Echo, por ejemplo, pero es más porque de cuando en cuando lo usan en plan juguete -«Alexa, cuéntame un chiste»-.

Aún así, el problema para las empresas como Amazon está en que no había forma fácil de monetizar un asistente de voz. Lo de recolectar tu voz para según qué cosas era impensable -ya hubo polémica al respecto-, y no parece tener sentido que el altavoz nos interrumpa cada tres por cuatro y nos salte de buenas a primeras con un anuncio que no hemos pedido. Amazon confesaba que ni gana ni pierde dinero con estos dispositivos, y sin servicios asociados que den retorno, la idea tiene (parece) poco recorrido a largo plazo. Sin rentabilidad, los proyectos mueren.

Diría que uno de los grandes fracasos de esta tecnología es la de no entender el lenguaje natural. Somos nosotros los que tenemos que aprender cómo hablar con los asistentes, y aunque la cosa no es complicada, eso es un obstáculo. No tenemos esa costumbre ni esa cultura, pero sí la del botón. Con esa sí nos sentimos seguros y cómodos. Con esa sabemos interactuar.

Quizás falte solo eso. Tiempo. De momento lo cierto es que ese futuro que nos pintaban los asistentes, tan peliculero, tan estupendo, está muy lejos de hacerse realidad. No diré que los asistentes están muertos, desde luego, pero la expectación e interés que generaban hace un tiempo se ha difuminado lenta pero inexorablemente.

O eso parece. Veremos.

Vaya, acabo de ver que publiqué una reflexión muy parecida el año pasado. Maldición, empiezo a repetirme.

¿Quieres recibir un correo de aviso cuando publique nuevas entradas?

Standard

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

13 comentarios en “Auge y caída de los asistentes de voz

  1. Batlander dice:

    Creo que para lo unico que he usado estas cosas es para decir play, para o sube el volumen (y me da vergüenza decir «oye Siri, sube el volumen» cuando tengo gente al lado la verdad) y en un Android TV para suplir al teclado. Ese ha sido mi periplo con la IA de esta peña.

    Por cierto, lo de los botones que dices me ha recordado un poco a lo que hacen ahora en los coches. Quieren cargarse todos los botones fisicos y que uses la pantalla o la Alexa de turno. Todo para reducir costes ojo, que una pantalla un un plasticucho es diez beces mas barato que unos buenos botones. Lo cual me toca mucho las narices porque, ademas de mas incomodo, me parece mas inseguro. Tenemos constantemente a burocratas haciendo paridas (como lo del cable USB C o las cookies) pero para algo que realmente veo importanto ni se enteran.

  2. Ana dice:

    Ni me he planteado los altavoces de Google, el único uso que hago del asistente de voz del móvil es cuando estoy en el coche, y los resultados son mejorables en el momento en que te sales de las aplicaciones de Google. Sí que es cierto que con Google Maps o con llamadas de teléfono a mis contactos funciona bastante bien, pero para poner música, por ejemplo, no uso Youtube Music, y cuando lo intenté ni VLC ni MediaMonkey, las dos aplicaciones que uso para escuchar música, eran reconocidas por el asistente.
    Y utilizar Waze en vez de Google Maps tampoco me daba buenos resultados, es posible que porque Waze no lo he utilizado tanto, por lo que no tiene aprendidas mis preferencias, mientras que Google aunque no quiera lo sabe todo sobre mí, pero al final el resultado es que dejo todo configurado antes de arrancar, y el asistente apenas lo uso.

    • Sí, yo ni siquiera en el coche lo uso mucho salvo para decirle la dirección (y no siempre la pilla bien). Supongo que es cuestión de acostumbrarse a usarlo también -yo me rendí pronto con esto- pero aun así no soy muy amigo de estar hablándole al móvil, ni dentro ni fuera del coche.

  3. Pingback: Auge y caída de los asistentes de voz – Incognitosis – Baúl de Noticias: Tecnología

  4. El Alexa yo lo tengo en la cocina (sé que eres casi cero cocinillas por la historia del TMX) y me resulta super cómodo poder interactuar sin usar las manos que están ocupadas o manchadas. Es un entorno donde tiene sentido y no veo que se haya aprovechado mucho. Los skill que probé de recetas no me convencieron pero podría tener su potencial … ¿elegir recetas y que amazon haga el pedido de los ingredientes y luego seguir los pasos el día que recibimos el pedido? ¿menús de fin de semana? ¿cenas especiales?
    Creo que muchos desarrollos se han abandonado hay Skill que ya no funcionan, no conectan o dan errores sin sentido. Una pena, a mí sí me gustaba y le damos bastante uso en casa.

    • Es una pequeña tragedia, ciertamente. A mí los skills me parecen una ideaza y creo que efectivamente uno de los lugares perfectos de estos altavoces inteligentes es la cocina para ayudar con recetas o simplemente ponerte música o un podcast. Yo no los uso así, pero intuyo que mucha gente sí, aunque de nuevo al final la interacción de voz sea bastante limitada. Ese es el problema, que al final usamos Alexa para cuatro chorradas y Amazon se ha gastado mucha pasta sin que se vea retorno económico en ese sentido. Mal negocio.

  5. fbustamante dice:

    Por mi parte lo que me pasa es que no me entiende.

    Y si tengo que aprender a hablar su lenguaje para hacer lo mismo que hago dándole a un botón, pues tardo menos en darle al botón.

    Aquí lo compramos por probar, y la nueva tele los trae todos.

    Intentamos usarlos y acabamos dando al botón: más rápido y más cómodo.

    Subir y bajar el volumen o apagarla muy bien. Pero poner un canal específico era misión imposible.

  6. rimbener dice:

    Yo para casi lo único que lo uso es para encender/apagar luces, tengo toda la casa con lámparas Wiz y me es útil para eso. Pero el resto de las funciones no las uso, ni siquiera para los recordatorios.

  7. Pingback: El móvil es el dispositivo eterno | Incognitosis