Tecnología

Tres historias sobre el futuro de la voz

·

Tres señales.

Primera señal

Ayer hablaba con un amigo (¡Hola Daniel!) sobre una reciente viaje a San Francisco. ‘Todo el mundo usa iPhone‘, me confesaba, y añadía que allí el móvil de Apple sigue siendo un símbolo de estatus: por lo visto la clase alta tiraba de iPhone, y los demás casi escondían con vergüenza sus Galaxy S7 (incluido mi amigo, jarl). Eran unos insinceros miserables cutres indignos de sacar el móvil a relucir. Tócate las narices.

Apple y la casta, que diría algún que otro político. Y entre los usuarios confesos de Apple, me señalaba este amigo, algo curioso: WhatsApp no se usa mucho, pero sí Facebook Messenger y, sobre todo, Facetime. A la gente se la ve por todas partes hablando con la aplicación de videochat de Apple, que por lo visto es la que prefieren porque a la gente le encanta lo de ver con quién está hablando. 

Segunda señal

Imaginad a Sally maquetando una web en su iMac con Windows 10. Todo muy profesional. De repente, notificación de WhatsApp al canto. No una notificación cualquiera, no. Un mensaje de voz que, cómo no, proviene de su joven primo Geoffrey, que además de poder presumir de una mata de pelo excepcional, era un fantástico nexo de unión con las nuevas generaciones.

Harry recordaba con cariño aquella conversación en la que de repente empezaron hablando de VHS y Geoffrey preguntó qué era aquello. Benditas nuevas generaciones. El joven y animoso Geoffrey había dominado durante años ese dialecto sin vocales que era propio de la ‘era SMS’ y que también aplicó a WhatsApp. Antes, por supuesto, de pasarse a los mensajes de voz. 

—¿¡Será posible!? Pero bueno, ¡¿Es que este niño no puede escribir un mensaje de WhatsApp sin más!? —masculló mientras decidía si pinchar o no en el iconito del ‘Play’.

—¿Qué ocurre, flor de loto? —bromeó Harry, sabiendo la que se le venía encima.

—Tu primo político Geoffrey, de nuevo, que no para de enviar mensajes de voz. 

—Pues a mí me hacen gracia esos mensajes. Me encanta eso de que nunca sepas muy bien para qué era el mensaje. Eso de empezar a contarte su vida y enrollarse como las persianas mientras pasea por la orilla del Thames es grandioso. 

—Sí sí, si yo me río un montón, pero ¿por qué no escribe lo que quiere decir y listo?

—Fácil. Es más cómodo hacerlo así. 

—Para él, pero no para mí, que tengo que pararlo todo, mover el ratón para darle al ‘Play’  y escuchar un mensaje de un minuto. Un mensaje que además tiene otro problema.

—¿Cuál?

—Pues que no es indexable.

—¿Cómo? —preguntó un anonadado Harry. Qué términos técnicos. Mon dieu.

—Pues que no puedes consultar esos mensajes fácilmente. Si necesito consultar algo que me dijo alguien en WhatsApp, me basta con ir recorriendo el historial. Con los mensajes de Geoffrey no hay manera. Tendría que escucharlos todos de nuevo hasta encontrar lo que necesito. 

—Anda. Pues tienes razón. Da igual, tienes la batalla perdida. 

—¿Por qué?

—Porque la comodidad gana a todo lo demás. Hablar es más fácil que teclear, pero los que estamos un poco más mayorcitos no nos damos cuenta. Nos da vergüenza hacerlo y que la gente nos mire como a bichos raros. A las legiones de seguidores de El Rubius y fanáticas de Snapchat eso les da igual. Incluso puede que eso (no teclear con los deditos) sea visto como algo cool. Teclear es muy retro.

—Maldición —en realidad Sally aquí dijo otra palabra más fea —. Puede que tengas razón, Harry. 

—Como siempre. 

—Como siempre, cabezón mío. 

Tercera señal

Hoy iba en el metro. Yo, Javipas, famoso en el mundo entero, con más de 3.000 seguidores en Twitter, me mezclaba con la prole. Me gusta hacerlo de cuando en cuando, ya sabéis. Por salir de la rutina del teletrabajo un poco. Y porque tenía que ir a la oficina, claro. 😛

En esas estaba. Caminando por esos pasillos grises en los que las prisas suelen ser protagonistas y lo de pararse a respirar o meditar es imposible está mal visto. Así que me acoplé al ritmo como pude, y cuando me dirigía a unas escaleras mecánicas me fijo en la chica que iba delante mío. No por ir con el radar puesto —Sally, ya sabes que yo lo desconecté hace una eternidad— sino porque aquí la amiga iba hablando por videochat. 

Ni siquiera me fijé en si estaba haciéndolo con un iPhone y Facetime, pero supongo que era así. Quizás fuera Skype, o Google Duo (ja), o Viber, o incluso con las nuevas videollamadas de WhatsApp. Ni idea. Lo importante es que allí estaba ella, andando a 8 km/h por los pasillos del metro, hablando con otra persona mientras la veía en pantalla. 

En realidad dudo que viera nada en pantalla: estaba andando a tal velocidad y había tal cantidad de gente y ruido que no era capaz de oír o ver correctamente a su interlocutora, y para hacerlo se acercaba tanto el móvil a la cara que lo único que la otra persona veía de ella era su ceja (recordatorio: depilarme las cejas) o parte de su pómulo. 

La situación era ridícula, pero también premonitoria. 

A mí me parece que las tres señales lo dejan bastante claro. Puede que estemos asistiendo a un punto de inflexión. Uno en el que efectivamente teclear sea algo viejuno. En el que una vez más la comodidad sea ganadora de todas las batallas y haga que superemos miedos para que la voz se imponga como interfaz de uso. Señores y señoras, que no les extrañe ver a los teenagers acercándose el móvil a la cara, porque el futuro no es nuestro, sino de ellos. Y ese futuro no se escribirá. Se dictará. 

Blanco y en botella. 

 

Suscríbete a Incognitosis

¡Recibe en tu correo las nuevas entradas!

Standard

26 comentarios en “Tres historias sobre el futuro de la voz

  1. Yo lo tengo claro hace tiempo, el primer interface cuyo asistente te haga caso de verdad tal y como lo van haciendo últimamente Siri y Google Now… puñetazo en la mesa. Hace no mucho vi una peli, Her creo que era, pues eso.

    Dicho esto, yo tampoco soy capaz de mandar notas de audio de manera habitual, si voy en el coche, dado que el tiempo del semáforo es limitado (en algunos) prefiero mandar nota de audio o en su defecto dictar, pero claro, si dictas tienes que repasar necesariamente, a veces escribe cada gamba digna de recordar.

    Un saludo.

    • Hable de Her hace tiempo y hay quien afirmaba que todos acabaremos con auriculares con el asistente de voz pegados al oído, como apuntaban en la película.

      Lo del reconocimiento tiene que mejorar, como todo, pero yo diría que la cosa va por muy buen camino. Quizás demasiado bueno.

    • Cierto. Probablemente muchos os hayáis dado cuenta, pero es difícil encontrar un análisis de smartphones en los que se analice qué tal se portan esos telefonazos en algo tan simple como las llamadas de voz.

      Qué ironía.

  2. Nogod dice:

    Y digo yo… Cómo un símbolo de status puede llevarlo todo el mundo y seguir siéndolo? Y más allí, claro donde ese símbolo d status se lo puede sacar cualquiera con un plan d operadora. Cualquiera puede pagar un plan de 50 euros al mes, pero un Vertu o un BMW… Eso ya no.

    Por otra parte sobre el tema central, la verdad es que todavía me niego a los mensajes de voz y por supuesto a la pérdida de privacidad que es un video chat. Hasta que no quede mas remedio, seguiré escribiendo sin que nadie tenga que enterarse d mis gilipolleces

    • Pues de la misma forma que marcas de ropa o coches, como dices, lo han conseguido. Una vez se posicionan en ese segmento, logran que asociemos esa marca a cierto status. Es absurdo, pero también inevitable. Por eso Apple no se baja de la burra cuando le piden que saque móviles baratos, por ejemplo.

  3. Anisótropo dice:

    El futuro se dictará, pero también quedará registrado por escrito, pues ya funciona más o menos bien eso de convertir una conversación a texto; puedes hacerlo con cualquier móvil Android.

    Y al revés, también: puedes instalar la aplicación Google TalkBack para que te dicte tus libros de Google Play o Amazon Kindle, aunque el procedimiento no es aún muy intuitivo. Yo lo uso porque mis ojos quedan bastante tocados tras un día de trabajo frente al monitor como para ponerme a leer luego en casa.

    • Cierto. Los sistemas Text-to-Speech y Speech-to-Text están muy avanzados también, así que esa es otra buena razón para potenciar el uso de la voz como interfaz humano-máquina.

    • Vicent dice:

      Y en Microsoft , y los Mac. En ambas plataformas funciona el reconocimiento de voz de forma admirable. Y eso enlaza con lo contado por Javipas. ¿Como me he enterado ? Por mis hijas adolescentes , estudian activando el reconocimiento de voz , leyendo lo que quieren resumir al Air de su madre o al portátil con W10. Con sus «punto seguido » , «puntos aparte» «subrayado «.
      Imprimir y apuntes hechos .
      Y lo de los mensajes de voz de la mensajería instantánea en adolescentes , no os podéis ni imaginar . De repente tu hija se pone el altavoz pegado a la oreja para oír un mensaje de MINUTOS !!!! ; mensajes sin un claro objetivo o tema conversacional, al que contestan de «viva voz» sin ningún pudor ni miramiento .

      Lo dicho , llevas razón , nos hacemos viejos .

  4. Trufeitor dice:

    Lo del metro me ha dejado muerto. En que universo es más fácil hacer vídeo chat mientras caminas que una llamada de voz y el teléfono pegado a la oreja, mientras tus ojos evitan que te dejes la piñata contra un muro? No veo la comodidad en este caso, más bien riesgo de colisión.
    Lo del análisis de llamadas de voz lo he visto en algunos análisis de GSM arena, que diseccionan los teléfonos de arriba a abajo, pero si es cierto que es una función tan simple que se asume que va a ir siempre bien, y creo que salvo en casos muy excepcionales suele ser verdad.

    OFF TOPIC JFYI: Galaxy s7 por 498€ en Media Markt. De llegar y llevártelo puesto (y devolverlo en un par de semanas si no te convence). Por si es el empujón que necesitas para dejar de resistir la tentación. 😉

    • Sí, lo del metro ha sido demasiado. He estado a punto de sacar foto o vídeo, pero probablemente la interlocutora se lo hubiera chivado a la que hablaba 😛

      Gracias por pasar la oferta Trufeitor, buen intento, creo que aguanto!

  5. Aracem dice:

    Magnífico artículo Javi, como siempre.
    Creo que no puedes estar más acertado. Lo del whastapp lo había visto ya e incluso alguna vez me he visto haciéndolo, aún con un poco de vergüenza.
    Llevaba tiempo pensando en esos alexa y Google home, o como estaban apostando de fuerte por los asistentes en el móvil (google incluso ha sacado su propio hardware cuya única exclusividad es…. Un asistente por voz!!%, y me decía «no sé, no sé, será el momento? Si aún nos da vergüenza hablar al móvil!»
    Me acabas de quitar todas las dudas, así de claro.

    Vaya futuro que nos espera más chulo ?

    • Gracias Aracem. Sí, yo cuando vi lo del Amazon Echo me pareció la repanocha. Un inventazo, aunque luego entren a debate los temas sobre privacidad. No sé si será chulo o no (hay ciertos riesgos y efectos colaterales, como en todo) pero desde luego parece que por ahí irán los tiros.

      Saludos!

      • Al leer el título del artículo también pensaba que iba enfocado a los asistentes personales.

        La verdad es que quería probar Amazon Echo con un Raspberry, pero al final creo que me decantaré para algo más sencillo.

        Sin embargo creo que eso de poder hacer cosas simplemente hablando, dará mucho de que hablar, bien pronto. Parece un tema muy avanzado ya

  6. En todo caso, triunfará la voz asíncrona, que es la gran ventaja de comunicarse con mensajes de voz. Tienes tiempo para reflexionar qué quieres responder, y puedes aplazar la respuesta para luego si ahora no te viene bien. La conversación en directo, que ha existido siempre y ha ido siendo desplazada por los chats, te «ataba». Algo que ahora no ocurre.

    1. No teclear.
    2. Responder cuando me parezca bien hacerlo.

    Creo que son las claves.

    • También, también, buen apunte. Pero vamos, ya sabes que en el post lo de los mensajes de voz asíncronos eran solo parte de esa ecuación de futuro. La idea es entender que al final todos acabaremos hablando con nuestros cacharritos como si fuera lo más normal del mundo.

      Porque lo será.

  7. Pepa Valle dice:

    Odio los mensajes de voz y las video llamadas ya ni te cuento.
    Ir en transporte público oyendo a la gente hablar a gritos por teléfono ya es suficiente tortura… Ahora además les tenemos que oír sus mensajes… SOCORRO!!!!
    Por favor respetemos a los demas

    • Ole mi Pepa guapa. Pues sí, tienes toda la razón, esperemos que la razón (¿y la educación?) se impongan y que la gente se corte de hacerlo a todas horas y en todos sitios, porque efectivamente esto se puede convertir en un infierno. Hace tiempo escribí un post gracioso sobre algo parecido, que no igual.

      Gilipolling.

      Te invito (a ti y a todos, claro) a echarle un vistazo 😉

  8. Carlos dice:

    Concuerdo: la voz será más determinante cuanto mejores sean las IA para encomendarles tareas y las gestionen bien. Para comunicarse, le veo una desventaja enorme: se tarda menos en leer que en escuchar. Creo que este aspecto de la comunicación oral está infravalorado. Prefiero que me manden textos a mensajes de voz porque proceso la información mucho más rápido de forma visual que de forma sonora. Puedes leer en diagonal o aumentar la velocidad de lectura pero no puedes aumentar la velocidad de escucha sin alterar el archivo de voz. Por otra parte, hay otras desventajas: los archivos de voz no permiten copiar y pegar segmentos de información; ni se pueden formatear para destacar partes etc. Supongo que la voz tendrá su lugar y el texsto el suyo.

    • Creo que en algún momento habrá algún sistema que haga que WhatsApp convierta a texto esos mensajes de voz para hacerlo «registrable» y meterlo mejor en sus históricos, pero efectivamente esos mensajes tienen muchas pegas.

      De todos modos, insisto: en el futuro del que hablo no hablo solo de mensajes de voz como los de Geoffrey: la conclusión es que al final la interacción por voz para comunicarnos con máquinas será totalmente cotidiana.

  9. Daniel C. dice:

    Da gusto leer no sólo tu blog sino también los comentarios, Javi. Muy buenos y complementarios.
    Lo de comunicarse con mensajes de voz efectivamente lo veo mucho entre chavales muy jóvenes y me parece un poco tontainas frente a una llamada telefónica y sólo entiendo que pueda ser por ahorrarse los minutos de la llamada de voz, por estas estrategias de precios siempre un poco confusas de las telecos. Yo como tengo llamadas ilimitadas ni me lo planteo y si quiero comunicarme por voz, llamo y tengo el doble canal de comunicación abierto.
    Soy muy defensor de la llamada de voz porque incorpora mucha más información que el puro texto, pero cierto es que el texto es más rápido y sobre todo tiene desde mi punto de vista la ventaja de que a quien escribo no le voy a molestar en el momento, y ya lo leerá y responderá cuando le venga bien, mientras que al llamarle puedo interrumpir, y entonces la conversación no será tan favorable para ninguno de los dos.
    Y muy buen apunte el de SAMFDZ al recordar que la ventaja de la mensajería tanto de texto como de voz permite pensarse las respuestas mejor.
    Por último, un tema que me parece muy relevante es lo que te dijo Sally sobre poder buscar los mensajes de texto. Con esto de comunicarse por WhatsApp o similares, estamos registrando conversaciones banales y pensadas para caducar en el momento, y se abre la posibilidad de utilizarlas a futuro… El pasado nos va a perseguir por siempre jamás. (Ojo, dile a Sally que estoy totalmente de acuerdo con ella, que a mí también me desespera que me manden mensajes de voz también por ese motivo, aparte de que sean más lentos de escuchar que de leeer).

    • Gracias a ti Daniel, que para eso has sido parte de la historia 😉 No sé si es tontainas, pero desde luego es más incómodo para el que recibe el mensaje. En cierto sentido es como las llamadas: cuando llamas a alguien no piensas si le estarás interrumpiendo, necesitas hablar con él por lo que sea y llamas. Ambas son formas «egoistas» de comunicarse, en un caso porque obligas a la otra parte a perder más tiempo del estrictamente necesario, y en otra por no pensar en que puedes molestar.

      Al final esto es como todo: cada opción tiene sus ventajas y desventajas y, por supuesto, su momento. Todo sería perfecto si las usásemos bien, pero más que usarlas, abusamos de ellas.

  10. Conocido + dice:

    Jeje una grandisima verdad, grande como una casa.
    Yo viajo mucho en metro y efectivamente cada vez mas se ve a la gente hablandole al telefono, pegado a la nariz, en un principio pensaba que era videocall, pero en realidad lo que hacen es grabar mensajes voz!

Comentarios cerrados