Tecnología

Tres historias sobre el futuro de la voz

·

Tres señales.

Primera señal

Ayer hablaba con un amigo (¡Hola Daniel!) sobre una reciente viaje a San Francisco. ‘Todo el mundo usa iPhone‘, me confesaba, y añadía que allí el móvil de Apple sigue siendo un símbolo de estatus: por lo visto la clase alta tiraba de iPhone, y los demás casi escondían con vergüenza sus Galaxy S7 (incluido mi amigo, jarl). Eran unos insinceros miserables cutres indignos de sacar el móvil a relucir. Tócate las narices.

Apple y la casta, que diría algún que otro político. Y entre los usuarios confesos de Apple, me señalaba este amigo, algo curioso: WhatsApp no se usa mucho, pero sí Facebook Messenger y, sobre todo, Facetime. A la gente se la ve por todas partes hablando con la aplicación de videochat de Apple, que por lo visto es la que prefieren porque a la gente le encanta lo de ver con quién está hablando. 

Segunda señal

Imaginad a Sally maquetando una web en su iMac con Windows 10. Todo muy profesional. De repente, notificación de WhatsApp al canto. No una notificación cualquiera, no. Un mensaje de voz que, cómo no, proviene de su joven primo Geoffrey, que además de poder presumir de una mata de pelo excepcional, era un fantástico nexo de unión con las nuevas generaciones.

Harry recordaba con cariño aquella conversación en la que de repente empezaron hablando de VHS y Geoffrey preguntó qué era aquello. Benditas nuevas generaciones. El joven y animoso Geoffrey había dominado durante años ese dialecto sin vocales que era propio de la ‘era SMS’ y que también aplicó a WhatsApp. Antes, por supuesto, de pasarse a los mensajes de voz. 

—¿¡Será posible!? Pero bueno, ¡¿Es que este niño no puede escribir un mensaje de WhatsApp sin más!? —masculló mientras decidía si pinchar o no en el iconito del ‘Play’.

—¿Qué ocurre, flor de loto? —bromeó Harry, sabiendo la que se le venía encima.

—Tu primo político Geoffrey, de nuevo, que no para de enviar mensajes de voz. 

—Pues a mí me hacen gracia esos mensajes. Me encanta eso de que nunca sepas muy bien para qué era el mensaje. Eso de empezar a contarte su vida y enrollarse como las persianas mientras pasea por la orilla del Thames es grandioso. 

—Sí sí, si yo me río un montón, pero ¿por qué no escribe lo que quiere decir y listo?

—Fácil. Es más cómodo hacerlo así. 

—Para él, pero no para mí, que tengo que pararlo todo, mover el ratón para darle al ‘Play’  y escuchar un mensaje de un minuto. Un mensaje que además tiene otro problema.

—¿Cuál?

—Pues que no es indexable.

—¿Cómo? —preguntó un anonadado Harry. Qué términos técnicos. Mon dieu.

—Pues que no puedes consultar esos mensajes fácilmente. Si necesito consultar algo que me dijo alguien en WhatsApp, me basta con ir recorriendo el historial. Con los mensajes de Geoffrey no hay manera. Tendría que escucharlos todos de nuevo hasta encontrar lo que necesito. 

—Anda. Pues tienes razón. Da igual, tienes la batalla perdida. 

—¿Por qué?

—Porque la comodidad gana a todo lo demás. Hablar es más fácil que teclear, pero los que estamos un poco más mayorcitos no nos damos cuenta. Nos da vergüenza hacerlo y que la gente nos mire como a bichos raros. A las legiones de seguidores de El Rubius y fanáticas de Snapchat eso les da igual. Incluso puede que eso (no teclear con los deditos) sea visto como algo cool. Teclear es muy retro.

—Maldición —en realidad Sally aquí dijo otra palabra más fea —. Puede que tengas razón, Harry. 

—Como siempre. 

—Como siempre, cabezón mío. 

Tercera señal

Hoy iba en el metro. Yo, Javipas, famoso en el mundo entero, con más de 3.000 seguidores en Twitter, me mezclaba con la prole. Me gusta hacerlo de cuando en cuando, ya sabéis. Por salir de la rutina del teletrabajo un poco. Y porque tenía que ir a la oficina, claro. 😛

En esas estaba. Caminando por esos pasillos grises en los que las prisas suelen ser protagonistas y lo de pararse a respirar o meditar es imposible está mal visto. Así que me acoplé al ritmo como pude, y cuando me dirigía a unas escaleras mecánicas me fijo en la chica que iba delante mío. No por ir con el radar puesto —Sally, ya sabes que yo lo desconecté hace una eternidad— sino porque aquí la amiga iba hablando por videochat. 

Ni siquiera me fijé en si estaba haciéndolo con un iPhone y Facetime, pero supongo que era así. Quizás fuera Skype, o Google Duo (ja), o Viber, o incluso con las nuevas videollamadas de WhatsApp. Ni idea. Lo importante es que allí estaba ella, andando a 8 km/h por los pasillos del metro, hablando con otra persona mientras la veía en pantalla. 

En realidad dudo que viera nada en pantalla: estaba andando a tal velocidad y había tal cantidad de gente y ruido que no era capaz de oír o ver correctamente a su interlocutora, y para hacerlo se acercaba tanto el móvil a la cara que lo único que la otra persona veía de ella era su ceja (recordatorio: depilarme las cejas) o parte de su pómulo. 

La situación era ridícula, pero también premonitoria. 

A mí me parece que las tres señales lo dejan bastante claro. Puede que estemos asistiendo a un punto de inflexión. Uno en el que efectivamente teclear sea algo viejuno. En el que una vez más la comodidad sea ganadora de todas las batallas y haga que superemos miedos para que la voz se imponga como interfaz de uso. Señores y señoras, que no les extrañe ver a los teenagers acercándose el móvil a la cara, porque el futuro no es nuestro, sino de ellos. Y ese futuro no se escribirá. Se dictará. 

Blanco y en botella. 

 


Incognichollos

Esta es una selección con las mejores ofertas tecnológicas actualizadas casi diariamente, como expliqué aquí. Aunque estés en un post «antiguo» las ofertas son de última hora, los Incognichollos los actualizo aparte. También puedes seguir los Incognichollos en Twitter o en el nuevo canal de Telegram 🙂 . Aprovecha, que no suelen durar mucho tiempo.

  • OnePlus 7: la evolución del 6T con 6,41?, Snapdragon 855, 8 GB de RAM, mininotch, 256 GB de capacidad (uauh), cámara dual 48+5, 3700 mAh de batería, huella en pantalla. Está a 437,49 euros en AliExpress.
  • Lenovo Yoga 920: un convertible de 13,9 pulgadas con un Core i5-8250U, 8 GB de RAM, 256 GB SSD y Windows 10. Estupendo a este precio, 749,98 euros en Amazon.
  • Auriculares Sennheiser Momentum 2.0: diadema ajustable, micrófono incorporado, diseño chulísimo y una calidad de sonido top según dicen las críticas. Nunca los había visto tan baratos, 108 euros en Amazon Alemania, envío incluido.
  • Altavoz Bluetooth Xiaomi Square Box II: un altavoz portátil con tecnología Bluetooth 4.2, micrófono, manos libres, cancelación de ruido, 1200 mAh, autonomía 10 horas, incluye entrada de minijack de 3,5 mm. Está a 21 euros en Banggood con el código e2db5f
  • Huawei Honor Band 4: con pantalla AMOLED de 0,95?, monitor de sueño, soporte de natación (reconoce distintas brazadas), hasta 50 m de profundidad, lector de frecuencia cardíaca. Muy chula por 24,90 euros en Banggood con el código BGHWBand4es.
  • Xiaomi Mi Band 4: la nueva pulsera cuantificadora con pantalla AMOLED 0,95?, hasta 50 m profundidad y 5 ATM, sensor cardíaco, comandos de voz, notificaciones, brutal por 30,9 euros en AliExpress.
  • OnePlus 7 Pro: el súper teléfono a tope: 6,67 pulgadas a 90 Hz (dicen que son la pera), 8 GB de RAM, 256 GB de capacidad, cámara triple (48+16+8), cámara frontal retráctil 16 MP, lector de huella en apntalla, 4.000 mAh. Está a 657 euros en GearBest.
  • Medion Ultrafino S6445: un ultrabook de 15,6? FullHD con un Core i3-8145U, 8 GB de RAM y 256 GB de capacidad, teclado QWERTY español, Windows 10 Home. Todo por 399,99 euros en Amazon, estupendo.
  • Monitor gaming ASUS MG248QR: con 24 pulgadas y resolución 1080p, pero sobre todo con soporte de tasa de 144 Hz. Fantástico por 239,99 euros en Amazon (299 en PCComponentes).
  • SSD Samsung 2 TB: una unidad SSD con esta capacidad y a este precio es tela. Velocidades de 550 MB/s, está a 195 euros en Amazon Francia, envío incluido.
  • Portátil ASUS VivoBook S14: un 14? Ful HD con un Core i5-8265U, 8 GB de RAM, 256 GB de SSD, teclado español y Windows. El touchpad es además teclado numérico. Está a 499,99 euros en Amazon.
  • Mando Sony DualShock 4 para PS4: el mando en versión 2, inalámbrico, color negro, está a 37,99 euros en Amazon.
  • Windows 10 Pro: una licencia para el sistema operativo de Microsoft. Te la mandan por correo junto a algunas instrucciones. Está a 3 euros en Amazon.
  • Xiaomi Mi 9: si queréis el telefonazo de Xiaomi, atentos. Pantalla de 6,39 euros sin marcos, Snapdargon 855, 6 GB de RAM, 64 GB de capacidad, cámara triple de 48+16+12 MP, está a 384,74 euros en Banggood con el código BG6M9128.
  • iPhone X 256 GB: el telefonazo de Apple del año pasado sigue siendo un gran terminal. 5,8?, Apple A11 Bionic, 3 GB de RAM, 256 GB de capacidad, cámara dual de 12 MP, está a 899 euros en Amazon (1.089 precio normal).
  • OPPO Realme X: el rival a batir en gama media rompedora. Tremendo, 6,53? sin marcos, Snapdragon 710, 4 GB de RAM, 64 GB de capacidad, cámara dual 48+5, cámara frontal periscópica, 3765 mAh, lector de huellas en pantalla. Brutal por 236,45 euros en Banggood.
  • Xiaomi Redmi Note 7: 6,3» Snapdragon 660, 4 GB de RAM, 128 GB de capacidad (ampliables vía MicroSD), 4.000 mAh, minijack y cámara dual de 48+5 MP realmente estupendo por 180,95 euros en Banggood con el código BG5RN74. La versión de 3/32 está a 141 euros en AliExpress, y la de 4/64 está a 163 euros en Banggood con el código BG5RN7.
  • iPad Air (2019): atentos a la nueva versión de la tableta con pantalla de 10,5? y el potente procesador A12 Bionic, además de cámara de 8 MP y 256 GB de capacidad. A tope por 591,06 euros en Amazon (719 en Apple).
  • Xiaomi Mi 9 SE: y la versión compacta: 5,97 pulgadas, Snapdragon 712, 6 GB de RAM, 64 GB de capacidad, triple cámara (48+12+16), lector de huella en pantalla, está a 266,61 euros en Banggood con el cupón 5BGM96SE. Brutal.
  • Portátil HP Pavilion 15-bc450ns: un equipo de 15,6? Full HD con un Core i5-8300H, 8 GB de RAM, 1 TB de HDD, 128 GB SSD (uauh) y GeForce GTX 1050 (uauh!), sin Windows (hay incognichollo ahí de 1,5 euros para resolver). Está a 629,99 euros en Amazon.
  • Unidad SSD Lexar 120 GB: modelo SATA 6 GB/s, hasta 550 MB/s de velocidad de lectura, fantástico como complemento para tu PC o portátil sobre todo a este precio mísero: 21,29 euros en Amazon. La versión de 240 GB, a 36,19 euros.
  • Asus ZenFone 6: el nuevo telefonazo de Asus con pantalla sin marcos de 6,4 pulgadas, 6 GB de RAM, 64 GB de capacidad y esa cámara desplegable dual que funciona tanto como frontal como trasera. Está a 477 euros en GearBest
  • Xbox One S Digital + 3 juegos: la consola de Microsoft sin unidad de Blu-ray incluye un mando y Minecraft, Sea of Thieves y Forza Horizon 3. Está a 175 euros en AliexpressPlaza con el código «plazaoff«. Envío desde España, 2 años garantía.
  • HP Noteboook 15: portátil de 15,6 pulgadas HD (1366×768, el único fallito), CPU AMD A9-9425 (tipo Celeron), 12 GB de RAM, 256 GB de SSD, Windows 10, teclado español. Modesto en CPU y pantalla pero muy bien lo demás, el precio mola: 449,99 euros en Amazon.
  • Tablet Amazon Fire 7: la renovada tableta de Amazon con mejor procesador y sobre todo con el doble de capacidad que el modelo de 2017. La versión de 16 GB (ampliable vía microSD) está a tan solo 69,99 euros en Amazon.
  • Bolígrafo Xiaomi Mijia Pen + 3 recambios: el boli de 0,5 mm con tecnología suiza (o eso dicen) que enamora. Yo ya he comprado varios, y la verdad es que molan, y por este precio, más. El boli + tres recambios sale por 3,41 en AliExpress.

¿Quieres recibir un correo de aviso cuando publique nuevas entradas?

Standard

26 comentarios en “Tres historias sobre el futuro de la voz

  1. Yo lo tengo claro hace tiempo, el primer interface cuyo asistente te haga caso de verdad tal y como lo van haciendo últimamente Siri y Google Now… puñetazo en la mesa. Hace no mucho vi una peli, Her creo que era, pues eso.

    Dicho esto, yo tampoco soy capaz de mandar notas de audio de manera habitual, si voy en el coche, dado que el tiempo del semáforo es limitado (en algunos) prefiero mandar nota de audio o en su defecto dictar, pero claro, si dictas tienes que repasar necesariamente, a veces escribe cada gamba digna de recordar.

    Un saludo.

    • Hable de Her hace tiempo y hay quien afirmaba que todos acabaremos con auriculares con el asistente de voz pegados al oído, como apuntaban en la película.

      Lo del reconocimiento tiene que mejorar, como todo, pero yo diría que la cosa va por muy buen camino. Quizás demasiado bueno.

    • Cierto. Probablemente muchos os hayáis dado cuenta, pero es difícil encontrar un análisis de smartphones en los que se analice qué tal se portan esos telefonazos en algo tan simple como las llamadas de voz.

      Qué ironía.

  2. Nogod dice:

    Y digo yo… Cómo un símbolo de status puede llevarlo todo el mundo y seguir siéndolo? Y más allí, claro donde ese símbolo d status se lo puede sacar cualquiera con un plan d operadora. Cualquiera puede pagar un plan de 50 euros al mes, pero un Vertu o un BMW… Eso ya no.

    Por otra parte sobre el tema central, la verdad es que todavía me niego a los mensajes de voz y por supuesto a la pérdida de privacidad que es un video chat. Hasta que no quede mas remedio, seguiré escribiendo sin que nadie tenga que enterarse d mis gilipolleces

    • Pues de la misma forma que marcas de ropa o coches, como dices, lo han conseguido. Una vez se posicionan en ese segmento, logran que asociemos esa marca a cierto status. Es absurdo, pero también inevitable. Por eso Apple no se baja de la burra cuando le piden que saque móviles baratos, por ejemplo.

  3. Anisótropo dice:

    El futuro se dictará, pero también quedará registrado por escrito, pues ya funciona más o menos bien eso de convertir una conversación a texto; puedes hacerlo con cualquier móvil Android.

    Y al revés, también: puedes instalar la aplicación Google TalkBack para que te dicte tus libros de Google Play o Amazon Kindle, aunque el procedimiento no es aún muy intuitivo. Yo lo uso porque mis ojos quedan bastante tocados tras un día de trabajo frente al monitor como para ponerme a leer luego en casa.

    • Cierto. Los sistemas Text-to-Speech y Speech-to-Text están muy avanzados también, así que esa es otra buena razón para potenciar el uso de la voz como interfaz humano-máquina.

    • Vicent dice:

      Y en Microsoft , y los Mac. En ambas plataformas funciona el reconocimiento de voz de forma admirable. Y eso enlaza con lo contado por Javipas. ¿Como me he enterado ? Por mis hijas adolescentes , estudian activando el reconocimiento de voz , leyendo lo que quieren resumir al Air de su madre o al portátil con W10. Con sus «punto seguido » , «puntos aparte» «subrayado «.
      Imprimir y apuntes hechos .
      Y lo de los mensajes de voz de la mensajería instantánea en adolescentes , no os podéis ni imaginar . De repente tu hija se pone el altavoz pegado a la oreja para oír un mensaje de MINUTOS !!!! ; mensajes sin un claro objetivo o tema conversacional, al que contestan de «viva voz» sin ningún pudor ni miramiento .

      Lo dicho , llevas razón , nos hacemos viejos .

  4. Trufeitor dice:

    Lo del metro me ha dejado muerto. En que universo es más fácil hacer vídeo chat mientras caminas que una llamada de voz y el teléfono pegado a la oreja, mientras tus ojos evitan que te dejes la piñata contra un muro? No veo la comodidad en este caso, más bien riesgo de colisión.
    Lo del análisis de llamadas de voz lo he visto en algunos análisis de GSM arena, que diseccionan los teléfonos de arriba a abajo, pero si es cierto que es una función tan simple que se asume que va a ir siempre bien, y creo que salvo en casos muy excepcionales suele ser verdad.

    OFF TOPIC JFYI: Galaxy s7 por 498€ en Media Markt. De llegar y llevártelo puesto (y devolverlo en un par de semanas si no te convence). Por si es el empujón que necesitas para dejar de resistir la tentación. 😉

    • Sí, lo del metro ha sido demasiado. He estado a punto de sacar foto o vídeo, pero probablemente la interlocutora se lo hubiera chivado a la que hablaba 😛

      Gracias por pasar la oferta Trufeitor, buen intento, creo que aguanto!

  5. Aracem dice:

    Magnífico artículo Javi, como siempre.
    Creo que no puedes estar más acertado. Lo del whastapp lo había visto ya e incluso alguna vez me he visto haciéndolo, aún con un poco de vergüenza.
    Llevaba tiempo pensando en esos alexa y Google home, o como estaban apostando de fuerte por los asistentes en el móvil (google incluso ha sacado su propio hardware cuya única exclusividad es…. Un asistente por voz!!%, y me decía «no sé, no sé, será el momento? Si aún nos da vergüenza hablar al móvil!»
    Me acabas de quitar todas las dudas, así de claro.

    Vaya futuro que nos espera más chulo ?

    • Gracias Aracem. Sí, yo cuando vi lo del Amazon Echo me pareció la repanocha. Un inventazo, aunque luego entren a debate los temas sobre privacidad. No sé si será chulo o no (hay ciertos riesgos y efectos colaterales, como en todo) pero desde luego parece que por ahí irán los tiros.

      Saludos!

      • Al leer el título del artículo también pensaba que iba enfocado a los asistentes personales.

        La verdad es que quería probar Amazon Echo con un Raspberry, pero al final creo que me decantaré para algo más sencillo.

        Sin embargo creo que eso de poder hacer cosas simplemente hablando, dará mucho de que hablar, bien pronto. Parece un tema muy avanzado ya

  6. En todo caso, triunfará la voz asíncrona, que es la gran ventaja de comunicarse con mensajes de voz. Tienes tiempo para reflexionar qué quieres responder, y puedes aplazar la respuesta para luego si ahora no te viene bien. La conversación en directo, que ha existido siempre y ha ido siendo desplazada por los chats, te «ataba». Algo que ahora no ocurre.

    1. No teclear.
    2. Responder cuando me parezca bien hacerlo.

    Creo que son las claves.

    • También, también, buen apunte. Pero vamos, ya sabes que en el post lo de los mensajes de voz asíncronos eran solo parte de esa ecuación de futuro. La idea es entender que al final todos acabaremos hablando con nuestros cacharritos como si fuera lo más normal del mundo.

      Porque lo será.

  7. Pepa Valle dice:

    Odio los mensajes de voz y las video llamadas ya ni te cuento.
    Ir en transporte público oyendo a la gente hablar a gritos por teléfono ya es suficiente tortura… Ahora además les tenemos que oír sus mensajes… SOCORRO!!!!
    Por favor respetemos a los demas

    • Ole mi Pepa guapa. Pues sí, tienes toda la razón, esperemos que la razón (¿y la educación?) se impongan y que la gente se corte de hacerlo a todas horas y en todos sitios, porque efectivamente esto se puede convertir en un infierno. Hace tiempo escribí un post gracioso sobre algo parecido, que no igual.

      Gilipolling.

      Te invito (a ti y a todos, claro) a echarle un vistazo 😉

  8. Carlos dice:

    Concuerdo: la voz será más determinante cuanto mejores sean las IA para encomendarles tareas y las gestionen bien. Para comunicarse, le veo una desventaja enorme: se tarda menos en leer que en escuchar. Creo que este aspecto de la comunicación oral está infravalorado. Prefiero que me manden textos a mensajes de voz porque proceso la información mucho más rápido de forma visual que de forma sonora. Puedes leer en diagonal o aumentar la velocidad de lectura pero no puedes aumentar la velocidad de escucha sin alterar el archivo de voz. Por otra parte, hay otras desventajas: los archivos de voz no permiten copiar y pegar segmentos de información; ni se pueden formatear para destacar partes etc. Supongo que la voz tendrá su lugar y el texsto el suyo.

    • Creo que en algún momento habrá algún sistema que haga que WhatsApp convierta a texto esos mensajes de voz para hacerlo «registrable» y meterlo mejor en sus históricos, pero efectivamente esos mensajes tienen muchas pegas.

      De todos modos, insisto: en el futuro del que hablo no hablo solo de mensajes de voz como los de Geoffrey: la conclusión es que al final la interacción por voz para comunicarnos con máquinas será totalmente cotidiana.

  9. Daniel C. dice:

    Da gusto leer no sólo tu blog sino también los comentarios, Javi. Muy buenos y complementarios.
    Lo de comunicarse con mensajes de voz efectivamente lo veo mucho entre chavales muy jóvenes y me parece un poco tontainas frente a una llamada telefónica y sólo entiendo que pueda ser por ahorrarse los minutos de la llamada de voz, por estas estrategias de precios siempre un poco confusas de las telecos. Yo como tengo llamadas ilimitadas ni me lo planteo y si quiero comunicarme por voz, llamo y tengo el doble canal de comunicación abierto.
    Soy muy defensor de la llamada de voz porque incorpora mucha más información que el puro texto, pero cierto es que el texto es más rápido y sobre todo tiene desde mi punto de vista la ventaja de que a quien escribo no le voy a molestar en el momento, y ya lo leerá y responderá cuando le venga bien, mientras que al llamarle puedo interrumpir, y entonces la conversación no será tan favorable para ninguno de los dos.
    Y muy buen apunte el de SAMFDZ al recordar que la ventaja de la mensajería tanto de texto como de voz permite pensarse las respuestas mejor.
    Por último, un tema que me parece muy relevante es lo que te dijo Sally sobre poder buscar los mensajes de texto. Con esto de comunicarse por WhatsApp o similares, estamos registrando conversaciones banales y pensadas para caducar en el momento, y se abre la posibilidad de utilizarlas a futuro… El pasado nos va a perseguir por siempre jamás. (Ojo, dile a Sally que estoy totalmente de acuerdo con ella, que a mí también me desespera que me manden mensajes de voz también por ese motivo, aparte de que sean más lentos de escuchar que de leeer).

    • Gracias a ti Daniel, que para eso has sido parte de la historia 😉 No sé si es tontainas, pero desde luego es más incómodo para el que recibe el mensaje. En cierto sentido es como las llamadas: cuando llamas a alguien no piensas si le estarás interrumpiendo, necesitas hablar con él por lo que sea y llamas. Ambas son formas «egoistas» de comunicarse, en un caso porque obligas a la otra parte a perder más tiempo del estrictamente necesario, y en otra por no pensar en que puedes molestar.

      Al final esto es como todo: cada opción tiene sus ventajas y desventajas y, por supuesto, su momento. Todo sería perfecto si las usásemos bien, pero más que usarlas, abusamos de ellas.

  10. Conocido + dice:

    Jeje una grandisima verdad, grande como una casa.
    Yo viajo mucho en metro y efectivamente cada vez mas se ve a la gente hablandole al telefono, pegado a la nariz, en un principio pensaba que era videocall, pero en realidad lo que hacen es grabar mensajes voz!

Comentarios cerrados