Tecnología

El mito del reconocimiento de voz en el PC

·

Hacía tiempo que no leía a mi admirado Jeff Atwood, al que sigo en Twitter por inercia (aunque sus tweets son bastante tostón, la verdad) y que publica cada vez menos en su blog. El último artículo ahora mismo es el del 21 de junio, y habla sobre un tema curioso: el reconocimiento de voz en los ordenadores.

Muchas empresas han tratado de popularizar este sistema como la nueva revolución en interfaces de usuario, dotando a nuestros sistemas operativos de aplicaciones nativas que eran capaces de hacer que controlásemos el PC o el portátil a través de órdenes de voz.

Pero es que una cosa es el control por voz («Abrir-Internet-Explorer», «Cerrar-ventana»), y otra muy distinta el reconocimiento de voz, en el que uno espera que todo lo que digamos al ordenador sea perfectamente interpretado y reconocido por esos algoritmos de reconocimiento.

Y es que, como dice Atwood en Coding Horror, hay un problema clave en el reconocimiento de voz:

Que no funciona.

Puede que la afirmación sea algo tajante, pero no por ello deja de ser cierta. Al menos, en gran parte. Y tengo que certificar sus palabras: durante aproximadamente un mes traté de usar de forma permanente Dragon Naturally Speaking 11 para escribir mis artículos en los medios en los que trabajo.

El resultado fue bastante decepcionante, y a pesar de irme acostumbrando a parecer un loco hablando en un tono alto y claro (exigencias del programa), la tasa de aciertos nunca fue satisfactoria.

Más aún cuando en la jerga informática hay que utilizar continuamente nombres de empresas y tecnologías que los programas de reconocimiento de voz no pillan. Ni a la primera, ni a la segunda, y muchas veces, ni a la enésima. Eso provocaba que cada tres por cuatro tuviera que parar el reconocimiento («A dormir», qué gracia me hacía aquello) para corregir la frase o palabra tirando de ratón y teclado, como en los buenos y viejos tiempos.

En el artículo de Coding Horror se plasma esa situación con un pequeño diagrama -sacado de un artículo relacionado con el tema e igualmente interesante- en el que se explica que en la actualidad el acierto en programas de reconocimiento de voz no pasa del 80%, mientras que el nivel requerido para trabajar de forma cómoda debería ser del 96 al 98%.

Voice-recognition-accuracy-rate-over-time

De hecho, lo curioso del caso es que ya no sirve de nada tener un maquinón para acelerar el procesamiento de nuestra voz y los algoritmos de reconocimiento. Estamos en el mismo punto en que estábamos hace 10 años:

In 2001 recognition accuracy topped out at 80%, far short of HAL-like levels of comprehension. Adding data or computing power made no difference. Researchers at Carnegie Mellon University checked again in 2006 and found the situation unchanged.

With human discrimination as high as 98%, the unclosed gap left little basis for conversation. But sticking to a few topics, like numbers, helped. Saying €œone€ into the phone works about as well as pressing a button, approaching 100% accuracy. But loosen the vocabulary constraint and recognition begins to drift, turning to vertigo in the wide-open vastness of linguistic space.

Así es: no se ha avanzado, y nos tenemos que limitar al control por voz, que consta de órdenes simples, mecánicas, y que, todo hay que decirlo, ayudan en ciertos escenarios como los de la accesibilidad para personas invidentes o con algún tipo de minusvalía. Sin embargo, esos sistemas nunca podrán sustituir -al menos, eso parece- a los fantásticos ratones y teclados a los que ya estamos pegados.

Así que ale, a volver a los buenos y viejos tiempos.


Incognichollos

Esta es una selección con las mejores ofertas tecnológicas actualizadas casi diariamente, como expliqué aquí. Aunque estés en un post «antiguo» las ofertas son de última hora, los Incognichollos los actualizo aparte. También puedes seguir los Incognichollos en Twitter o en el nuevo canal de Telegram 🙂 . Aprovecha, que no suelen durar mucho tiempo.

  • Xiaomi Mi 9T Pro: Casi calcado al 9T, pero con el Snapdragon 855. 6,39 pulgadas, cámara selfie popup, 6 GB de RAM, 64 GB capacidad, cámara de 48+13+8 MP, 4000 mAh, NFC, color rojo, lector de huella en pantalla. Está a 399 euros en Amazon
  • Xiaomi Mi A3: pantalla de 6,01?, Snapdragon 665, 4 GB de RAM, 64 GB de capacidad, cámara triple (48+8+2 MP), Android One (puro, sin MIUI), lector de huella bajo pantalla, sin NFC, brutal: 171 euros en GearBest con el código GBA36401. La versión con 128 GB de capacidad está a 198 euros en GearBest con el código GBA312801. En ambos casos, dos años de garantía en España.
  • Xiaomi Redmi Note 7: pantalla de 6,3? Snapdragon 660, 4 GB de RAM, 128 GB de capacidad (ampliables vía MicroSD), 4.000 mAh, minijack y cámara dual de 48+5 MP realmente estupendo por 172,71 euros en GearBest con el código GBNOTE7128. La versión de 64 GB de capacidad está a 143,89 euros en GearBest 
  • Razer Holiday pack gaming: compuesto por el teclado híbrido Cynosa Chroma, con macros personalizables y teclas anti ghosting, el ratón Razer Abyssus Essential y la alfombrilla Goliathus Chroma, con iluminación RGB. Está en PcComponentes está a 79,99 euros
  • Llave USB 256 GB SanDisk: un pendrive de gran capacidad, nada menos que 256 GB, con conexión USB 3.0, hasta 100 MB/s de transferencia, está a 30,9 euros en Amazon Alemania, envío incluido.
  • Altavoz portátil VTIN R4: este modelo tiene Bluetooth 5.0, 10W de potencia, resistencia IPX5, 24 horas de autonomía, toma de micrófono, ranura microSD, perfecto para viajes y fiestas. Está a 12,99 euros en Amazon (baja desde los 20) con el código VT338D08
  • 12 rotuladores marcadores BIC negro: una caja con 12 marcadores de color negro BIC Marking 2000 ECOlutions, punta de 1,7 mm, son rotuladores indelebles para prácticamente cualquier superficie. La caja de 12 a 5,81 euros en Amazon.
  • Micrófono Blue Yeti Nano Premium: un micrófono USB de alta calidad con conexión USB, perfecto para podcast aunque también válido para videoconferencias. Está a 84,40 euros en Amazon.
  • Adaptador universal de enchufe: para viajes a otros países con distintos enchufes, sirve por ej para USA, Japón o China. Está a 9,89 euros en Amazon.
  • Detector de billetes falsos: que no te la peguen, este detector de billetes identifica cuáles son válidos y cuáles falsos. Tiene batería de 500 mAh, soporta euros y dólares. Está a 50,29 euros en Amazon (baja desde los 78) con el código KCEZ9WCV
  • Cargador USB 4 puertos: chollazo para este cargador múltiple con 4 puertos USB, admite una salida de 5V/1A. No es el más potente, pero atentos al precio: baja desde los 15,99 a los 3,20 euros en Amazon con el código G5YJP9UZ
  • Monitor HP 32s: gigantesco, 32 pulgadas y resolución FullHD (1.920×1.080) panel IPS con retroiluminación LED, contraste 1200:1, puertos VGA y HDMI, está a 186,15 euros en Amazon
  • Pendrive SanDisk Dual USB USB-C 64 GB: una llave de memoria de 128 GB con puertos USB 3.1 (USB-A) y USB-C para poder conectarla a móviles y ordenadores sin problemas. Está a 14,99 euros en Amazon.
  • Disco duro externo Maxtor 4 TB: una unidad que es apuesta segura, 2,5 pulgadas, hasta 5 GB/s, puerto USB 3.0, capacidad brutal de 4 terabytes. Está a 94,80 euros en Amazon.
  • Capturadora Elgato Game Capture 4K60 Pro: si sois pros de Twitch o Mixer, atentos a esta capturadora que graba y emite tus partidas a 4K60 y exporta el vídeo. En Amazon España cuesta 289, pero en Amazon Alemania está a 210 euros envío incluido
  • Sony PS4 Pro 1 TB + FIFA 19: es el modelo reacondicionado, garantizado por Amazon, la consola más potente de Sony, estado bueno, 2 años de garantía. Está a 278,76 euros en Amazon.
  • OPPO Realme 3 Pro: curioso este móvil de 6,3? con un Snapdragon 710, 4 GB de RAM, 64 GB de capacidad (ampliable), cámara trasera de 16+5 MP, frontal de 25 MP, lector de huellas, 4.045 mAh. Está a 171,95 euros en GearBest
  • Tarjeta Micro SD Eaget 128 GB: una tarjeta para ampliar la capacidad de tu móvil de forma fantástica. Está a solo 12,67 euros en GearBest
  • Auriculares inalámbricos Xiaomi AirDots TWS: los competidores económicos de los AirPods de Apple con Bluetooth 5.0, 4 horas de autonomía y 12 más en el estuche, control táctil. Están a 18,89 euros en Banggood con el código BGXME.
  • Batería externa 20.000 mAh: un powerbank en toda regla condos salidas USB para poder cargar dos dispositivos a la vez. Indicador LED que permite saber nivel de carga, salida de 2,1 A. Está a 12,70 euros en AliExpress
  • Huawei MateBook D: un 15’6″ Full HD ultradelgado con el Core i5-8250U, 8 GB de RAM, 512 GB SSD (mola!), Windows 10 Home, teclado español, chulísimo por 699,99 euros en Amazon.
  • Convertible Medion MD61628: un portátil convertible de 14 pulgadas FullHD con un Core i5-8250U, 8 GB de RAM, 128 GB de SSD, teclado español, Dolby Audio, Windows 10 Home. Está a 543 euros en Amazon.
  • Xiaomi Mi 9: atentos, chicos. AMOLED 6,39″ , Snapdragon 855, 6 GB de RAM, 128 GB de capacidad, huella dactilar en pantalla, carga inalámbrica y rápida, cámara triple (48+12+16 MP). Brutal por 336,33 euros en GearBest con el código GBM9128BLACK. La de 64 GB está a 315 euros en GearBest con el código GBM964BLACK.
  • OnePlus 7 Pro: pantalla de 6,67? a 90 Hz gloriosos, Snapdragon 855, 6 GB de RAM, 128 GB capacidad, cámara triple 48+16+8 MP, cámara frontal 16 MP retráctil, lector bajo pantalla, 4.000 mAh, espectacular a 566 euros en eBay con el código PILLALO
  • Huawei P30 Lite: 6,15?, Kirin 710, 4 GB de RAM, 128 GB de capacidad, cámara de 48+2+8 MP, color azul, lector en la trasera, Android 9, está a 276,60 euros en Amazon, nada mal. Hace unos días estaba a 343. Impresionante.
  • Xiaomi Mi 9T: 6,39? AMOLED, Snapdragon 730, 6 GB de RAM, 64 GB de capacidad, cámara triple (48+8+13), cámara frontal retráctil (20 MP), lector de huella bajo pantalla, 4000 mAh. Brutal por 249,25 euros en eBay con el código PILLALO. la versión con 6 GB y 128 GB de capacidad, que está a 290,88 euros en GearBest con el código GBMI9T800. En ambos casos, 2 años de garantía en España.
  • Huawei P30: a tope con sus 6,1?, Kirin 980, 6 GB de RAM, 128 GB de capacida dy cámara triple de 40+8+16 MP. Lector de huella bajo pantalla, 3650 mAh, carga rápida. En color nácar está a 536,95 euros en Amazon.
  • OPPO Realme X: el rival a batir en gama media rompedora. Tremendo, 6,53? sin marcos, Snapdragon 710, 4 GB de RAM, 64 GB de capacidad, cámara dual 48+5, cámara frontal periscópica, 3765 mAh, lector de huellas en pantalla. Brutal por 233,03 euros en Banggood.
  • Lenovo Z5s: un smartphone modesto pero curioso: 6,3?, Snapdragon 710, 4 GB de RAM, 64 GB de capacidad, cámara triple 16+8+5, lector de huellas en la trasera, minijack, BT 5.0, Android 9,0, 3300 mAh. Está a 145,36 euros en AliExpress
  • Xiaomi PocoPhone F1: un viejo conocido, sigue siendo un telefonazo de 6,1?, Snapdragon 845, 6 GB de RAM, 64 GB de capacidad, cámara dual (12+5 MP), 4.000 mAh. Está a 239 euros en Banggood con el código BG8F164ES. Envío desde España. La versión de 128 GB está a 264 euros en Banggood con el código BG8MF1ES, también con envío desde España. Aún mejor que el de 64 GB por precio, diría
  • Sharp Aquos S2: un 5,5? modesto, con un marco inferior algo exagerado, pero súper barato. Con Snapdragon 630, 4 GB de RAM, 64 GB de ROM y cámara dual 12+8 MP, sorprendente por 98,59 euros en Banggood con el código BGSHARPS2
  • Nintendo Switch: el modelo en colores azul y rojo y con los dos mandos está a 245,70 euros en eBay con el código PILLALO
  • PS4  Slim 1 TB + 2 mandos + 3 juegos: la consola de Sony con un pack estupendo con 2 mandos DualShock 4, y los juegos ‘Uncharted 4’, ‘Horizon Zero Dawn’ y ‘The Last of Us’. Está a tan solo 317 euros en Amazon Alemania, envío incluido.
  • 12 meses de suscripción a EA Access Xbox One: con este servicio de suscripción podréis jugar a un montón de juegos de EA, muchos en sus últimas versiones, menudo chollete: 18,69 euros en CDKeys por un año para jugar a tope
  • Xiaomi Mi Air 13: descuentazo para este portátil de 13,3? FullHD con Core i5-7200U, 8/256GB, GeForce MX150, teclado EEUU, lector de huella. Está a 582 euros en Banggood con el cupón BGXMAIR813
  • Xiaomi Ruby 2019: modelo renovado, 15,6? FullHD (1920×1200), Core i7-8550U, 8 GB RAM, 512 GB SSD (uauh), HDMI, GbE, lector tarjetas, huella dactilar, teclado numérico (teclado US), NVIDIA MX110. Estupendo por 645 euros en Banggood con el código BGXMRuby31. El modelo algo más básico con el Core i5-8250U, 8 GB de RAM, 512 GB de SSD (uauh), lector de huella, GeForce MX110 (teclado US) está a 537,79 euros en Banggood con el código BGRRUUU724 La verdad es que tiene pintón y la diferencia de CPU compensa. Mola.
  • Chuwi Aerobook: tipo ‘MacBook’ 13,3? con un Intel Core m3-6Y30, 8 GB de RAM y 256 GB de SSD, W10 (teclado en inglés, touchpad gigante). Compacto, ligero y con bastantes más puertos que el de Apple ? Está a 345,08 euros en Banggood con el código BGCW6Y30
  • Portátil HP Pavilion 15-bc450ns: un equipo de 15,6? Full HD con un Core i5-8300H, 8 GB de RAM, 1 TB de HDD, 128 GB SSD (uauh) y GeForce GTX 1050 (uauh!), sin Windows (hay incognichollo ahí de 1,5 euros para resolver). Está a 599,99 euros en Amazon.
  • Portátil ASUS Vivobook 15 S512FA: un equipo de 15,6? HD (1366×768 píxeles) con un Core i5-8265U, 8 GB de RAM, 256 GB SSD, Windows 10 y teclado español. Muy bien plantado por 599,99 euros en Amazon.
  • Xiaomi RedmiBook: un nuevo portátil de 14? con un Core i5-8265U, 8 GB de RAM y 256 GB de SSD. Además tiene una gráfica GeForce MX250, Office preinstalado con Windows y audio DTS. Está a 564,68 euros en Banggood con el código BGXMR265
  • PC All In One HP 22-c0231ns: un All In One (Todo en Uno) tipo iMac de 21,5? con un Core i3-8130, 8 GB de RAM, 1 TB de HDD, Windows 10, teclado y ratón. Modesto pero muy bien de precio, 589,99 euros en Amazon.
  • Medion M80: un PC de sobremesa fantástico a este precio. Core i7-9700 (alucinante), 8 GB de RAM, 1 TB de HDD, 128 GB de SSD, Windows 10. Tremendo a este precio, de verdad. Tremendo. 499 euros en Amazon. Solo el Core i7 sale por 369 euros, es flipante
  • Unidad SSD Lexar 120 GB: modelo SATA 6 GB/s, hasta 550 MB/s de velocidad de lectura, fantástico como complemento para tu PC o portátil sobre todo a este precio mísero: 19,17 euros en Amazon
  • SSD SanDisk 3D 2 TB: una unidad de estado sólido SATA de 2,5 pulgadas de gran capacidad, nada menos que 2 terabytes, y con transferencias de hasta 560 MB/s. Está a 197 euros en Amazon Alemania, envío incluido.
  • Repetidores TP-LINK WiFi Mesh: dos puntos de acceso Mesh, AC1200 Dual-Band, hasta 260m² dd cobertura, 2 Puertos 100Mbps, hasta 100 Dispositivos, Ideal para xiaomi Mi Box, Amazon Alexa. Están a 69,90 euros en Amazon
  • Cargador inalámbrico Xiaomi 20 W: la mayoría ofrecen 10W, pero este dobla esa cantidad, así que si tu móvil lo permite la carga inalámbrica irá a toda pastilla. Está a 14,33 euros en Banggood con el código Bgmiqi82
  • Monitor portátil 15?: un monitor súper curioso que te puedes llevar a cualquier parte. Pantalla IPS W-LED de 15,6 pulgadas, resolución Full HD, formato 16:9, conexión USB-C e incluye adaptadores a HDMI y también a USB-A para cargarlo. Una opción súper interesante para conectar por ejemplo consolas si te las llevas de viaje. Está a 114 euros en Banggood con el código BG08e9dc
  • Monitor Gaming Acer Predator: un monitor de 24 pulgadas Full HD con soporte de tasas de refresco de 144 Hz y tecnología G-Sync de sincronización vertical. Muy top, está a 299,99 euros en Amazon.
  • Monitor Lenovo L27q-10: bonito, el condenado. 27 pulgadas y además resolución 1440p (2K), así que muchas buenas noticias en este monitor con tiempo de respuesta de 4 ms y que está a un precio estupendo, 229,99 euros en Amazon.
  • Monitor HP Pavilion Gaming: atentos a este monitorazo de 32 pulgadas con resolución QHD 2560×1440 píxeles con 75 Hz de refresco, AMD FreeSync, HDMI y DIsplayPort, y soporte HDR. Todo por 309 euros en Amazon Italia, envío incluido.
  • Monitor Philips 276E8VJSB/00: un 27 pulgadas con resolución 4K/UHD que cuenta con un tiempo de respuesta de 5 ms, brillo de 350 cd/m2 y con puertos HDMI y DisplayPort. Está a 239,99 euros en Amazon, buena opción para trabajar y jugar.
  • Smart TV HiSense 55?: un modelo de 55 pulgadas con 4K, HDR, sonido DTS, compatible con Alexa y con plataforma inteligente VIDDA U 3.0. Está a 416 euros en Amazon Italia, envío incluido. Chollazo.
  • Monitor AOC E2270SWHN: un monitor de 22 pulgadas con resolución 1080p, contraste 600:1, tiempo de respuesta de 5 ms y entrada HDMI. Genial para montar un PC económico o conectar la RPi (para los niños, por ej). Está a 69,99 euros en Amazon.
  • Robot Aspirador Ceotec Conga 1290: aspira y friega suelos, pasa la mopa y barre. 4 en 1, y con navegación inteligente, 7 modos de limpieza, programable. Está a 179 euros en Amazon (baja desde 269).
  • Aspirador Xiaomi Mijia 1S: 12 sensores para navegar mejor, escaneo más rápido del entorno, más eficiente, batería de 5.200 mAh (2 horas y media), potencia de succión 2.000 Pa, está a 269 euros en Banggood con el código BGMS008, baja desde los 350.
  • Smart TV Samsung QE65Q60R: armada hasta los dientes con panel 4K HDR, tecnología Quantum Dot, compatible con Alexa y Google Assistant. Está a 1.149,99 euros en eBay con el código PARATECH5.
  • Smart TV Philips 65PUS6162: si te gustan las teles grandes, atento, porque este modelo de 65 pulgadas con 4K y HDR está a 614,71 euros en Amazon. Flipante.
  • Smart TV Samsung UE65NU7092: y tirando la casa por la ventana este modelo de gama de entrada pero con esa diagonal fantástica de 65?, 4K, basada en Tizen. Está a 629,99 euros en eBay con el código PARATECH5
  • Amazon Echo Dot (3ª gen): el último modelo del Echo Dot, el altavoz inteligente de Amazon con Alexa, buen sonido, soporte de Spotify, Amazon Music, etc. Está a 39,99 euros en Amazon, baja desde los 59,99 euros.
  • Amazon Echo Input: convierte cualquier (viejo) altavoz en inteligente, añade Alexa, conexión 3,5 mm o Bluetooth. Está a 24,99 euros en Amazon, baja desde los 39,99, mola.
  • Altavoz inalámbrico Anker SoundCore: un altavoz portátil estéreo de 6W en color negro con tecnología Bluetooth 4.0, compatible con Alexa al vincularlo a un Echo, 24 horas de autonomía. Está a 28,89 euros en Amazon.
  • Xiaomi Mi Band 4: la versión global enviada desde España de esta pulsera cuantificadora con pantalla AMOLED de 0,95?, monitorización de sueño, actividad física, GPS, todo por 27,58 euros en AliExpress si elegís como comento el envío desde España.
  • HONOR Band 5: competidora de la Mi Band 4, con más funciones. Monitor de oxígeno en sangre, monitorización de sueño, 10 deportes distintos, pulsómetro, frecuencia cardiaca, GPS, está a 27,99 euros en eBay
  • Auriculares Sony WH-1000XM3: dicen que cuentan con la mejor cancelación de ruido del mercado, y los análisis son brutales. Sonido excepcional, autonomía de 38 horas, controles táctiles. Están a 221 euros en eBay con el código PILLALO. El modelo en negro por 223 euros en eBay con el mismo código.
  • Apple AirPods 2: con el estuche de carga normal, no el inalámbrico, pero estupendos según sus propietarios. Están a 135,90 euros en eBay con el código PILLALO.
  • Auriculares inalámbricos Bluedio Hi: un modelo chulo que imita el diseño de los AirPods. Sonido TWS, BT 5.0, micrófono integrado, cinco horas de autonomía, estuche para 4 cargas completas, están a 13,99 euros en Amazon con el código 9ORGR83V
  • Xiaomi Mi TV Box: versión internacional con soporte de streaming en 4K, procesador Amlogic S905L (S905X), 2 GB de RAM, 8 GB eMMC, WiFi ac, BT 4.2, HDMI 2.0, mini TOSLINK, control remoto. Está a 44 euros en GearBest con el código GBCNMIBOXHB
  • Sony Walkman NWWS413: un reproductor MP3 acuático y deportivo, resistente al agua salada, perfecto para nadar en piscina y aguas abiertas, 4 GB de capacidad. Está a 67 euros en Amazon (baja de los 99). Varios colores.
  • Auriculares Sony MDR-XB650BT: producto reacondicionado. Inalámbricos, Bluetooth, NFC, diseño plegable, hasta 30 horas de autonomía. Nuevos cuestan 80 euros, pero estos con la garantía de Amazon están a 36,28 euros (estado muy bueno)
  • Auriculares 7.1 Ozone Rage X60: con sonido 7.1 virtual, micrófono integrado, compatible con PS4, Xbox One y PC, 2 m de cable están a 29,99 euros en Amazon.
  • Altavoces Logitech Z333: un sistema 2.1 de altavoces con 40W de potencia real RMS, subwoofer con transductor de 13 cm, entrada 3,5 mm + RCA, está a 39,99 euros en Amazon.
  • MicroSD Samsung Evo Plus 512 GB: una capacidad brutal, adaptador incluido, difícil que necesites más. Está a 85 euros en Amazon, brutal el precio, suelen estar más de 120. Otra alternativa es la SanDisk Ultra de 400 GB por 69,99 euros en Amazon.
  • Tarjeta Micro SD Transcend 128 GB: capacidad estupenda, precio aún mejor para esta Micro SD de 128 GB con adaptador SD incluido. Está a solo 16,21 euros en Amazon.
  • Llave de memoria Sandisk 128GB: con conector USB-A 3.0 y conector Micro USB para backups de móvil por ejemplo. Está a 23,59 euros en Amazon
  • Chuwi Hi9 Air: una tableta de 10 pulgadas con resolución 2K, CPU Helio X20, 4 GB de RAM, 64 GB de capacidad, cámaras de 5 MP frontal y 13 MP trasera, batería 8.000 mAh, con Android Oreo, está a 129 euros en Banggood con el código BG5afb7c
  • Reloj cuantificador Amazfit GTR: el modelo para mujer de 42 mm de esfera, versión internacional, acero inoxidable, batería 25 días, sumergible 5 ATM, GPS, CLONASS, 5 modos deportivos, pantalla AMOLED, notificaciones. Está a 127,26 euros en GearBest.
  • Commodore 64 Mini: un homenaje al C64 en formato mini y que emula al mítico ordenador de los 80. Incluye un un joystick y 64 juegos licenciados, salida HDMI. Está a 38,90 euros en Amazon. En ECI a 75 euros.
  • Amazon Fire TV Stick: el competidor del Chromecast tiene su propio mando a distancia y permite reproducir en tu tele todo lo que tengas en tu tableta o móvil. Fantástico por 29,99 euros en Amazon, baja un 25%.
  • Tablet Amazon Fire 7: la renovada tableta de Amazon con mejor procesador y sobre todo con el doble de capacidad que el modelo de 2017. La versión de 16 GB (ampliable vía microSD) está a tan solo 69,99 euros en Amazon.

¿Quieres recibir un correo de aviso cuando publique nuevas entradas?

Standard

10 comentarios en “El mito del reconocimiento de voz en el PC

  1. Varo dice:

    Hola Javier: gracias por tu blog que sigo desde hace dos años, cuando me compré mi «Koyi»
    utilizó el programa Dragon NaturallySpeaking en español, alemán e inglés con distintas instalaciones desde hace varios años. Es cierto que en muchas ocasiones hay que corregir algunas palabras, especialmente términos técnicos o nombres propios, pero la comodidad de poder dictar 100 páginas mientras uno está tumbado en la cama (estoy escribiendo mi doctorado) no tiene precio. Después de muchas pruebas debo decir que hay dos factores esenciales en el reconocimiento de voz:
    1. La potencia del procesador. Como digo, lo utilizó desde hace años, en distintos ordenadores (entre ellos mi «Koyi» con instalación dual alemán y español) y el procesador se nota.
    2. La calidad del micrófono. Es un apartado esencial. Utilizó unos auriculares Logitech inalámbricos, aunque también he obtenido muy buenos resultados con un simple micrófono Bluetooth de Nokia.
    Aunque mucha gente no lo sabe Windows vista tiene integrado un sistema de reconocimiento de voz que funciona bastante bien, pero sin alcanzar la calidad del Dragon NaturallySpeaking. Este texto lo he escrito utilizando este programa y la única palabra que he tenido que deletrear ha sido «koyi». No me he molestado en intentar controlar todas las funciones del ordenador por medio de la voz, para no estar siempre pendiente de los auriculares, pero desde luego para textos extensos es una gozada.
    Un saludo desde Alemania

    • JaviPas dice:

      Varo, gracias por el comentario 😉 Ya veo que algunos le habéis pillado el tranquillo. Está claro que para trasladar/transcribir textos es una solución interesante, pero si uno tiene que escribir «sobre la marcha» la cosa se complica.

      Al menos esa fue mi experiencia, y David, entrené a tope. Durante un mes. Y no me acabó compensando. De todos modos, como dice Varo igual el micro es importante, yo usaba uno de andar por casa y eso podría haber influido.

      No sé, quizá le dé una nueva oportunidad al tema en el futuro, pero cuando estuve probando llegué a la conclusión de que escribo más rápido de lo que dicto… al menos con las molestias de andar corrigiendo.

  2. Varo dice:

    Gracias por la respuesta, Javier. Me alegro de por una vez poder aportar algo a tu fantástico blog, y es que como soy muy vago, en el tema de reconocimiento de voz tengo mucha experiencia.
    Empeze con el Viavoice de IBM hace años, que era una patata. Había que leer medio Quijote para que empezase a entender algo, pero con el Dragon Naturallyspeaking en 10 minutos lo entiende todo. Algunos amigos han probado incluso con mi perfil de voz y el reconocimiento era asombroso. Por cierto, Viavoice lo compró Nuance hace algún tiempo y supongo que ahora tendra el mismo motor de reconocimiento que Dragon (Nuance).

    La versión que uso en alemán la tengo instalada en una máquina virtual con XP y aunque mi pronunciación no es perfecta el reconocimiento es tan bueno como en español. Por desgracia Dragon no admite instalaciones múltiples y hay que recurrir a trucos. El inglés lo trae de serie con el español.
    Se me había olvidado añadir que otro factor muy importante (además del micrófono) es el ruido ambiente. Yo lo utilizo sólo en mi casa o en la oficina con la ventana cerrada. Con el Koyi, en la calle… ni te molestes. Y para lo que tú haces, que me supongo estarás escribiendo en cualquier sitio, seguramente no te compense. Pero en contextos de dictado en los que yo lo uso, traducción, redacción de informes, tesis doctoral,etc, es fantástico.

    Dragon tiene una versión juridica y otra médica, que en los EE.UU. están extendidísimas. De hecho una de las primeras aplicaciones para el iPad ha sido el Dragon.

    El amigo que me recomendo tu blog, que es un profesional de la informática (!ese Logro!) lo utilizó además de para preparar las oposiciones (elaboró todo el temario con Dragon), para introducir varios miles de cifras en una base de datos con una precisión casi perfecta.

    Por cierto, mi Koyi también está buscando sustituto. Siguiendo tu ejemplo, tengo un arranque múltiple, aunque sólo doble con Vista Ultimate (1 usuario en alemán y otro en español) y un Mac OS. (El Ubuntu en el pendrive) y el pobre no da para más. En reconocimiento de voz va lentííísimo (se nota la potencia) y el programa de reconocimiento de Vista va regular. En cualquier caso el micrófono sigue siendo determinante. Como yo el Koyi lo utilizo más que para escribir, para dar clases en la Uni y en viajes, estoy esperando a las nuevas tabletas en otoño. El Ipad aquí todavía no se ha visto ni uno. A ver si se mueven las otras empresas que la competencia es lo mejor que hay y apple está muy sola.

    Gracias por tu blog y muchos saludos desde Jena-Turingia-Alemania

    • JaviPas dice:

      Gracias a ti también por los comentarios, me alegro de que participes 😉 así que no desfallezcas y comenta cuando quieras!

      Cuando utilicé DNS lo hice en casita y en español, así que ruido ambiente no había. Como digo, me acabé cansando de estar corrigiendo nombres de empresas y tecnologías cuando iba dictando las noticias. Por cierto, en casa trabajo con maquinón, así que problema por ese lado no puede haber 😉

      Ya me contarás si cambias finalmente el Koji. Yo sigo planteándomelo, pero tardo en tomar decisiones, me gusta otear bien el mercado, y no tengo una prisa especial. Yo ahora lo tengo bastante distinto a como lo tenía en los primeros tiempos. Mac OS X desapareció y ahora lo uso con W7, pero siempre en arranque múltiple con sistemas para netbooks varios. Ahora tengo Jolicloud, MeeGo, Chromium OS Flow y, por supuesto, una Ubuntu 10.04. Y voy cambiando según me va 😉

      Suerte con la tesis! Si algún día voy por allí ya contactaré para tomarme unos frankfurten con una buena bier 😉

  3. Varo dice:

    Eso está hecho. Pero nada de frankfurten que Turingia es la capital de las Bratwurst (mucho mejores, palabrita) y con una cervecita negra Köstrizer… ummmmm. Yo invito, en serio. Si quieres ver como es esto mira el blog de mi página que es la dirección de mi correo. Hace mucho que no la actualizo pero en el blog se ven unos videos de Navidad muy chulos.
    Saludos

    • clon dice:

      Hola Varo… estuve leyendo tus mensajes en el blog y me parecio que estas muy entrado en esto del DNS, es por eso que te pido un gran favor, que me ayudes a encontrar un perfil en ingles en lo preferente de alquien nativo de U.S., estoy en un curso de ingles y estoy adelantando muchisimo mi unico problema es el da la pronunciacion, pienso que con un buen perfil prodria mejorar muchisimo mi ingles….Un gran abrazo a la distancia y gracias…….

  4. Oscaar dice:

    Yo empece a utilizar el DNS 10 pero coincido con ustedes que se debe tener un ambiente libre de ruido, y poseer un buen micròfono para que de buenos resultados, estoy empezando a utilizar el reconomiento de voz de W7 y me parece mucho mejor que el DNS en cuanto a presiciòn ya que lo he usado con un micròfono de mala calidad marca «patito» y con la televisiòn encendida y me ha funcionado bien, en cuanto a palabras tècnicas y lèxico especial, pues sí, hay que ir ingresándolas a la aplicaciòn para que las vaya grabando y no haya problema con ellas en futuras ocasiones, y hablando al respecto, que micròfono me recomiendan para el reconocimiento de voz.

  5. Hola, pues a mi el reconocimiento de voz me funciona bastante bien, de hecho, lo uso para redactar trabajos de investigación en el colegio, etc. La calidad del micrófono es crucial, sin embargo, también depende de la potencia del procesador, porque se puede aumentar o disminuir la precisión del DNS. Un consejo que le doy al que escribió esta noticia es que almacene en un documento de Word o .txt todas las palabras técnicas con el teclado, después vaya al DNS y las pase por el sistema que recopila más palabras para agregarlas a diccionario, así se te hará más fácil que el sistema reconozca las palabras técnicas.

Comentarios cerrados