Tecnología

El mito del reconocimiento de voz en el PC

·

Hacía tiempo que no leía a mi admirado Jeff Atwood, al que sigo en Twitter por inercia (aunque sus tweets son bastante tostón, la verdad) y que publica cada vez menos en su blog. El último artículo ahora mismo es el del 21 de junio, y habla sobre un tema curioso: el reconocimiento de voz en los ordenadores.

Muchas empresas han tratado de popularizar este sistema como la nueva revolución en interfaces de usuario, dotando a nuestros sistemas operativos de aplicaciones nativas que eran capaces de hacer que controlásemos el PC o el portátil a través de órdenes de voz.

Pero es que una cosa es el control por voz («Abrir-Internet-Explorer», «Cerrar-ventana»), y otra muy distinta el reconocimiento de voz, en el que uno espera que todo lo que digamos al ordenador sea perfectamente interpretado y reconocido por esos algoritmos de reconocimiento.

Y es que, como dice Atwood en Coding Horror, hay un problema clave en el reconocimiento de voz:

Que no funciona.

Puede que la afirmación sea algo tajante, pero no por ello deja de ser cierta. Al menos, en gran parte. Y tengo que certificar sus palabras: durante aproximadamente un mes traté de usar de forma permanente Dragon Naturally Speaking 11 para escribir mis artículos en los medios en los que trabajo.

El resultado fue bastante decepcionante, y a pesar de irme acostumbrando a parecer un loco hablando en un tono alto y claro (exigencias del programa), la tasa de aciertos nunca fue satisfactoria.

Más aún cuando en la jerga informática hay que utilizar continuamente nombres de empresas y tecnologías que los programas de reconocimiento de voz no pillan. Ni a la primera, ni a la segunda, y muchas veces, ni a la enésima. Eso provocaba que cada tres por cuatro tuviera que parar el reconocimiento («A dormir», qué gracia me hacía aquello) para corregir la frase o palabra tirando de ratón y teclado, como en los buenos y viejos tiempos.

En el artículo de Coding Horror se plasma esa situación con un pequeño diagrama -sacado de un artículo relacionado con el tema e igualmente interesante- en el que se explica que en la actualidad el acierto en programas de reconocimiento de voz no pasa del 80%, mientras que el nivel requerido para trabajar de forma cómoda debería ser del 96 al 98%.

Voice-recognition-accuracy-rate-over-time

De hecho, lo curioso del caso es que ya no sirve de nada tener un maquinón para acelerar el procesamiento de nuestra voz y los algoritmos de reconocimiento. Estamos en el mismo punto en que estábamos hace 10 años:

In 2001 recognition accuracy topped out at 80%, far short of HAL-like levels of comprehension. Adding data or computing power made no difference. Researchers at Carnegie Mellon University checked again in 2006 and found the situation unchanged.

With human discrimination as high as 98%, the unclosed gap left little basis for conversation. But sticking to a few topics, like numbers, helped. Saying €œone€ into the phone works about as well as pressing a button, approaching 100% accuracy. But loosen the vocabulary constraint and recognition begins to drift, turning to vertigo in the wide-open vastness of linguistic space.

Así es: no se ha avanzado, y nos tenemos que limitar al control por voz, que consta de órdenes simples, mecánicas, y que, todo hay que decirlo, ayudan en ciertos escenarios como los de la accesibilidad para personas invidentes o con algún tipo de minusvalía. Sin embargo, esos sistemas nunca podrán sustituir -al menos, eso parece- a los fantásticos ratones y teclados a los que ya estamos pegados.

Así que ale, a volver a los buenos y viejos tiempos.


Incognichollos

Esta es una selección con las mejores ofertas tecnológicas actualizadas —la mayoríarealm (si no todos) de los enlaces son afiliados— casi diariamente, como expliqué aquí. Aunque estés en un post «antiguo» las ofertas son de última hora, los Incognichollos los actualizo aparte. También puedes seguir los Incognichollos en Twitter o en el nuevo canal de Telegram 🙂 . ¡Aprovecha, que no suelen durar mucho tiempo!

  • POCO F3 5G: un smartphone de 6,67" con pantalla AMOLED a 120 Hz, Snapdragon 870, 8 GB de RAM, 256 GB de capacidad, cámara triple (48+8+5 MP), 4.520 mAh, NFC, incluye auriculares Mi, está a 339,99 euros en Amazon (baja de 399,99).
  • Teclast T40 Pro: tableta 10,4", resolución 2.000 x 1.200, CPU Unisoc T618 octa-core, 8 GB de RAM, 128 GB de capacidad (ampliables), cámara de 13 MP (frontal 8MP), conectividad 4G/LTE, 7.000 mAh, Android 11, está a 229,49 euros en Amazon (baja de 299,99).
  • SSD Crucial P5 2 TB: una unidad SSD en formato PCIe M.2 NVMe, hasta 3.400 MB de transferencia, 2 TB de capacidad, está a 189,99 euros en Amazon (baja de 251,58).
  • Realme GT Master Edition: 6,43" a 120 Hz, Snapdragon 778G, conectividad 5G, 6 GB de RAM, 128 GB de capacidad, cámara triple (64+8+2), 4.300 mAh, NFC, está a 289,46 euros en Amazon (baja de 349).
  • HP X27: un monitor gaming de 27 pulgadas con resolución Full HD, tasa de hasta 165 Hz, panel IPS, 1 ms de tiempo de respuesta, AMD FreeSync Premium, OMEN Gaming Hub, antirreflejo, está a 199 euros en Amazon (baja de 259).
  • Router Amazon Eero: el router con soporte WiFi Mesh que da cobertura de hasta 140 m2 y que se configura súper rápido, dos puertos GbE, carga por USB-C, está a 59 euros en Amazon (baja de 99).
  • Samsung LS32A704NWUXEN: un monitor de 32 pulgadas y resolución 4K UHD (3.840 x 2.160, IPS), HDR10, 5 ms de tiempo de respuesta, HDMI, DP, está a 299 euros en Amazon (baja de 439).
  • SteelSeries Arctis 9X: Conectividad inalámbrica y mediante Bluetooth incorporadas – Más de 20 horas de batería - Para Xbox Series X y Xbox One, Negro, está a 121,61 euros en Amazon (baja de 199).
  • TCL 10 5G: un smartphone de 6,53" con un Snapdragon 765, redes 5G, 6 GB de RAM, 128 GB de capacidad (ampliables), cámara quad (68+8+5+2), 4.500 mAh, NFC, minijack, está a 199 euros en Amazon (baja de 419,99).
  • WD Elements 10 TB: una unidad de disco externa de 3,5 pulgadas con capacidad estupenda de 10 TB, conexión USB 3.0, hasta 100 MB/s, está a 179 euros en Amazon (baja de 272,99).
  • SanDisk Ultra Dual m3.0: Unidad Dual con conector micro-USB en un extremo y un conector USB 3.0, 32 GB, está a 3,78 euros en Amazon (baja de 9,99).
  • MSI Modern 15 A5M-009XES: un portátil de 15,6" Full HD con un Ryzen 5 5700U, 8 GB de RAM, 512 GB de SSD, sin SO, WiFi 6, está a 649 euros en Amazon (baja de 899).
  • Fossil Connected Smartwatch Gen 5E: para Hombre con tecnología Wear OS de Google, frecuencia cardíaca, está a 159,26 euros en Amazon (baja de 229).
  • Jabra Elite 85t: Auriculares Inalámbricos True Wireless con cancelación activa de ruido avanzada, batería de larga duración y potentes altavoces - Estuche de carga inalámbrica - Negro titanio, está a 149,90 euros en Amazon (baja de 229,99).
  • Samsung Galaxy S21+ 5G: smartphone de 6,7" a 120 Hz con HDR10+, Exynos 2100, 8 GB de RAM, 128 GB de capacidad, cámara triple (12+64+12), 4.800 mAh, NFC, está a 759 euros en Amazon (baja de 1.059).
  • Samsung LS27A704NWUXEN: un monitor de 27" con resolución 4K UHD (3.840 x 2.160, panel IPS), HDR10, 5 ms de tiempo de respuesta, Flicker Free, HDMI, DP, está a 299 euros en Amazon (baja de 399).
  • Xiaomi Smart TV P1 (55"): Smart TV de Xiaomi, 55", resolución 4K UHD, Android 10, Bluetooth, conector HDMI 2.1, 2 x USB-A, HDR 10+, Chromecast integrado, Dolby Audio, DTS-HD, está a 499,99 euros en PcComponentes (baja de 638,87).
  • Disco duro externo WD Black P10 5 TB: una unidad externa de 3,5 pulgadas a 7200 RPM con una capacidad brutal de 5 TB que podéis usar en la consola pero tb en el PC, está a 113,99 euros en Amazon (baja de 140,49).
  • Samsung Smart M7 LS43AM702UUXEN: un espectacular monitor de 43 pulgadas con resolución 4K UHD, (3.840 x 2.160), USB-C, altavoces, conectividad móvil, mando a distancia, apps de Smart TV, está a 471,83 euros en Amazon (baja de 599).
  • LG 75UP80006LA: una Smart TV de 75" con resolución 4K UHD, HDR10, HLG, inteligencia artificial LG ThinQ, webOS 6.0, Dolby Atmos, asistentes de voz, está a 819 euros en PcComponentes (baja de 1.089).
  • Asus VivoBook Pro 14X: un portátil con pantalla OLED de 14" con resolución 2.880 x 1.800 (uauh), un Intel , Core i7-11370, 15 GB de RAM, 512 GB de SSD y una RTX 3050, está a 1.198,99 euros en Fnac (baja de 1.299).
  • Router Google Nest Wifi: un router compatible con redes de malla para combinar con puntos de acceso e ir mejorando cobertura, redes 802.11ac (Wi-Fi 5), un puerto Ethernet, controles táctiles, está a 110,25 euros en Amazon (baja de 159).
  • Sony WH1000XM4: os nuevos auriculares con cancelación activa de ruido, súper tope de gama de Sony, Bluetooth, soporte Alexa y Google Assistant, control táctil, está a 247,99 euros en Amazon (baja de 380).
  • Xiaomi Mi TV P1E 43": una Smart TV de Xiaomi con 43 pulgadas de diagonal, resolución 4K UHD, Android TV, está a 325 euros en Amazon (baja de 399).
  • Huawei Watch GT 3 (42 mm): un smartwatch con caja de 42 mm, monitorización cardiaca y SpO2, 100 modos entrenamiento, llamadas por BT, hasta 7 días de autonomía, sumergible 5 ATM, está a 219 euros en Amazon (baja de 299).
  • Sony WF-1000XM4: recién presentados, espectaculares, auriculares TWS, cancelación activa de ruido, sonido de alta calidad, resistencia al agua, procesador V1, está a 184,30 euros en Amazon (baja de 279).
  • Razer Kiyo: una webcam para streaming que graba a 1080p y 30 FPS (o 720 a 60FPS) con un aro de luz para iluminarte con brillo ajustable, enfoque automático, está a 64,99 euros en Amazon (baja de 109,99).
  • Apple Mac Mini M1: el nuevo modelo del Mac mini basado en el procesador M1, 8 GB de RAM, 256 GB de SSD, fantástico como equipo de trabajo, está a 719 euros en Amazon (baja de 799).
  • Tableta SAMSUNG Galaxy Tab S6 Lite: una tableta de 10,4" con un Exynos 9611, 4 GB de RAM, 64 GB de capacidad (ampliables), cámara de 8 MP, 7.040 mAh,incluye S-Pen, Android 10, está a 299 euros en El Corte Inglés (baja de 399).
  • POCO M3 Pro 5G (128 GB): 6,5" a 90 Hz, MediaTek Dimensity 700, 6 GB de RAM, 128 GB de capacidad (ampliables), cámara triple (48+2+2), 5G, 5.000 mAh de batería, NFC, auriculares, está a 170,99 euros en AliExpress Plaza con el código AEWS9 (baja de 199,99).
  • Auriculares gaming Steelseries Arctis 7+: inalámbricos, sonido DTS Headphone: X V2.0 Surround (envolvente), batería de hasta 30 horas, micrófono con cancelación de ruido ClearCast, Para PC y consolas, está a 131,29 euros en Amazon (baja de 179,99).
  • Nintendo Switch: la versión estándar (no OLED) con mandos en color neón rojo y azul, está a 275,34 euros en Amazon Italia envío incluido (baja de 402,22).
  • Apple MacBook Air M1 (256 GB): maravilloso, 13.3" Retina (2.560 x 1.600), chip M1, 8 GB de RAM, 256 GB de SSD, hasta 18 horas de autonomía, Thunderbolt 4, WiFi6, está a 994,90 euros en Amazon (baja de 1.129).
  • Disco duro externo WD Elements Desktop 16 TB: una unidad externa de 16 TB para backups sin fin, conexión USB 3.0, está a 321,89 euros en Amazon (baja de 489,99).
  • Micro SD SanDisk Extreme 128 GB: una tarjeta microSD con su adaptador para SD y velocidad de hasta 160 MB/s, clase 10, está a 17,99 euros en Amazon (baja de 46,99).
  • Sony SRS-XB13: mini altavoz Bluetooth compacto, duradero y potente con Extra Bass, resistente al agua, inalámbrico, 16 horas de autonomía, está a 38,99 euros en Amazon (baja de 59,99).
  • HUB USB-C 8 en 1: un hub USB-C con puerto de carga a 100 W, salida HDMI 4K, USB 3.0, lector de tarjetas SD, perfecto para MacBooks y portátiles Windows, está a 17,99 euros en Amazon (activad cupón, baja de 25,99).
  • Amazfit GTR: 47 mm de esfera, versión internacional, acero inoxidable, batería 25 días, sumergible 5 ATM, GPS, 5 modos deportivos, pantalla AMOLED, notificaciones, está a 75,50 euros en Amazon (baja de 129,99).
  • HP Essential 255 G8: un portátil de 15,6" Full HD con un potente Ryzen 5 5500U, 8 GB de RAM, 256 GB de SSD, Windows 10 Home, puerto Ethernet, lector SD, HDMI, USB-C, está a 579 euros en PcComponentes (baja de 599).
  • Huawei Matebook 14 AMD: un portátil estupendo y ultrafino de 14" 2K (2.160x1440), pantalla 3:2, un Ryzen 5 4800H, 16 GB de RAM, 512 GB de SSD, Windows 10 Home, lector de huella, está a 849 euros en Huawei con el código A50MB14R716 (baja de 1.099).
  • Arcade 1Up Street Fighter: una recreativa con el diseño clásico, dimensiones de 1,21 x 0,60 x 0,48 m, pantalla LCD a color de 17 pulgadas, controles duales y auténticos de arcade, volumen ajustable, está a 308,48 euros en Amazon (baja de 499).
  • GoPro HERO9 Black: una cámara de acción tope de gama, sumergible sin necesidad de carcasa, pantalla LCD delantera y táctil trasera, vídeo 5K, fotos de 20 MP, transmisión en directo en 1080p, está a 359 euros en PcComponentes (baja de 429).
  • Lenovo G34w-10: un monitor ultrapanorámico de 34 pulgadas y resolución 3.440x1.440 píxeles, soporte de 144 Hz, curvatura 1500R, puertos HDMI y DisplayPort, está a 449,99 euros en Amazon (baja de 509,95).
  • Emtec Internal SSD X150 480 GB: una unidad SSD interna en formato SATA de 2,5 pulgadas, hasta 500 MBps, capacidad de 480 GB, está a 49 euros en Amazon (baja de 76,31).
  • Samsung Galaxy Watch3: reloj inteligente de 45 mm con Bluetooth, caja de acero, bisel giratorio, SpO2, detector de caídas, monitoriza sueño, sumergible, Samsung Pay , está a 242,14 euros en Amazon (activad cupón, baja de 469).
  • Samsung QE65Q80A: una Smart TV con panel QLED de 65 pulgadas, resolución 4K UHD, HDR10+, Object Tracking Sound, SpaceFit Sound, AVA, Freesync Premium, puerto HDMI 2.1, está a 998,99 euros en PcComponentes (baja de 1.399).
  • Samsung 75AU8005: una Smart TV con panel Crystal UHD de 75 pulgadas, resolución 4K, HDR10+, Motion Xcelerator, Contrast Enhancer, Alexa, está a 905 euros en Amazon (baja de 1.299).
  • Oppo A94 5G: 6,43" a 90 Hz, MediaTek Dimensity 800U, 8 GB de RAM, 128 GB de capacidad, cámara quad (48+8+2+2), 4.310 mAh, NFC, está a 299 euros en Amazon (baja de 379).
  • Xiaomi Smart TV P1 (55"): la nueva Smart TV de Xiaomi, 55 pulgadas, resolución 4K UHD, Android 10.0, Bluetooth, conector HDMI 2.1, 2 x USB-A, HDR 10+, Chromecast integrado, Dolby Audio, DTS-HD, está a 469 euros en MiElectro (baja de 699).
  • Samsung Galaxy S21+ 5G: smartphone de 6,7" a 120 Hz con HDR10+, Exynos 2100, 8 GB de RAM, 128 GB de capacidad, cámara triple (12+64+12), 4.800 mAh, NFC, está a 758,14 euros en Amazon (baja de 1.059).
  • Asus TUF Gaming F15 FX506HM-HN016: un portátil gaming de 15,6" Full HD a 144 Hz con un Core i5-11400H, 16 GB de RAM, 512 GB de SSD, y una RTX 3060 para jugar, sin sistema operativo, está a 1.036 euros en PcComponentes (baja de 1.089).
  • Samsung T5 2 TB: una unidad SSD externa y ultracompacta, conexión USB 3.0, hasta 540 MB/s, nada menos que 2 TB de capacidad, está a 229 euros en Amazon (baja de 242,49).
  • Realme GT Neo 2: smartphone de 6,62" a 120 Hz HDR10+, Snapdragon 870, 5G, 8 GB de RAM, 128 GB de capacidad, cámara triple (64+8+2), 5.000 mAh, NFC, está a 369 euros en Amazon (baja de 449).
  • Apple AirPods (3ª Gen, 2021): nueva versión de los auriculares totalmente inalámbricos de Apple con audio espacial, ecualización adaptativa, resistencia a salpicaduras y sudor, sensor de presión, está a 194,99 euros en Amazon (baja de 199).
  • Philips 43PUS8506: una Smart TV de 43 pulgadas con resolución 4K UHD, asistentes de voz, Ambilight de 3 lados, HDR, Dolby Vision, Dolby Atmos, está a 692 euros en Amazon (baja de 749).
  • Amazfit Bip U: el nuevo reloj cuantificador de este fabricante con pantalla de 1,43", resistente al agua (50 m), 60 modos deportivos, GPS, frecuencia cardíaca, oxígeno en sangre, está a 37,99 euros en Amazon (activad cupón, baja de 49,90).
  • Samsung 980 SSD 500 GB: una unidad SSD interna en formato M.2 NVMe con una capacidad de 500 GB, hasta 3.500 MB/s de transferencia, está a 54,95 euros en Amazon (baja de 75).
  • Asus Chromebook Flip Z3400FT: un convertible de 14" tátcil Full HD con un Core M3-8100Y, 8 GB de RAM, 64 GB de eMMC, con Chrome OS y teclado español, está a 527,78 euros en PcComponentes (baja de 599,01).
  • HyperX Cloud Alpha Pro: auriculares gaming con cable trenzado extaíble, compatibles con consolas y PC, conector de 3,5 mm, drivers de 50 mm, certificación TeamSpeak, está a 65,99 euros en Amazon (baja de 99,99).
  • Realme Pad: una tableta de 10,4" 1.200 x 2.000 px, con un SoC MediaTek Helio G80, 4 GB de RAM, 64 GB de capacidad (ampliables), Android 11, cámara frontal y trasera de 8 MP, 7.100 mAh, está a 227 euros en eBay (baja de 359).
  • HiSense 65U7QF: una Smart TV con panel ULED (=QLED) de 65 pulgadas, resolución 4K UHD, Quantum Dot, Full Array, HDR10+, Dolby Vision, Dolby Atmos, Vidaa U, altavoces 20W DTS, está a 689 euros en MiElectro (baja de 1.199).
  • Corsair Gaming Bundle: 4 en 1 K55 RGB PRO+HS50 PRO+HARPOON RGB PRO+MM100 Gaming, está a 99,98 euros en PcComponentes (baja de 149,99).
  • SSD Crucial BX500 1 TB: si buscábais una unidad SSD para el portátil o el PC asequible, atentos: esta de Crucial ofrece hasta 540 MB/s de transferencias, formato SATA, 2,5 pulgadas, está a 84,90 euros en Amazon (baja de 111,36).
  • TV Samsung 43TU7095: una Smart TV de 43 pulgadas con resolución 4K, HDR 10+, Crystal Display, procesador 4K, PurColor, sonido inteligente, One Remote Control, asistentes de voz, está a 399,99 euros en Amazon (baja de 490).
  • Auriculares Logitech G332: auriculares gaming con transductores de 50 mm, micrófono de calidad plegables, está a 28,90 euros en PcComponentes (baja de 59,98).
  • Samsung Galaxy Watch4: caja de 40 mm, pantalla Super AMOLED de 1,2", CPU de 5 nm, WearOS con UI Watch, hasta 40 horas de autonomía, monitoriza ritmo cardíaco, sueño, IMC, está a 197,52 euros en Amazon (baja de 269,90).
  • Jabra Elite 65t: auriculares inalámbricos con Bluetooth 5.0, cancelación pasiva de ruido, 4 mics para llamadas de calidad, hasta 15 horas autonomía con el estuche, tres juegos de gomas de silicona, está a 65,97 euros en Fnac (baja de 99,99).
  • Medion Akoya S15449: un portátil de 15,6" con un Core i5-1135G7, 8 GB de RAM, 256 GB de SSD, gráficos Intel Xe, sin sistema operativo, está a 479 euros en PcComponentes (baja de 579).
  • Razer Basilisk X HyperSpeed: Ratón inalámbrico para juegos, Ratón Gaming con tecnología Razer HyperSpeed, inalámbrico, sensor óptico 5G y 6 botones configurables libremente, Negro, está a 39,98 euros en PcComponentes (baja de 69,99).
  • Samsung UE70AU7172: una Smart TV con panel LED de 70 pulgadas, resolución 4K UHD, HDR+, Tap View, Samsung TV Plus, Motion Xcelerator Turbo, está a 699,99 euros en PcComponentes (baja de 799).
  • Toshiba Canvio Basics 4 TB: un disco duro externo de 2,5" con conexión SATA, conexión USB 3.0, 4 TB de capacidad, está a 81,41 euros en Amazon (baja de 107,88).
  • Apple AirPods MAX: los auriculares de diadema de gama alta de Apple con cancelación activa de ruido, sonido envolvente, hasta 20 horas de autonomía, está a 505,99 euros en Amazon (baja de 629).
  • WD_BLACK SN850 1 TB: una unidad SSD en formato M.2 PCIe 4.0 con velocidades de transferencia de hasta 7.000 MB/s, 1 TB de capacidad, está a 166,16 euros en Amazon (baja de 199).
  • Western Digital My Book 8 TB: disco duro externo con RAID-0, dos bahías, USB 3.1 Gen 1, capacidad brutal de 8 TB, está a 175 euros en Amazon (baja de 239,99).
  • Razer Kishi para Android: Controlador de Juegos para teléfonos Inteligentes, conexión USB-C, diseño ergonómico, Ajuste Individual para teléfonos móviles, Dispositivo analógico, latencia Baja, está a 55 euros en Amazon (baja de 89,99).
  • SSD Samsung 870 QVO 2 TB: atentos que no es un disco duro, es una unidad SSD con 2 TB de capacidad, conexión SATA, tecnología QVO, hasta 560 MBps de transferencia, está a 170 euros en Amazon (baja de 200,49).
  • WD BLACK SN850 500 GB: una unidad SSD en formato M.2 PCIe 4.0 con velocidades de hasta 7.000 MB/s, perfecta para ampliar las PS5, está a 90,07 euros en Amazon (baja de 99,95).
  • ASUS TUF Gaming Dash F15 FX516PR-HN002: un portátil gaming de 15,6" a 144 Hz con un Intel Core i7-11370H, 16 GB de RAM, 512 GB de SSD, y una RTX 3070 para jugar a tope, sin sistema operativo , está a 1.399 euros en PcComponentes (baja de 1.499).
  • SSD Externo Sandisk Portable 1 TB: una unidad SSD de 2,5 pulgadas compacta, resistente al agua y al polvo, con 1 TB de capacidad y transferencias de 520 MB/s, está a 116,79 euros en Amazon (baja de 149,99).
  • Apple MacBook Air M1 (512 GB): maravilloso, 13" Retina (2.560 x 1.600), chip M1, 8 GB de RAM, 512 GB de SSD (no 256, cuidado), hasta 18 horas de autonomía, Thunderbolt 4, WiFi6, está a 1.199 euros en Amazon (baja de 1.399).
  • Lenovo D27-30: un monitor de 27" con resolución FullHD, panel VA a 75 Hz, HDMI, VGA, FreeSync, está a 149,99 euros en Amazon (baja de 159,99).
  • Samsung LU28R550UQRXEN: un monitor de 28 pulgadas con resolución 4K (3.840 x 2.160), 4 ms de tiempo de respuesta, diseño sin marcos, FreeSync, 300 cd/m2, HDMI 2.0, está a 260,56 euros en PcComponentes (baja de 302,57).
  • Realme GT 5G: smartphone de 6,62" a 120 Hz HDR10+, Snapdragon 870, 5G, 8 GB de RAM, 128 GB de capacidad, cámara triple (64+8+2), 5.000 mAh, NFC, está a 459 euros en Amazon (baja de 499).
  • Monitor Newskill Icarus: un monitor de 27 pulgadas con panel Fast IPS, resolución QHD (2.560 x 1.440), 180 Hz, compatible G-Sync, está a 349,98 euros en PcComponentes (baja de 499,95).
  • Sennheiser PXC 550 II: auriculares de diadema con cancelación de ruido adaptativa, asistentes de voz, tres micrófonos, Bluetooth, está a 199 euros en El Corte Inglés (baja de 349).
  • ASUS VG258QR: un monitor gaming de 24,5 pulgadas Full HD con 0,5 ms de tiempo de respuesta (uauh), 165 Hz (uauh), soporte NVIDIA G-SYNC y marcos reducidos, está a 239 euros en Amazon (baja de 279).
  • Realme X50 Pro 5G: el telefonazo 5G de Realme, 6,44" a 90 Hz, Snapdragon 865, 8 GB de RAM (uauh), 128 GB de capacidad (uauh), cámara quad (64+12+8+2 MP), 4.200 mAh, carga súper rápida, está a 399 euros en Fnac (baja de 599).
  • Motorola Moto G100: 6,7" a 90 Hz, Snapdragon 870, redes 5G, 8 GB de RAM, 128 GB de capacidad (ampliable), cámara quad (64+16+2+ToF), 5.000 mAh, NFC, minijack, está a 399 euros en Amazon (baja de 499).
  • Auriculares Razer Kraken X 7.1: nos auriculares gaming con sonido envolvente, compatibilidad multiplataforma, diseño ergonómico y ligero, drivers de 40 mm, está a 39,90 euros en PcComponentes (baja de 59,99).
  • Western Digital My Book 4 TB: Disco Duro Externo de Sobremesa de 4 TB ,3.5", USB 3.0, Negro, está a 100 euros en Amazon (baja de 135).
  • HP 14s-dq2004ns: un portátil de 14" Full HD con un Core i5-1135G7, 8 GB de RAM, 512 GB de SSD, Intel Iris Xe, sin sistema operativo, teclado español, está a 549,99 euros en Amazon (baja de 599,99).
  • Xiaomi Mi 10 Lite 5G: un móvil de 6,57" con un Snapdragon 765G con el que tendréis conectividad 5G, 6 GB de RAM, 64 GB de capacidad, cámara quad (48+8+2+2), lector de huella bajo pantalla, 4.160 mAh de batería, está a 315 euros en Amazon (baja de 399).
  • SSD Crucial MX500 1 TB: una unidad interna con conexión SATA, hasta 560 MB/s, 1 TB de capacidad, está a 88,75 euros en Amazon (baja de 101,58).
  • Monitor Philips 273V7QDAB: un monitor de 27" Full HD a 75 Hz con resolución Full HD, montura VESA, VGA, HDMI, está a 162 euros en Amazon (baja de 29,99).
  • Pendrive SanDisk Dual 128 GB: una llave de memoria con dos conectores, USB-A y USB-C, perfecta para pasar contenidos del móvil al PC por ej, está a 19,99 euros en Amazon (baja de 34,99).
  • SanDisk Ultra Dual m3.0 64 GB: Unidad Dual con conector micro-USB en un extremo y un conector USB 3.0 en el otro , 64 GB, está a 9,99 euros en Amazon (baja de 16,99).

¿Quieres recibir un correo de aviso cuando publique nuevas entradas?

Standard

10 comentarios en “El mito del reconocimiento de voz en el PC

  1. Varo dice:

    Hola Javier: gracias por tu blog que sigo desde hace dos años, cuando me compré mi «Koyi»
    utilizó el programa Dragon NaturallySpeaking en español, alemán e inglés con distintas instalaciones desde hace varios años. Es cierto que en muchas ocasiones hay que corregir algunas palabras, especialmente términos técnicos o nombres propios, pero la comodidad de poder dictar 100 páginas mientras uno está tumbado en la cama (estoy escribiendo mi doctorado) no tiene precio. Después de muchas pruebas debo decir que hay dos factores esenciales en el reconocimiento de voz:
    1. La potencia del procesador. Como digo, lo utilizó desde hace años, en distintos ordenadores (entre ellos mi «Koyi» con instalación dual alemán y español) y el procesador se nota.
    2. La calidad del micrófono. Es un apartado esencial. Utilizó unos auriculares Logitech inalámbricos, aunque también he obtenido muy buenos resultados con un simple micrófono Bluetooth de Nokia.
    Aunque mucha gente no lo sabe Windows vista tiene integrado un sistema de reconocimiento de voz que funciona bastante bien, pero sin alcanzar la calidad del Dragon NaturallySpeaking. Este texto lo he escrito utilizando este programa y la única palabra que he tenido que deletrear ha sido «koyi». No me he molestado en intentar controlar todas las funciones del ordenador por medio de la voz, para no estar siempre pendiente de los auriculares, pero desde luego para textos extensos es una gozada.
    Un saludo desde Alemania

    • JaviPas dice:

      Varo, gracias por el comentario 😉 Ya veo que algunos le habéis pillado el tranquillo. Está claro que para trasladar/transcribir textos es una solución interesante, pero si uno tiene que escribir «sobre la marcha» la cosa se complica.

      Al menos esa fue mi experiencia, y David, entrené a tope. Durante un mes. Y no me acabó compensando. De todos modos, como dice Varo igual el micro es importante, yo usaba uno de andar por casa y eso podría haber influido.

      No sé, quizá le dé una nueva oportunidad al tema en el futuro, pero cuando estuve probando llegué a la conclusión de que escribo más rápido de lo que dicto… al menos con las molestias de andar corrigiendo.

  2. Varo dice:

    Gracias por la respuesta, Javier. Me alegro de por una vez poder aportar algo a tu fantástico blog, y es que como soy muy vago, en el tema de reconocimiento de voz tengo mucha experiencia.
    Empeze con el Viavoice de IBM hace años, que era una patata. Había que leer medio Quijote para que empezase a entender algo, pero con el Dragon Naturallyspeaking en 10 minutos lo entiende todo. Algunos amigos han probado incluso con mi perfil de voz y el reconocimiento era asombroso. Por cierto, Viavoice lo compró Nuance hace algún tiempo y supongo que ahora tendra el mismo motor de reconocimiento que Dragon (Nuance).

    La versión que uso en alemán la tengo instalada en una máquina virtual con XP y aunque mi pronunciación no es perfecta el reconocimiento es tan bueno como en español. Por desgracia Dragon no admite instalaciones múltiples y hay que recurrir a trucos. El inglés lo trae de serie con el español.
    Se me había olvidado añadir que otro factor muy importante (además del micrófono) es el ruido ambiente. Yo lo utilizo sólo en mi casa o en la oficina con la ventana cerrada. Con el Koyi, en la calle… ni te molestes. Y para lo que tú haces, que me supongo estarás escribiendo en cualquier sitio, seguramente no te compense. Pero en contextos de dictado en los que yo lo uso, traducción, redacción de informes, tesis doctoral,etc, es fantástico.

    Dragon tiene una versión juridica y otra médica, que en los EE.UU. están extendidísimas. De hecho una de las primeras aplicaciones para el iPad ha sido el Dragon.

    El amigo que me recomendo tu blog, que es un profesional de la informática (!ese Logro!) lo utilizó además de para preparar las oposiciones (elaboró todo el temario con Dragon), para introducir varios miles de cifras en una base de datos con una precisión casi perfecta.

    Por cierto, mi Koyi también está buscando sustituto. Siguiendo tu ejemplo, tengo un arranque múltiple, aunque sólo doble con Vista Ultimate (1 usuario en alemán y otro en español) y un Mac OS. (El Ubuntu en el pendrive) y el pobre no da para más. En reconocimiento de voz va lentííísimo (se nota la potencia) y el programa de reconocimiento de Vista va regular. En cualquier caso el micrófono sigue siendo determinante. Como yo el Koyi lo utilizo más que para escribir, para dar clases en la Uni y en viajes, estoy esperando a las nuevas tabletas en otoño. El Ipad aquí todavía no se ha visto ni uno. A ver si se mueven las otras empresas que la competencia es lo mejor que hay y apple está muy sola.

    Gracias por tu blog y muchos saludos desde Jena-Turingia-Alemania

    • JaviPas dice:

      Gracias a ti también por los comentarios, me alegro de que participes 😉 así que no desfallezcas y comenta cuando quieras!

      Cuando utilicé DNS lo hice en casita y en español, así que ruido ambiente no había. Como digo, me acabé cansando de estar corrigiendo nombres de empresas y tecnologías cuando iba dictando las noticias. Por cierto, en casa trabajo con maquinón, así que problema por ese lado no puede haber 😉

      Ya me contarás si cambias finalmente el Koji. Yo sigo planteándomelo, pero tardo en tomar decisiones, me gusta otear bien el mercado, y no tengo una prisa especial. Yo ahora lo tengo bastante distinto a como lo tenía en los primeros tiempos. Mac OS X desapareció y ahora lo uso con W7, pero siempre en arranque múltiple con sistemas para netbooks varios. Ahora tengo Jolicloud, MeeGo, Chromium OS Flow y, por supuesto, una Ubuntu 10.04. Y voy cambiando según me va 😉

      Suerte con la tesis! Si algún día voy por allí ya contactaré para tomarme unos frankfurten con una buena bier 😉

  3. Varo dice:

    Eso está hecho. Pero nada de frankfurten que Turingia es la capital de las Bratwurst (mucho mejores, palabrita) y con una cervecita negra Köstrizer… ummmmm. Yo invito, en serio. Si quieres ver como es esto mira el blog de mi página que es la dirección de mi correo. Hace mucho que no la actualizo pero en el blog se ven unos videos de Navidad muy chulos.
    Saludos

    • clon dice:

      Hola Varo… estuve leyendo tus mensajes en el blog y me parecio que estas muy entrado en esto del DNS, es por eso que te pido un gran favor, que me ayudes a encontrar un perfil en ingles en lo preferente de alquien nativo de U.S., estoy en un curso de ingles y estoy adelantando muchisimo mi unico problema es el da la pronunciacion, pienso que con un buen perfil prodria mejorar muchisimo mi ingles….Un gran abrazo a la distancia y gracias…….

  4. Oscaar dice:

    Yo empece a utilizar el DNS 10 pero coincido con ustedes que se debe tener un ambiente libre de ruido, y poseer un buen micròfono para que de buenos resultados, estoy empezando a utilizar el reconomiento de voz de W7 y me parece mucho mejor que el DNS en cuanto a presiciòn ya que lo he usado con un micròfono de mala calidad marca «patito» y con la televisiòn encendida y me ha funcionado bien, en cuanto a palabras tècnicas y lèxico especial, pues sí, hay que ir ingresándolas a la aplicaciòn para que las vaya grabando y no haya problema con ellas en futuras ocasiones, y hablando al respecto, que micròfono me recomiendan para el reconocimiento de voz.

  5. Hola, pues a mi el reconocimiento de voz me funciona bastante bien, de hecho, lo uso para redactar trabajos de investigación en el colegio, etc. La calidad del micrófono es crucial, sin embargo, también depende de la potencia del procesador, porque se puede aumentar o disminuir la precisión del DNS. Un consejo que le doy al que escribió esta noticia es que almacene en un documento de Word o .txt todas las palabras técnicas con el teclado, después vaya al DNS y las pase por el sistema que recopila más palabras para agregarlas a diccionario, así se te hará más fácil que el sistema reconozca las palabras técnicas.

Comentarios cerrados