Tecnología

El mito del reconocimiento de voz en el PC

·

Hacía tiempo que no leía a mi admirado Jeff Atwood, al que sigo en Twitter por inercia (aunque sus tweets son bastante tostón, la verdad) y que publica cada vez menos en su blog. El último artículo ahora mismo es el del 21 de junio, y habla sobre un tema curioso: el reconocimiento de voz en los ordenadores.

Muchas empresas han tratado de popularizar este sistema como la nueva revolución en interfaces de usuario, dotando a nuestros sistemas operativos de aplicaciones nativas que eran capaces de hacer que controlásemos el PC o el portátil a través de órdenes de voz.

Pero es que una cosa es el control por voz («Abrir-Internet-Explorer», «Cerrar-ventana»), y otra muy distinta el reconocimiento de voz, en el que uno espera que todo lo que digamos al ordenador sea perfectamente interpretado y reconocido por esos algoritmos de reconocimiento.

Y es que, como dice Atwood en Coding Horror, hay un problema clave en el reconocimiento de voz:

Que no funciona.

Puede que la afirmación sea algo tajante, pero no por ello deja de ser cierta. Al menos, en gran parte. Y tengo que certificar sus palabras: durante aproximadamente un mes traté de usar de forma permanente Dragon Naturally Speaking 11 para escribir mis artículos en los medios en los que trabajo.

El resultado fue bastante decepcionante, y a pesar de irme acostumbrando a parecer un loco hablando en un tono alto y claro (exigencias del programa), la tasa de aciertos nunca fue satisfactoria.

Más aún cuando en la jerga informática hay que utilizar continuamente nombres de empresas y tecnologías que los programas de reconocimiento de voz no pillan. Ni a la primera, ni a la segunda, y muchas veces, ni a la enésima. Eso provocaba que cada tres por cuatro tuviera que parar el reconocimiento («A dormir», qué gracia me hacía aquello) para corregir la frase o palabra tirando de ratón y teclado, como en los buenos y viejos tiempos.

En el artículo de Coding Horror se plasma esa situación con un pequeño diagrama -sacado de un artículo relacionado con el tema e igualmente interesante- en el que se explica que en la actualidad el acierto en programas de reconocimiento de voz no pasa del 80%, mientras que el nivel requerido para trabajar de forma cómoda debería ser del 96 al 98%.

Voice-recognition-accuracy-rate-over-time

De hecho, lo curioso del caso es que ya no sirve de nada tener un maquinón para acelerar el procesamiento de nuestra voz y los algoritmos de reconocimiento. Estamos en el mismo punto en que estábamos hace 10 años:

In 2001 recognition accuracy topped out at 80%, far short of HAL-like levels of comprehension. Adding data or computing power made no difference. Researchers at Carnegie Mellon University checked again in 2006 and found the situation unchanged.

With human discrimination as high as 98%, the unclosed gap left little basis for conversation. But sticking to a few topics, like numbers, helped. Saying €œone€ into the phone works about as well as pressing a button, approaching 100% accuracy. But loosen the vocabulary constraint and recognition begins to drift, turning to vertigo in the wide-open vastness of linguistic space.

Así es: no se ha avanzado, y nos tenemos que limitar al control por voz, que consta de órdenes simples, mecánicas, y que, todo hay que decirlo, ayudan en ciertos escenarios como los de la accesibilidad para personas invidentes o con algún tipo de minusvalía. Sin embargo, esos sistemas nunca podrán sustituir -al menos, eso parece- a los fantásticos ratones y teclados a los que ya estamos pegados.

Así que ale, a volver a los buenos y viejos tiempos.


Incognichollos

Esta es una selección con las mejores ofertas tecnológicas actualizadas casi diariamente, como expliqué aquí. Aunque estés en un post «antiguo» las ofertas son de última hora, los Incognichollos los actualizo aparte. También puedes seguir los Incognichollos en Twitter o en el nuevo canal de Telegram 🙂 . Aprovecha, que no suelen durar mucho tiempo.

  • Amazon Music: el servicio tipo Spotify de Amazon está de promoción, y puedes disfrutar de los 4 primeros meses por 0,99 euros.
  • Lenovo Legio Y540: un portátil gaming fantástico. 15,6″ Full HD, Core i7-9750H, 16 GB de RAM, 256 GB SSD, 1 TB HDD, una GTX 1650, teclado retroiluminado en español, sin Windows. Está a 999 euros en Amazon (baja 200€).
  • OnePlus 7T Pro: 6,67″ a 90 Hz, Snapdragon 855+, 8 GB de RAM, 256 GB de capacidad, cámara triple (48+8+16 MP), 4.085 mAh de batería, lector de huella bajo pantalla, cámara selfie pop-up. A tope, está a 603 euros en GearBest con el código SV826ZSF1Q
  • Xiaomi Gaming Laptop: el modelo de 15,6″ con pantalla 1080p a 144 Hz (mola!), un Core i5-9300H, 8 GB de RAM, 512 GB de SSD, y una GeForce GTX 1660 Ti. Con Windows, teclado retroiluminad (USA) y un precio de 1.183 euros en Banggood con el código BGXMG7P.
  • Destornillador eléctrico Bosch IXO: 3,6 V, caja de plástico, 10 puntas, cargador microUSB y destornillador eléctrico con pequeña linterna para iluminar. Está a 36 euros en Amazon (el dto se aplica al completar la compra).
  • Amazon Kindle Unlimited: la tarifa plana para leer libros electrónicos de un catálogo muy extenso. Los tres primeros meses salen ahora gratis, así que es una buena ocasión para probar, ¿no creéis?
  • ASUS ROG Phone 2: 6,59 pulgadas a 120 Hz (uauh!), Snapdragon 855+, 8 GB de RAM, 128 GB de capacidad, cámara dual (48+13 MP), y 6.000 mAh (uauh) de batería. Brutal para gamers. Está a 486 euros en Banggood con el código BG11ROG2
  • Juego NBA 2K20 + Auriculares Power A Fusion (PS4): curioso pack con el juego NBA 2K20 y esos auriculares con cable y altavoces de 50 mm que tienen buenas críticas. El conjunto está a 54,90 euros en Amazon, baja de 80.
  • Tarjeta MicroSD Lexar 256 GB: perfecta para ampliar a lo bestia la capacidad de almacenamiento de móvil o tableta. Velocidad de hasta 95 MB/s, capacidad brutal, clase 10, adaptador SD incluido, está a 28,11 euros en Amazon (baja de 43).
  • Pendrive 32 GB: una unidad 2 en 1 con conector USB-A y MicroUSB, y con una capacidad de de 32 GB a tan solo 4,19 euros en Amazon, nada mal para hacer vuestras copias de seguridad del móvil o tableta.
  • Realme X2 Pro: súper cholloteléfono, a tope en todo. 6,5 pulgadas 90 Hz, 12 GB de RAM, 256 GB capacidad, Snapdragon 855+, cámara cuádruple (64+13+8+2 MP), 4.000 mAh, lector bajo pantalla, está a 499 euros en exclusiva en Amazon.
  • Volante + pedales Thrustmaster T150 Ferrari Edition: para juegos de conducción volante y pedales para PS4, PS3 y PC, sistema Force Feedback, está a precio de risa, 119,98 euros en Amazon (antes 199,99).
  • Motorola One Zoom: con el asistente Alexa integrado, 6,4″, Snapdragon 675, 4 GB de RAM, 64 GB de capacidad, cuádruple cámara (48+8+16+5 MP), 4.000 mAh de batería, lector de huella bajo pantalla, muy interesante por 349,90 euros en Amazon (baja de 399).
  • iPad (2019): la tableta más reciente de Apple, 10,2 pulgadas, 32 GB de capacidad, Touch ID, chip A10 Fusion, cámara 8 MP, está a 70 euros menos en eBay: 299,99 euros (un año de garantía).
  • Portátil gaming ASUS ROG Zephyrus: un equipazo de 15,6 pulgadas FullHD, Ryzen 7 3750H, 8 GB de RAM, 512 GB de SSD, GeForce GTX 1660 Ti, sin sistema operativo, teclado español, está a 899,99 euros en Amazon (baja de 1.300).
  • Samsung Galaxy S8: ya tiene tiempo, pero sigue siendo muy majo. 5,8″, Exynos 8895, 4 GB de RAM, 64 GB de capacidad (ampliable), cámara dual 12+8 MP, 3.000 mAh, está a 429 euros en Amazon.
  • Portátil HP 15-DA0078NS: un equipo majo, 15 pulgadas HD (1366×768), 8 GB de RAM, 256 GB de SSD, tres puertos USB 3.0, lector SD, salida HDMI, sin Windows. Está a 459,99 euros en eBay.
  • Smartwatch Armani Exchange: cualquiera puede tener un reloj inteligente de Armani. Wear OS, GPS, NFC, sensor de frecuencia cardiaca, notificaciones, diseño llamativo. En ECI cuesta 299 euros. En Amazon UK lo tenéis a 142 euros envío incluido. Chollazo.
  • Echo Dot (3ª Gen): altavoz inteligente que además muestra la hora y temperatura, color gris claro, soporta Alexa, está a 44,99 euros en Amazon (baja de 70).
  • Ratón Logitech M535: un ratón compacto de viaje con tecnología láser y conectividad Bluetooth, en color gris y amarillo, está a 19,97 euros en Amazon.
  • Raspberry Pi 4 2 GB: la última versión de este popular miniPC en su variante de 2 GB de RAM, yo creo que la más llamativa. Está a 47,95 euros en AliExpress
  • Samsung Galaxy A50: con pantalla de 6,4″, Exynos 9610, 4 GB de RAM, 128 GB de capacidad, lector de huella en pantalla, cámara triple (25+8+5 MP), 4.000 mAh, NFC, está a 265,99 euros en eBay.
  • Xiaomi Mi A3: 6,01″, Snapdragon 665, 4 GB de RAM, 128 GB de capacidad, cámara triple (48+8+2 MP), Android One (puro, sin MIUI), lector de huella bajo pantalla, sin NFC, brutal por 154 euros en GearBest con el código GBA312801
  • Huawei P Smart: un móvil sencillo, dual SIM, 5,65″, Kirin 659, 3 GB de RAM, 32 GB de capacidad (ampliables), cámara dual 13+2MP, 3.000 mAh, Android 8.0, radio FM, está a solo 89,97 euros en Amazon.
  • Robot aspirador Xiaomi V2 Pro: un robot aspirador con tanque mixto y regulación de agua durante el fregado. Dispone de WiFi y podemos controlarlo con el móvil vía la app MiHome. Está a 269 euros en AliExpress Plaza, envío desde España.
  • Amazfit GTS: un reloj cuantificador con pantalla rectangular AMOLED de 341 ppp, muy rollo Apple Watch, GPS, NFC, sumergible a 50 m, BT 5.0, ritmo cardiaco, 220 mAh, novedad total, está a 127 euros en AliExpress con envío desde España en 3 días.
  • Reloj cuantificador Amazfit GTR: el modelo de 42 mm, versión internacional, acero inoxidable, batería 25 días, sumergible 5 ATM, GPS, CLONASS, 5 modos deportivos, pantalla AMOLED, notificaciones. Está a 108 euros en GearBest, 2 años de garantía en España.
  • Xiaomi Roborock S55: robot aspirador con depósito para líquidos que permite aspirar y fregar al mismo tiempo. Sistema de mapeado láser, más potente y controlable desde la appp móvil. Está a 255 euros en Banggood (lo normal son 400) con el código BGERS55
  • Unidad SSD Samsung 860 1 TB: tremenda esta unidad SSD SATA de 2,5 pulgadas y 1 TB de capacidad por 95,60 euros en Amazon Francia envío incluido.
  • Honor Band 5i: pantalla de 0,96 pulgadas, Bluetooth 4.2, carga directa con su pulsera con conector USB (genial), 91 mAh (hasta 9 días), niveles de oxígeno en sangre, frecuencia cardiaca, 9 deportes, música, resistente al agua. Está a 25,5 euros en eBay.
  • Monitor Gaming HP 25MX: un 25 pulgadas con resolución 1920×1080 que destaca por su panel de 144 Hz, por su soporte AMD FreeSync pero sobre todo por su sistema de iluminación ambiental (tipo ambilight). Muy chulo por 189,99 euros en Amazon.
  • Honor 10: muy majo con sus 5,84 pulgadas, Kirin 970, 4 GB de RAM, 128 GB de capacidad, cámara dual 16+16 MP, 3.400 mAh y lector de huellas bajo pantalla. Está a 216,14 euros en Banggood
  • Smart TV Samsung QLED 55 pulgadas: el modelo QE55Q60R con tecnología Quantum Dot, 4K Ultra HD, modelo de este año, Q HDR, con app de Apple TV, en PCComp está a 819 pero en eBay la tienen a 666 euros.
  • Apple AirPods (2019): estuche de carga (no inalámbrica) incluido. Se encienden y se conectan al instante al iPhone, Apple Watch, iPad o Mac, hasta 5 horas de autonomía con una carga. Están a 124 euros en eBay con el código P10MIEDO
  • Smart TV Hitachi HK5100: alucinante esta tele LED de 65 pulgadas, UHD 4K, dual core, 1 USB, 2 HDMI, WiFi, Ethernet. Espectacular en Carrefour por 499 euros. Hasta el 6 de nov te ahorras el IVA y todo. Buf.
  • OnePlus 7T: CHOLLAZO. 6,55″, soporte 90 Hz, Snapdragon 855+, 8 GB de RAM, 256 GB capacidad, cámara triple (48+12+16 MP), 3.800 mAh, lector bajo pantalla, excepcional por 458 euros en GearBest con el código GBOP7TG8256
  • Xiaomi Redmi Note 8 Pro: el nuevo cholloteléfono. 6,53?, Helio G90T, 6 GB de RAM, 64 GB capacidad, cuatro cámaras (64+8+2+2) – debuta el sensor de 64 MP!, 4500 mAh (uauh), NFC, está a 153,80 euros en AliExpress con el código ALISALE10 y cupones selección.
  • OnePlus 7: Snapdragon 855, 8 GB de RAM, 256 GB de capacidad (uauh), cámara dual 48+5 MP, lector de huella en pantalla, 3700 mAh. Está a 356,38 euros en AliExpress, se puede pagar con PayPal.
  • Smart TV Philips 49″ con Ambilight: una televisión 4K UHD con soporte HDR, 49 pulgadas de diagonal y sistema ambilight, gama 2018, está a 436 euros en Amazon Italia, envío incluido. (Casi 100 euros de ahorro).
  • Motorola One Zoom: con el asistente Alexa integrado, 6,4″, Snapdragon 675, 4 GB de RAM, 64 GB de capacidad, cuádruple cámara (48+8+16+5 MP), 4.000 mAh de batería, lector de huella bajo pantalla, muy interesante por 349 euros en Amazon (baja desde los 399).
  • New Balance MS 247: zapatillas de deporte para hombre, varias tallas y colores, la de color borgoña de la foto en un 44,5 sale por 45 euros por ejemplo.
  • PS4 Slim + Fortnite + Resident Evil 2: la consola de Sony con 500 GB de capacidad, un mando y estos dos juegos por 242 euros en Amazon Francia, envío incluido.
  • Xiaomi Redmi Note 8 Pro: 6,53″, Helio G90T, 6 GB de RAM, 64 GB capacidad, cuatro cámaras (64+8+2+2) – debuta el sensor de 64 MP!, 4500 mAh (uauh), NFC, está a 174 euros en AliExpress: agregadlo a la cesta y el 11.11 pagad el importe indicado.
  • Doom juego de mesa: curioso este juego de tablero basado en el legendario juego de ordenador. Está a 59,95 euros en Amazon, baja desde los 79,95.
  • iPhone 11 Pro Max 512 GB: cargado hasta los dientes. Cámara triple alucinante, CPU Apple A13 Bionic, pantalla de 6,5″ Super Retina, y 512 GB de capacidad. Muy rebajado, 1392 euros al confirmar pedido (1650 normal) en Amazon Alemania envío incluido.
  • Portátil Medion MD61264: un 14 pulgadas FullHD modesto con un Pentium N5000, 4 GB de RAM, SSD de 128 GB y Windows 10 Home, nada mal, la verdad, sobre todo por este precio: 339 euros en Amazon.
  • Amazon Fire TV Stick: el competidor del Chromecast tiene su propio mando a distancia y permite reproducir en tu tele todo lo que tengas en tu tableta o móvil. Fantástico por 24,99 euros en Amazon, baja un 25%.
  • Logitech G29: el volante y pedales para juegos de conducción y carreras, compatible con PS3, PS4 y PC Windows. Es el modelo reacondicionado (estado «Muy bueno»), garantía Amazon. Está a un precio escandaloso, 130 euros en Amazon Francia, envío incluido.
  • Monitor Samsung 32 pulgadas: un monitor curvo de 32 pulgadas de diagonal con resolución 2.560 x 1.440 píxeles, 4 ms de tiempo de respuesta, genial para trabajar y jugar a lo grande. Muy barato, 295 euros en Amazon Alemania, envío incluido.
  • ASUS ROG Phone 2: 6,59 pulgadas a 120 Hz (uauh!), Snapdragon 855+, 8 GB de RAM, 128 GB de capacidad, cámara dual (48+13 MP), y 6.000 mAh (uauh) de batería. Brutal para gamers. Está a 486 euros en Banggood con el código BGROG2GR8
  • Portátil Chuwi LapBook Plus: un equipo sorprendente. 15,6? con resolución 4k (uauh), Intel Atom X7-E3950, 8 GB de RAM, 256 GB SSD, ranura microSD, teclado retroiluminado (inglés), Windows 10, está a 347 euros en Banggood con el código BGCWLQ2
  • OnePlus 7T Pro: el súper teléfono con 6,67? a 90 Hz, Snapdragon 855+, 8 GB de RAM, 256 GB de capacidad, cámara triple (48+8+16 MP), 4.085 mAh, brutal por 653 euros en GearBest con el código GBOP7TP8256
  • Apple iPhone 7 32 GB: son terminales de exposición, perfectos estéticamente, abiertos pero sin usar, en varios colores, garantía de un año, con cargador y cable lightning, están a 269 euros en eBay.
  • Huawei P30 Lite: 6,15?, Kirin 710, 4 GB de RAM, 128 GB de capacidad, cámara triple (48+8+2), 3340 mAh, lector de huella trasero, NFC, minijack, está a 255,99 euros en eBay.
  • Micrófono Blue Yeti Nano Premium: un micrófono de alta calidad, uno de los más populares y valorados por parte de los podcasters y Youtubers. Está a 89,74 euros en Amazon. (precio normal 120).
  • OnePlus 7: estupendo con sus 6,41?, Snapdragon 855, 8 GB de RAM, 256 GB de capacidad (uauh), cámara dual 48+5 MP, lector de huella en pantalla, 3700 mAh. Está a 360 euros en GearBest con el código GBOP7GEUR (2 años garantía España)
  • Xiaomi Redmi Note 8: 6,53?, Snapdragon 665, 3 GB de RAM, 32 GB de capacidad, cámara cuádruple (48+8+2+2) y 4.000 mAh de batería. Está a 149 euros en GearBest con el código GBNOTE805. El de 4/64 GB por 168€ con el código GBNOTE801
  • Xiaomi Mi 9T Pro: Snapdragon 855. 6,39?, selfie popup, 6 GB de RAM, 64 GB capacidad, cámara de 48+13+8 MP, 4000 mAh, NFC, color rojo, lector de huella en pantalla. Está a 296 euros en Banggood con el código BGMI9TCL3
  • Nintendo Switch: el modelo en colores azul y rojo y con los dos mandos está a 269,99 euros en eBay. Envío desde España y dos años de garantía.
  • OnePlus 7 Pro: 6,67? a 90 Hz gloriosos, Snapdragon 855, 6 GB de RAM, 128 GB capacidad, cámara triple 48+16+8 MP, cámara frontal 16 MP retráctil, lector bajo pantalla, 4.000 mAh, espectacular a 549,95 euros en GearBest con el código GBOP7PGSBW
  • Xiaomi Redmi Note 8: el nuevo teléfono chollo de 6,53?, Snapdragon 665, 3 GB de RAM, 32 GB de capacidad, cámara cuádruple (48+8+2+2) y 4.000 mAh de batería. Estupendo a 150 euros en Banggood con el código BGN8G3. Más versiones: 4/64 GB por 168 euros en Banggood con el código BGN841 y la de 4/128 GB está a 187 euros en Banggood con el código BGN881
  • Portátil Xiaomi Mi Ruby 2019: estupendo con sus 15,6?, 1920×1200 píxeles, Core i5-8250U, 8 GB de RAM (¡ampliables!), 512 GB de SSD, GeForce MX110 2 GB, teclado numérico, teclado USA, gran touchpad. Está a 550 euros en Banggood con el código BGRRU9
  • Xiaomi Redmi Note 8 Pro: el nuevo cholloteléfono. 6,53?, Helio G90T, 6 GB de RAM, 64 GB capacidad, cuatro cámaras (64+8+2+2) – debuta el sensor de 64 MP!, 4500 mAh (uauh), NFC, está a 175 euros en GearBest con código GBNOTE8P1 (2 años garantía España)
  • Xiaomi Mi 9 Lite: una versión estupenda y más barata, 6,39?, Snapdragon 710, 6 GB de RAM, 64 GB de capacidad, cámara triple (48+8+2 MP), 4030 de batería, está a 215,40 euros en GearBest con el código GBMI9LITE101 (2 años garantía España)
  • Televisor LED 40 pulgadas TD Systems: modelo K40DLM7F para un televisor básico con resolución 1080p, diagonal de 40 pulgadas, 3 puertos HDMI, VGA; USB reproductor y grabador, eficiencia A+. Está increíble a 169 euros si no necesitáis más pulgadas y 4K.
  • Portátil convertible BMAX Y13: un equipo sorprendente. 13,3 pulgadas táctil, convertible en tableta, Intel Celeron N4100 (modesto ahí), 8 GB de RAM, 256 GB de SSD, teclado retroiluminado, puerto USB-C, WiFi 802.11ac. Está a 336 euros en GearBest
  • Portátil convertible Teclast F5R: de ese estilo también es este modelo de 11,6 pulgadas con un N3450, 8 GB de RAM, 256 GB de SSD; también con pantalla táctil, modo tableta, WiFi 802.11ac, está a 245 euros en Banggood con el código BGF5RP
  • Robot de cocina Taurus MyCook: calienta por inducción, función sofrito, 10 velocidades, de 40 a 120 °C, balanza integrada, recetario impreso con 250 páginas, jarra de 2 litros. Está a 329 euros en Amazon.
  • Tablet Amazon Fire 7: la renovada tableta de Amazon con mejor procesador y sobre todo con el doble de capacidad que el modelo de 2017. La versión de 16 GB (ampliable vía microSD) está a tan solo 69,99 euros en Amazon.
  • Báscula Xiaomi Mi Smart Scale 2: estupenda para monitorizar el peso de varias personas, versión renovada, Bluetooh 5.0, está a 19,99 euros en Amazon

¿Quieres recibir un correo de aviso cuando publique nuevas entradas?

Standard

10 comentarios en “El mito del reconocimiento de voz en el PC

  1. Varo dice:

    Hola Javier: gracias por tu blog que sigo desde hace dos años, cuando me compré mi «Koyi»
    utilizó el programa Dragon NaturallySpeaking en español, alemán e inglés con distintas instalaciones desde hace varios años. Es cierto que en muchas ocasiones hay que corregir algunas palabras, especialmente términos técnicos o nombres propios, pero la comodidad de poder dictar 100 páginas mientras uno está tumbado en la cama (estoy escribiendo mi doctorado) no tiene precio. Después de muchas pruebas debo decir que hay dos factores esenciales en el reconocimiento de voz:
    1. La potencia del procesador. Como digo, lo utilizó desde hace años, en distintos ordenadores (entre ellos mi «Koyi» con instalación dual alemán y español) y el procesador se nota.
    2. La calidad del micrófono. Es un apartado esencial. Utilizó unos auriculares Logitech inalámbricos, aunque también he obtenido muy buenos resultados con un simple micrófono Bluetooth de Nokia.
    Aunque mucha gente no lo sabe Windows vista tiene integrado un sistema de reconocimiento de voz que funciona bastante bien, pero sin alcanzar la calidad del Dragon NaturallySpeaking. Este texto lo he escrito utilizando este programa y la única palabra que he tenido que deletrear ha sido «koyi». No me he molestado en intentar controlar todas las funciones del ordenador por medio de la voz, para no estar siempre pendiente de los auriculares, pero desde luego para textos extensos es una gozada.
    Un saludo desde Alemania

    • JaviPas dice:

      Varo, gracias por el comentario 😉 Ya veo que algunos le habéis pillado el tranquillo. Está claro que para trasladar/transcribir textos es una solución interesante, pero si uno tiene que escribir «sobre la marcha» la cosa se complica.

      Al menos esa fue mi experiencia, y David, entrené a tope. Durante un mes. Y no me acabó compensando. De todos modos, como dice Varo igual el micro es importante, yo usaba uno de andar por casa y eso podría haber influido.

      No sé, quizá le dé una nueva oportunidad al tema en el futuro, pero cuando estuve probando llegué a la conclusión de que escribo más rápido de lo que dicto… al menos con las molestias de andar corrigiendo.

  2. Varo dice:

    Gracias por la respuesta, Javier. Me alegro de por una vez poder aportar algo a tu fantástico blog, y es que como soy muy vago, en el tema de reconocimiento de voz tengo mucha experiencia.
    Empeze con el Viavoice de IBM hace años, que era una patata. Había que leer medio Quijote para que empezase a entender algo, pero con el Dragon Naturallyspeaking en 10 minutos lo entiende todo. Algunos amigos han probado incluso con mi perfil de voz y el reconocimiento era asombroso. Por cierto, Viavoice lo compró Nuance hace algún tiempo y supongo que ahora tendra el mismo motor de reconocimiento que Dragon (Nuance).

    La versión que uso en alemán la tengo instalada en una máquina virtual con XP y aunque mi pronunciación no es perfecta el reconocimiento es tan bueno como en español. Por desgracia Dragon no admite instalaciones múltiples y hay que recurrir a trucos. El inglés lo trae de serie con el español.
    Se me había olvidado añadir que otro factor muy importante (además del micrófono) es el ruido ambiente. Yo lo utilizo sólo en mi casa o en la oficina con la ventana cerrada. Con el Koyi, en la calle… ni te molestes. Y para lo que tú haces, que me supongo estarás escribiendo en cualquier sitio, seguramente no te compense. Pero en contextos de dictado en los que yo lo uso, traducción, redacción de informes, tesis doctoral,etc, es fantástico.

    Dragon tiene una versión juridica y otra médica, que en los EE.UU. están extendidísimas. De hecho una de las primeras aplicaciones para el iPad ha sido el Dragon.

    El amigo que me recomendo tu blog, que es un profesional de la informática (!ese Logro!) lo utilizó además de para preparar las oposiciones (elaboró todo el temario con Dragon), para introducir varios miles de cifras en una base de datos con una precisión casi perfecta.

    Por cierto, mi Koyi también está buscando sustituto. Siguiendo tu ejemplo, tengo un arranque múltiple, aunque sólo doble con Vista Ultimate (1 usuario en alemán y otro en español) y un Mac OS. (El Ubuntu en el pendrive) y el pobre no da para más. En reconocimiento de voz va lentííísimo (se nota la potencia) y el programa de reconocimiento de Vista va regular. En cualquier caso el micrófono sigue siendo determinante. Como yo el Koyi lo utilizo más que para escribir, para dar clases en la Uni y en viajes, estoy esperando a las nuevas tabletas en otoño. El Ipad aquí todavía no se ha visto ni uno. A ver si se mueven las otras empresas que la competencia es lo mejor que hay y apple está muy sola.

    Gracias por tu blog y muchos saludos desde Jena-Turingia-Alemania

    • JaviPas dice:

      Gracias a ti también por los comentarios, me alegro de que participes 😉 así que no desfallezcas y comenta cuando quieras!

      Cuando utilicé DNS lo hice en casita y en español, así que ruido ambiente no había. Como digo, me acabé cansando de estar corrigiendo nombres de empresas y tecnologías cuando iba dictando las noticias. Por cierto, en casa trabajo con maquinón, así que problema por ese lado no puede haber 😉

      Ya me contarás si cambias finalmente el Koji. Yo sigo planteándomelo, pero tardo en tomar decisiones, me gusta otear bien el mercado, y no tengo una prisa especial. Yo ahora lo tengo bastante distinto a como lo tenía en los primeros tiempos. Mac OS X desapareció y ahora lo uso con W7, pero siempre en arranque múltiple con sistemas para netbooks varios. Ahora tengo Jolicloud, MeeGo, Chromium OS Flow y, por supuesto, una Ubuntu 10.04. Y voy cambiando según me va 😉

      Suerte con la tesis! Si algún día voy por allí ya contactaré para tomarme unos frankfurten con una buena bier 😉

  3. Varo dice:

    Eso está hecho. Pero nada de frankfurten que Turingia es la capital de las Bratwurst (mucho mejores, palabrita) y con una cervecita negra Köstrizer… ummmmm. Yo invito, en serio. Si quieres ver como es esto mira el blog de mi página que es la dirección de mi correo. Hace mucho que no la actualizo pero en el blog se ven unos videos de Navidad muy chulos.
    Saludos

    • clon dice:

      Hola Varo… estuve leyendo tus mensajes en el blog y me parecio que estas muy entrado en esto del DNS, es por eso que te pido un gran favor, que me ayudes a encontrar un perfil en ingles en lo preferente de alquien nativo de U.S., estoy en un curso de ingles y estoy adelantando muchisimo mi unico problema es el da la pronunciacion, pienso que con un buen perfil prodria mejorar muchisimo mi ingles….Un gran abrazo a la distancia y gracias…….

  4. Oscaar dice:

    Yo empece a utilizar el DNS 10 pero coincido con ustedes que se debe tener un ambiente libre de ruido, y poseer un buen micròfono para que de buenos resultados, estoy empezando a utilizar el reconomiento de voz de W7 y me parece mucho mejor que el DNS en cuanto a presiciòn ya que lo he usado con un micròfono de mala calidad marca «patito» y con la televisiòn encendida y me ha funcionado bien, en cuanto a palabras tècnicas y lèxico especial, pues sí, hay que ir ingresándolas a la aplicaciòn para que las vaya grabando y no haya problema con ellas en futuras ocasiones, y hablando al respecto, que micròfono me recomiendan para el reconocimiento de voz.

  5. Hola, pues a mi el reconocimiento de voz me funciona bastante bien, de hecho, lo uso para redactar trabajos de investigación en el colegio, etc. La calidad del micrófono es crucial, sin embargo, también depende de la potencia del procesador, porque se puede aumentar o disminuir la precisión del DNS. Un consejo que le doy al que escribió esta noticia es que almacene en un documento de Word o .txt todas las palabras técnicas con el teclado, después vaya al DNS y las pase por el sistema que recopila más palabras para agregarlas a diccionario, así se te hará más fácil que el sistema reconozca las palabras técnicas.

Comentarios cerrados