De repente lo medimos todo. Porque podemos hacerlo, básicamente. Cuantificamos lo que nos rodea, pero también nos cuantificamos a nosotros mismos. Y sobre todo nos cuantifican sin que sepamos muy bien para qué. Es el misterio del Big Data, ese segmento del que tanto se habla en círculos empresariales y del que poco a poco hemos ido viendo alguna que otra aplicación práctica.
En mi gremio, por ejemplo, está esa disciplina llamada ‘periodismo de datos’. En él hay medios que como FiveThirtyEight se han convertido en la biblia de los que aman los datos y las conclusiones que de ellos se pueden sacar. Nate Silver, su creador, es el científico de datos por excelencia. Empezó analizando los datos de la liga de béisbol de aquel país para acabar sacando al mercado una especie de puntuación Elo de los jugadores que cambió para siempre el mercado de fichajes de este deporte. Como Brad Pitt, ya sabéis. Luego decidió que el béisbol era aburrido -tardó bastane el tío- y se dedicó a un campo mucho más llamativo: la política.
Silver se ha convertido desde entonces en ese tipo en el que todos los partidos políticos se fijan para saber si sus carreras electorales van bien o mal. Se está haciendo de oro otra vez a base de cubrir las presidenciales en EE.UU., y una y otra vez el ingrediente secreto es el mismo:
Los datos.
Aquí el amigo ha logrado aplicar su experiencia anterior para analizar con una precisión envidiable lo que pasará en esas elecciones y crear todo tipo de previsiones en las que hay papel protagonista de las herramientas de visualización y esos mapas tan chulos con colores azules y rojos que muestran quién lleva más ventaja entre los dos candidatos. Parece, por cierto, que Trump lo tiene crudo.
Como decía este es un buen ejemplo dentro de «mi mundo» que demuestra lo importantes que pueden ser esos datos bien utilizados. En España hay algunos casos prácticos interesantes como los que por ejemplo ha desarrollado el BBVA Innovation Center, pero los avances parecen más tímidos de lo que prometía el tema, o quizás el problema es que no haya quien sepa sacar partido a esos datos.
https://www.youtube.com/watch?v=Zel6wych9p0
Ese es el papel de la Ciencia de Datos (que siempre mola más nombrar en inglés, ‘Data Science’) y de los científicos de datos (‘Data Scientists’) que además pueden aprender el oficio gracias a ciclos de formación específica en esta disciplina. Un ejemplo es el Máster en Data Science que imparte la escuela de negocio de la Universidad de Alcalá, que como en otros casos ha entendido que hay una necesidad -formar a los futuros científicos de datos- con un mercado que está demandando este tipo de profesionales y pagando lo que valen. Y valen bastante, por lo que se oye por ahí.
Aquí la idea no es la de entender de qué va esto de la recolección de datos, sino el de utilizar diversas herramientas para sacar conclusiones de esos datos. Es algo similar a lo que proponía la minería de datos hace años, pero hoy en día las nomenclaturas han cambiado y también esas herramientas en las que lenguajes como R y Python son importantes para gestionar tales volúmenes de información, pero en la que también entran muchas ramas muy, muy curiosas como el aprendizaje automático (machine learning), el procesamiento del lenguaje natural, la inteligencia de negocio o esa programación estadística que como os decía es coto de caza de R, un lenguaje que tiene pinta de ser súper curioso y que lleva ya un par de décadas con nosotros.
El tema es desde luego llamativo y esta es una de esas disciplinas que parecen tener mucho futuro el el ámbito profesional. Si alguno se decide, por favor, que se acuerde de mí y me pase la fórmula secreta para acertar de una vez la quiniela. Si hay una solución matemática, es muy probable que un científico de datos pueda dárnosla.
Quién sabe: puede que Brad Pitt acabe haciendo de vosotros si resolvéis el problema. Ya lo estoy viendo: «Moneyball II: the science of soccer«. Al lío, chicos.
El baseball es re-top Javi!!!
Fui a un partido estando en Yanquilandia y me moló, pero también tiene mucha parte tostón 😉