Claude Mythos y el peligro de que venga el lobo

Esopo, el célebre fabulista griego cuya existencia real es un misterio, tiene muchas pequeñas historias muy célebres. Entre ellas está por ejemplo la de ‘Pedro y el lobo’ (también conocida como ‘El pastor mentiroso‘) que seguramente todos conozcáis: el chaval no paraba de decirle a la gente que venía el lobo.

Al principio la gente se asustaba, pero con el tiempo dejaron de hacerle caso cuando lo decía. Un ~~buen~~ mal día apareció un lobo de verdad en la aldea y Pedro quiso avisar a sus vecinos, pero nadie le creyó y claro, aquello acabó muy mal fatal.

Han pasado un par de miles de años, pero sigue habiendo muchos Pedros y muchos lobos por ahí. Esta semana quizás hayamos vivido otra vez esa fábula, y aquí quien puede hacer de Pedro es nada menos que Anthropic. El pasado martes la compañía presentó su nuevo modelo de IA, Claude Mythos Preview, pero lo hizo de una forma muy chunga: diciendo que era tan potente y peligroso que lo mejor que podían hacer era no ofrecerlo de forma pública.

Sobre el papel Anthropic tomó una sabia decisión, porque publicaron no uno sino dos documentos en los que hablaron largo y tendido de lo peligroso que era el modelo. Claude Mythos había logrado encontrar vulnerabilidades zero-day (errores no parcheados) en todo tipo de sistemas operativos y navegadores, logró salir de sistemas aislados y de los que no debería haber escapado, y hasta mandó el célebre email a uno de los ingenieros de Anthropic mientras este se comía un sándwich en un parque. Todos los datos parecían concluyentes: este modelo era demasiado chungo para dejarlo campar a sus anchas.

Mythos era claramente el lobo.

O eso nos dijo Anthropic, que tenía ahí el argumento perfecto para no tener que dejárselo usar más que a sus amigotes. Se montó su Project Glasswing para que solo unos pocos socios tecnológicos e inversores puedan usarlo, y ahí quedó todo. Chicos, lo sentimos. Es que viene el lobo y queremos que no os pase nada. Es por vuestro bien y tal.

Reconozco que yo me lo creí. Me sonaba todo bastante razonable y los documentos técnicos tenían buena pinta. Daban miedo, de hecho. Como el lobo.

Pero luego empezaron a aparecer las voces críticas, y lo que parecía dar miedo ahora puede ser otra cosa. Un montaje. Mythos es probablemente un modelo muy fuerte, pero no está nada claro que realmente sea una amenaza. Lo contaba hace un rato en Xataka: algunos de los benchmarks usados no son una buena referencia, y otros hitos tampoco parecían tan brutales como inicialmente. No es que Mythos de repente sea una patata: es que quizás no es tan revolucionario o peligroso como Anthropic nos lo pinta. Que nadie «independiente» pueda verificar lo bueno o malo que es Mythos no ayuda, y es que hay datos contradictorios.

Claude Mythos just obliterated every single benchmark in AI. I can't believe what I'm reading. pic.twitter.com/roAwW0Trts
— Deedy (@deedydas) April 7, 2026

Por un lado están los resultados de los benchmarks que publicó Anthropic, y que parecen mostrar que barre a la competencia (en los benchmarks mostrados en el documento, claro). Y por el otro, que por ejemplo Epoch AI indique el salto de rendimiento (en la imagen) a mí sí que me da bastante confianza y pienso que aquí hay un salto de rendimiento más importante de lo que viene siendo normal.

Aquí hay que recordar que las empresas de IA suelen usar de forma constante el discurso hiperbólico. Vamos a llegar a la AGI (si es que no la hemos alcanzado ya), la IA le va a quitar el trabajo a la mitad de los oficinistas del mundo en cinco años, etc. Esta gente necesita mucha pastuki y hay que vender la moto y decir que tu modelo es la pera limonera aunque quizás no lo sea tanto. Que no lancen Mythos al gran público tiene sentido. Es un modelo que probablemente sea muy caro y que por tanto les pondría en problemas porque no van precisamente de capacidad de cómputo.

Así que no tengo claro si viene el lobo o no. Es probable que sí venga un poco, pero quizás no sea el lobo tan peligroso como lo pinta Pedro.

Qué fascinante todo, de verdad. Inquietante y fascinante.

PD: Mención (y post) aparte merece Meta, que tras nueve meses en modo ninja por fin ha sacado Muse Spark, su nuevo modelo de IA. El primero propietario, y que curiosamente no es especialmente bueno en programación o en agentes de IA. A Meta no parece importarle demasiado, porque lo que quieren es que sea estupendo integrándose en sus plataformas en forma de Meta AI. A mí esa estrategia no me convence, pero claro, no soy Zuckerberg y sobre todo no soy muy fan de sus plataformas. Veremos cómo les va con Muse Spark, pero de primeras a mí esto me parece que está más alineado con Grok —modelos de IA encerrados en sus plataformas— que con OpenAI, Anthropic o Google, que quieren que sus modelos se usen en todos lados, que es lo suyo.

Veremos. Como digo, qué fascinante todo. No me da tiempo a escribir de todo aquí, porras.

Incognitosis

Claude Mythos y el peligro de que venga el lobo

Suscríbete a Incognitosis

Deja una respuesta Cancelar la respuesta