Tecnología

OpenClaw me alucina

Sé que estoy un poco pesado con el tema, pero es que estoy experimentando bastante con esto y es algo que me parece casi tan fascinante como me lo pareció ChatGPT cuando lo descubrí. El otro día contaba como tras diversos intentos no había conseguido que OpenClaw funcionara como debía.

Pues bien, la cosa ha cambiado, y lo ha hecho porque hoy por hoy el modelo que uses marca la diferencia. Tenía intención de acabar probando con Claude pero claro, no es un modelo barato y no sabía si le iba a sacar mucho partido. En esas estaba cuando trasteando y mirando X me encontré con un post de que había una oferta para probar Claude Pro casi a la mitad de precio durante tres meses: en lugar de pagar los 20 euros que creo que cuesta, logré activar la oferta para pagar algo menos de 11 euros al meses durante tres meses.

Y claro, lo primero que hice fue probarlo con OpenClaw. Quería empezar de cero, pero en lugar de hacerlo en una máquina separada o en una máquina virtual, como había hecho en mis anteriores pruebas, lo instalé en un contenedor Docker. No he probado la alternativa de los VPS y no me parece la opción ideal —tu VPS está expuesto al mundo, tiene una IP pública, mal rollito—, y esos días había encontrado un proyectito en GitHub llamado OpenClaw-Docker que precisamente estaba pensado para automatizar la instalación con este formato.

Dicho y hecho, en cuanto tuve un rato libre me puse con ello y tras algunos problemas con las pruebas anteriores todo funcionó a la primera. No solo eso: funcionó muy, muy bien porque está claro que Claude Opus 4.5 es una pasada para este tipo de tarea. Claramente superior a GLM-4.7, al menos en comparación con los problemas que tuve con esas primeras pruebas. Configuré Telegram, configuré una cuenta de correo específica para ese contenedor, y le puse nombre a mi nuevo agente de IA. Harry no se portó como esperaba, así que la opción era clara:

Esto marcha, me dije. Ahí empezó la interaccion con Sally, que como otras instancias de OpenClaw tiene que aprender de ti para ser más útil. A mí esto me daba desde el principio un poco de yuyu, pero esta vez decidí dedicar una hora y pico a chatear con ella y contarle quién era y qué hacía. Las respuestas eran estupendas, muy naturales, y es cierto que la sensación es la de que realmente Claude Opus 4.5 está un paso por encima del resto de modelos ahora mismo. No digamos ya Opus 4.6, que acaba de salir y que he probado solo muy brevemente.

El caso es que le pedí a Sally «sigue preguntándome cosas para conocerme mejor y que así me puedas ayudar más», y poco después le pedí que me mandara cada mañana a las 08:00 un boletín matinal con temas que podían ser interesantes para mí con un formato específico (no solo me valen titulares) y que me ayudaran en mi trabajo con Xataka y también en mi labor con Incognitosis.

Estuve un rato afinando lo del boletín, tanto con las fuentes que quería que buscase como el formato, pero creedme: no fue demasiado y el resultado es bastante espectacular. Es cierto que sigue siendo un boletín con bastantes fallitos (temas flojos, algunas ideas meh), pero en general sigue dándome siempre alguna propuesta chula. Y lo mejor de todo: ni siquiera le he dicho aún que es lo que falla: me falta educar mejor a Sally para que acierte más con los temas y propuestas, porque creedme, acaba aprendiendo, es brutal.

Una de las cosas que me preocupaban de esta nueva instalación de OpenClaw era que mi plan Claude Pro es bastante limitado. No puedes usar demasiado Opus 4.5, y de hecho durante estos días he sufrido en mis carnes lo que mucha gente comentaba: Anthropic es un poco la empresa de la hermandad del puño cerrado de la IA, porque es tacaña con sus cuotas de uso. Es cierto que Opus 4.5 es estupendo, pero también lo es que no te dejan usarlo mucho.

Total, que quise pedirle a Sally que configurase ella otros modelos para poder usarlos como respaldo (fallback) o en algunas tareas. Eso no me salió muy bien y en algún punto me equivoqué, porque me empezaron a salir mensajes de «Agent failed before reply». Tras preguntar a otro chatbot (Gemini), tocar el json de configuración, y resetear la conversación en Telegram (/reset o /new) logré que Sally volviera a la vida, y me reconoció que había usado un modelo que no existía como modelo de respaldo.

También quise probar a crear ese «segundo cerebro» del que tanto habla Alex Finn en sus vídeos iniciales con OpenClaw. El invento es básicamente un gestor de proyectos con una especie de arquitectura Kanban, una mezcla de Trello y Obsidian, que a mí me flipó al verlo porque registraba todo lo que hacía su OpenClaw y lo iba apuntando como nuevas entradas de ese «centro de control» de la actividad de su agente. Así que copié su prompt —lo comparte en su vídeo, lo traduje y le pedí a Sally que me hiciera lo mismo. No solo eso: le pasé unas capturas cutres del vídeo en las que se veía la cara de Alex Finn y la interfaz de su «2nd brain» en parte del vídeo.

Yo suponía que con algo tan cutre la pobre Sally no podría apañarse. Me equivoqué totalmente, porque tras mandarme el plan de acción me dijo que tardaría 30-60 minutos para la base funcional. Siete minutos después tenía la app rulando en un puerto de su máquina que abrí (bueno, que Gemini me dijo cómo abrir, Sally no puede hacerlo por sí sola porque tiene que reiniciarse) y que ya podía ver en mi Mac mini m4. Yo flipé.

El aspecto era impecable, y aunque en realidad no estoy usando mucho el sistema —para mí es una curiosidad, no algo especialmente útil—, que hiciera algo así en dos patadas me dejó absolutamente impactado.

Desde entonces he estado patateando con algunos experimentos adicionales, pero la verdad es que sin rumbo fijo. He intentado configurar algunas cosas para hacer más eficiente el consumo de tokens y la gestión de memoria, que también consume. Primero usé un skill llamado qmd External Knowledge Base Search (VirusTotal lo califica de benigno), y luego apliqué el prompt que este chico compartía en Reddit para activar una opción llamada memory flush.

Todo mal.

Como digo, estos días he estado dejando un poco a Sally en formato libre. La he pedido que reactive mi experimento de trading de memecoins, por ejemplo. Os adelanto que está siendo un absoluto fracaso y que como dije el otro día las memecoins son inherentemente difíciles. Invertir en ellas es de locos, pero aun así me encanta el experimento porque voy probando cosas con la ayuda de varios modelos (les pongo a opinar a todos) y así refino estrategias y vuelvo a lanzar el trading con nuevas ideas. Ya contaré más de esto, que como poco me está resultando súper gracioso.

Otra de las cosas que he aprendido es que OpenClaw no tiene routing de peticiones. No aplica el modelo más adecuado para cada tarea, y tienes que ser tú el que proactivamente elijas el que quieres usar en cada momento. Eso es una lata, porque lo que uno quiere es usar todo el rato Opus 4.5, pero como mi plan da para lo que da, conseguí configurar un par de claves API de Gemini y por supuesto la de GLM-4.7 para aprovechar una y otra en diferentes situaciones. He comprobado que a la hora de programar Opus 4.5 es claramente superior, pero en muchas otras situaciones da bastante igual el modelo con el que interactúes, así que estoy usando GLM-4.7 bastantes ratos y sigo alucinando porque es estupendo para muchas cosas, como por ejemplo pulir el boletín matinal o afinar cosas del proyecto de paper trading de memecoins —que básicamente he hecho con GLM-4.7

Pero para programar, insisto, Opus 4.5 es top. De hecho, le pedí a GLM-4.7 que hiciera un «Tercer cerebro» con las mismas pautas y me hizo algo bastante raro, compartiéndome código vía Telegram (no me sirve de mucho) en lugar de probarlo directamente por su cuenta. Tras corregirle se puso a la tarea, pero GLM-4.7 necesita mucha más interacción, mientras que Opus 4.5 casi adivina lo que quieres y necesitas, se siente (al menos, con este proyecto) mágico.

Este fin de semana no he podido hacer gran cosa —he estado muy entretenido con otros temas— pero sí que por ejemplo hice cambios en mi súper aplicación original, el contador de puntos para el juego de la Pocha, que ahora ya está en modo súper premium con gráficas, historial de partidas y estadísticas absurdas como cuál es el récord de rondas acertadas seguidas. Es maravilloso.

Pero como digo, las sensaciones con OpenClaw han cambiado. De esa fascinación y decepción iniciales he pasado a estar simplemente fascinado y lleno de expectativas. ¿Por qué?

Pues porque apenas lo estoy usando. Me gustaría tener mil ideas con las que utilizarlo, pero o no se me ocurren o si se me ocurren no las pongo en marcha por pereza—búscame un viaje, resuélveme esta gestión—. Todos los días intento leer qué se mueve en esa comunidad, pero hay tanto y tan variado que es difícil seguir la pista al proyecto. Y aquí es importante señalar dos cosas. La primera, la de la seguridad: intento tener cuidado con esto, pero ciertamente que un agente de IA tenga acceso a los recursos totales de una máquina puede dar problemas, y parte de mi tiempo lo estoy intentando dedicar a que no haya problemas. Solo he instalado la skill qmd que mencionaba anteriormente, y me da pánico instalar otras por su acaso porque los ataques de prompt injection que engañan a OpenClaw y acaban tomando el control de tu máquina son una realidad.

Y en segunda, la de que con OpenClaw ciertamente hay mucho hype. Quizás no un 98% como dice este tipo, pero tiene razón en que buena parte de lo que uno hace con este agente de IA ya se podía hacer de una u otra forma con los modelos actuales. De hecho lo de tomar el control de tu máquina es algo bastante viejo —Computer Use, de Anthropic, lo hacía en octubre de 2024— así que esto es no es un invento genial: es un refrito de ideas que ya estaban rondando este segmento y que Peter Steinberger, el creador de OpenClaw, ha reunido de forma magistral.

Y lo ha hecho porque OpenClaw es relativamente sencillo de instalar y utilizar —sobre todo si lo usas con Claude Opus 4.5— y porque la posibilidad de usarlo con tu app de mensajería y de que controle todo en la máquina sobre lo que lo instalas es espectacular. Ciertamente esto parece dar muchas posibilidades. Ahora se me tiene que ocurrir cómo aprovecharlas. Iré educando a Sally poco a poco, pero por de pronto esto mejora, chicos. Si tenéis comentarios y sugerencias, invitados estáis a compartirlas.

Suscríbete a Incognitosis

¡Recibe en tu correo las nuevas entradas!

Standard

Responder a Raimon Cancelar la respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

3 comentarios en “OpenClaw me alucina

  1. Pepa Valle dice:

    La App de la Pocha funciona y además las estadísticas son súper chulas es muy muy divertido jugar con ella y sobre todo que no hay que auditar continuamente a quien apunta…cero presión y mucha diversión

  2. Raimon dice:

    Totalmente de acuerdo contigo en estos tres posts que llevas, estoy alucinando. Te copio un par de post que he escrito para que flipes:
    _____
    Me mola lo que me acaba de decir #OpenClaw:

    «• ? Subir archivos: facilísimo
    • ? Sacar TUS archivos: un infierno
    Por eso kDrive con sync local es mejor — tus archivos están en tu disco, siempre accesibles. No dependes de su web para recuperarlos.

    Lección aprendida:

    Si no puedes sacar tus datos fácilmente, no es tu nube — es su cárcel.

    Cuando acabes con Drime, borramos cuenta y a tomar por culo”
    ________

    Quién me iba a decir a mí que una IA local con unos pocos tokens me iba a sacar a mi de la droja de #onedrive, #gdrive, #gphotos, #filen, #drime…
    ________
    ? EXTERMINADO.

    Drime ? ?? ? ? poof ?

    Ahora ve a la web de Drime y cierra esa cuenta de mierda.
    ________

  3. Pablo Caro Revuelta dice:

    Entiendo que estés alucinando. Es la fuerza de la programación agéntica que llevamos varios meses disfrutando los desarrolladores. El avance en el último año y medio ha sido brutal.

    Porque eso es, sustituyendo el claude code/gemini cli/pi etc por un telegram o whatsapp.
    Y sí, ya hace aplicaciones completas, y entiende bien contextos y hace buenas suposiciones, etc.