LLM-as-Judge son tres decisiones
Antes de escribir el prompt de un juez, debes tomar tres decisiones: el contexto, la unidad y la dimensión. Este es el marco, aplicado a evaluar mi agente de DevOps en producción.
Leer más →Reflexiones sobre agentes IA, automatización y sistemas que funcionan
Antes de escribir el prompt de un juez, debes tomar tres decisiones: el contexto, la unidad y la dimensión. Este es el marco, aplicado a evaluar mi agente de DevOps en producción.
Leer más →Cómo construí un agente IA que investiga problemas de infraestructura de forma autónoma — con guardrails read-only, compactación de output, y conocimiento de infraestructura integrado en el system prompt.
Leer más →Cómo una pregunta simple sobre la síntesis de vitamina D se convirtió en un artefacto de Claude, y después en una PWA completa con visualizaciones D3.js, notificaciones push y 6 idiomas.
Leer más →Lo que escribimos se está convirtiendo en skills en markdown, lo que ven los usuarios se está convirtiendo en píxeles generados, y el medio cada vez es más fino. Una mirada a hacia dónde va el software en 2026.
Leer más →La IA ya puede construir casi cualquier cosa. La dificultad ya no está en el código — está en gestionar tus propios límites cognitivos mientras orquestas múltiples agentes en paralelo.
Leer más →Por qué la mayoría de los tests con IA deberían ser scripts reproducibles, no exploración con CLI — y cómo usar cada enfoque eficazmente, basado en experiencia real de automatización de despliegues.
Leer más →Lecciones de escribir un ensayo de 16 capítulos con dos herramientas de IA — por qué la prosa es más difícil que el código para la IA, y qué funcionó realmente.
Leer más →Cómo usé Claude Code para construir un pipeline de grabación, edge-tts para la narración, ffmpeg para el ensamblaje, y Gemini para validar el resultado — sin tocar un editor de vídeo.
Leer más →Cómo construí un prototipo RLM que procesa 71 papers de arXiv (~1M tokens) sin inyectarlos en el prompt, usando análisis de documentos out-of-core con Azure OpenAI tool calling.
Leer más →Cómo coordinar múltiples agentes de IA trabajando en paralelo usando la nueva funcionalidad Agent Teams de Claude Code dentro de una sesión de tmux.
Leer más →Análisis de las implicaciones legales y éticas del 'Co-Authored-By: Claude' que aparece en los commits. ¿Herramienta o autor? El futuro de la propiedad intelectual del código IA.
Leer más →TypeScript proporciona barreras de seguridad esenciales para agentes de IA que escriben código, pero genera fricción con errores de tipos. La solución no es cambiar de lenguaje—es cambiar de flujo de trabajo con sub-agentes especializados.
Leer más →Cómo construí un skill de Claude Code que estandariza y automatiza la creación de artículos bilingües, asegurando consistencia entre contenido EN/ES.
Leer más →Un flujo de trabajo para ejecutar múltiples agentes Claude Code simultáneamente en diferentes funcionalidades, usando git worktree para gestionar ramas y automatizando las revisiones de PRs.
Leer más →Cómo el filtro de contenido de Azure bloquea herramientas legítimas de automatización basándose en palabras, no en riesgo real—y soluciones simples que exponen el fallo.
Leer más →Cómo construí un servidor MCP completo con 58 herramientas para gestionar repositorios, pull requests y pipelines de Bitbucket mediante lenguaje natural.
Leer más →