👨🏼‍💻

khriztianmoreno's Blog

Inicio Etiquetas Acerca |

Posts with tag mcp

El Kit de Desarrollo de Agentes - ADK

2025-10-15
aiweb-develpomentmcp

Hoy vamos a meternos de lleno en el Agent Development Kit, mejor conocido como ADK. Es un framework que está cambiando las reglas del juego para construir agentes de inteligencia artificial.Pensemos en esto por un momento. Para quienes desarrollan software, la idea de crear un agente de IA funcional con una sola línea de código no es solo una pregunta: es el sueño hecho realidad.Quienes programan conocen bien este dolor de cabeza. Uno empieza con una idea simple, pero pronto el proyecto se convierte en un laberinto de llamadas a APIs, gestión de estado y código repetitivo. Todo se vuelve un caos. Y justo ahí es donde entra ADK para poner orden.Lo interesante es que trae principios sólidos de la ingeniería de software —como modularidad y facilidad para hacer pruebas— aplicados al desarrollo de inteligencia artificial. Es una solución elegante para un problema complejo.🔩 Los seis componentes clavePara entender cómo funciona ADK, hay que mirar debajo del capó. El sistema se compone de seis bloques fundamentales, que trabajan como una orquesta donde cada instrumento cumple un rol esencial.El agente: Es el cerebro del sistema. Procesa lo que se le pide, toma decisiones y sabe cuándo debe usar sus herramientas.El runner: Actúa como el director de orquesta. Se asegura de que todo fluya correctamente: que los mensajes lleguen, las herramientas se activen y las respuestas regresen sin problemas.La sesión: Es la memoria a corto plazo. Permite mantener la coherencia en la conversación, recordar de qué se está hablando y no perder el contexto.El estado: Es como una pizarra compartida. Todos los componentes pueden leer y escribir datos ahí. Una herramienta puede dejar información y el agente usarla al instante.La memoria: Representa el conocimiento a largo plazo. Guarda información que persiste entre conversaciones, lo que permite que el agente aprenda y mejore con el tiempo.Las herramientas: Son las manos del agente. Sin ellas, solo podría conversar, pero con ellas puede actuar: buscar en internet, conectarse a APIs, obtener datos. Son lo que transforma un chatbot en un asistente verdaderamente útil.🎼 Cómo funciona la sinfoníaCuando llega una petición:La sesión carga el contexto de la conversación.El agente procesa la solicitud.Si es necesario, una herramienta entra en acción.El estado se actualiza con los resultados.El runner orquesta todo para devolver una respuesta coherente.Sinfonia completaUn ciclo perfecto que da vida a agentes inteligentes.🧰 Extender las capacidades con herramientasHay dos formas de dotar a los agentes de nuevas habilidades:Crear herramientas personalizadas: Diseñadas para una lógica de negocio específica. Solo requieren cuatro elementos:Un nombre únicoUna descripción claraUn esquema con los datos necesariosLa función que ejecuta la acciónUsar el Model Context Protocol (MCP): Un conector universal que permite integrar servicios existentes (como GitHub, Discord o Slack) sin código de integración a medida.Además, ADK es agnóstico: funciona con OpenAI, Anthropic o cualquier modelo. Total libertad.⚙️ Flujos de trabajo y colaboración entre agentesCuando una tarea es demasiado grande para un solo agente, entran los flujos de trabajo, que permiten orquestar varios agentes para automatizar procesos complejos.Es clave distinguir entre:Sistemas multiagentes: pensados para conversaciones dinámicas (como un bot de soporte que deriva a un experto).Flujos de trabajo: para automatización pura, con pasos fijos y predecibles (por ejemplo, generar un informe mensual).Los patrones más comunes son:Secuencial: Un agente recopila datos, otro redacta y otro publica. Ideal para procesos paso a paso, como creación de contenido.Paralelo: Divide una tarea entre varios agentes a la vez (por ejemplo, revisión técnica y revisión de negocio simultánea). Gana velocidad y múltiples perspectivas.Bucle (loop): Un agente genera un resultado, otro evalúa si cumple los criterios, y si no, lo devuelve con feedback para mejorar. Perfecto para refinamiento iterativo y mejora continua.Regla práctica:Paso a paso → secuencialVelocidad o diversidad → paraleloCalidad máxima → bucle🔌 Conexión con el mundo exterior: el adaptador universal (MCP)El Model Context Protocol (MCP) actúa como un adaptador de corriente universal. Permite conectar los agentes con servicios externos sin necesidad de integraciones personalizadas.Esto separa la lógica del agente de la complejidad técnica de las conexiones externas.Ejemplos reales:Un asistente de DevOps que detecta problemas en GitHub y alerta por Discord.Un agente de soporte que consulta el CRM y notifica al cliente por Telegram.El potencial de automatización es enorme.🔗 Referencias esencialesGoogle – Agent Development Kit (ADK)Este es el recurso principal. Aquí está toda la documentación oficial.Doc oficial: Agent Development KitGitHub SDK: Agent Development Kit (ADK) Web🚀 ConclusiónEl ADK es mucho más que un conjunto de herramientas. Representa una nueva filosofía de desarrollo de IA, donde los agentes se construyen con la misma rigurosidad que el software profesional.La pregunta final:¿Cuál será el próximo gran problema que automatizaremos

Presentando Chrome DevTools MCP

2025-09-30
javascriptchromedevtoolsaimcpdebuggingperformance

Participé en el programa de acceso anticipado (Early Access Program) de Chrome DevTools MCP y puse a prueba la funcionalidad en proyectos reales. Me enfoqué en cuatro escenarios: corregir un problema de estilos, ejecutar trazas de rendimiento y extraer insights, depurar una solicitud de red fallida y validar que los assets tengan encabezados de caché óptimos. En este post comparto esa experiencia práctica: qué funcionó, dónde brilla y cómo lo usaría en el día a día.Chrome DevTools MCP proporciona a los asistentes de codificación con IA visibilidad real en un navegador Chrome activo para que puedan inspeccionar, probar, medir y corregir problemas basados en señales reales, no en suposiciones. En la práctica, esto significa que tu agente puede abrir páginas, hacer clic, leer el DOM, recopilar trazas de rendimiento, analizar peticiones de red y perfeccionar soluciones en un ciclo cerrado.Por qué es importanteLa mayoría de los agentes de codificación son ciegos. Proponen código, pero no pueden ver la UI renderizada, la consola, las cascadas de red o los problemas de layout thrashing. Chrome DevTools MCP elimina esa venda conectando cualquier cliente AI habilitado para MCP (por ejemplo, Cursor, Claude Code, Gemini CLI) a una instancia local de Chrome con superpoderes a nivel de DevTools. El resultado es un flujo de trabajo donde el agente puede implementar un cambio, ejecutarlo en Chrome, observar el resultado y refinarlo.Introducción rápida: ¿Qué es MCP?MCP (Model Context Protocol) es un estándar abierto (de Anthropic) que define cómo los asistentes de IA se conectan a herramientas y fuentes de datos mediante una interfaz consistente. Un servidor MCP expone "herramientas" (capacidades). Un cliente MCP (tu asistente de IA) llama a esas herramientas. Chrome DevTools MCP es un servidor MCP que conecta un asistente de IA con DevTools de Chrome y su superficie de automatización.Puppeteer para confiabilidad: El servidor MCP utiliza Puppeteer para manejar la navegación, esperar a selectores, inactividad de red, diálogos, etc. Obtienes un control del navegador robusto y de nivel de producción en lugar de los peligros del CDP puro.Capa de herramientas MCP: El servidor expone herramientas de alto nivel (por ejemplo, navigate_page, click, performance_start_trace) a través de MCP. Tu AI llama a una herramienta; el servidor traduce eso en automatización de Chrome confiable y devuelve resultados estructurados.Chrome local y aislado: Se ejecuta localmente con un directorio de datos de usuario separado o perfiles efímeros completamente aislados. Puedes adjuntarte a un Chrome existente o iniciar una nueva instancia, en modo headless o visible.Capacidades clave (herramientas seleccionadas)Navegación y ciclo de vida: new_page, navigate_page, wait_for, avance/retroceso, listar páginas abiertas.Interacción de usuario: click, fill, fill_form, hover, drag, handle_dialog, upload_file.DOM y scripting: evaluate_script, take_snapshot, take_screenshot, list_console_messages.Red: list_network_requests, get_network_request para introspección de solicitudes/respuestas.Emulación: emulate_cpu, emulate_network, resize_page para restricciones de dispositivo/red.Rendimiento: performance_start_trace, performance_stop_trace, performance_analyze_insight para extraer métricas como LCP y TBT de trazas reales.Estas son primitivas a nivel de DevTools: puedes reproducir flujos de usuario reales y obtener la misma fidelidad que tendrías al depurar manualmente en Chrome.Flujos de trabajo prácticos que utilizaría en proyectos realesA continuación se presentan flujos probados en batalla que entregaría a un asistente de IA cuando trabajo en aplicaciones frontend a escala.1) Verificar una corrección de UI de extremo a extremoAplicar el parche (PR del agente o cambio local).navigate_page a la URL de vista previa.click o fill para reproducir la ruta del error.take_screenshot del estado roto para la línea base.Aplicar la corrección; recargar; repetir pasos 2–4.Comparar capturas de pantalla y list_console_messages para regresiones.Por qué es útil: reemplaza las pruebas manuales con un bucle determinista que el agente puede ejecutar repetidamente en diferentes páginas y puntos de interrupción.2) Detectar y explicar errores de ejecución rápidamentenavigate_page a la ruta fallida.list_console_messages y evaluate_script para inspeccionar el estado.list_network_requests + get_network_request para confirmar el estado del backend, payload, CORS y tiempos.Proponer corrección con contexto (marcos de pila, respuestas erróneas, encabezados mal configurados).Por qué es útil: tu agente deja de adivinar—los errores están fundamentados en la actividad real de la consola y la red.3) Reproducir recorridos críticos de usuario antes de implementarnew_page a staging.fill_form para iniciar sesión, click CTA, navegar por el checkout.take_screenshot en cada paso para aceptación visual.emulate_network 3G-lento y volver a intentar el flujo para la resiliencia.Por qué es útil: ejecuciones E2E realistas y repetibles que puedes adjuntar a los PRs.4) Depuración de estilos y layout en la que puedes confiartake_snapshot y evaluate_script para extraer estilos computados para un componente problemático.Aplicar parche de estilo; take_screenshot en múltiples tamaños de viewport mediante resize_page.Validar riesgo de CLS y problemas de desbordamiento.Por qué es útil: previene el "funciona en mi máquina" al basarse en el renderizado real.5) Triaje de rendimiento sin salir de tu editor performance_stop_trace + performance_analyze_insight para extraer señales y bloqueadores de LCP/TBT/CLS.Recomendar optimizaciones específicas (por ejemplo, precarga de imágenes, división de código basada en rutas, eliminar tareas largas, diferir la hidratación no crítica).Por qué es útil: integra una auditoría estilo Lighthouse en tu ciclo de agente con especificidad basada en trazas.Patrones avanzados para equipos seniorArnés de regresión: Codifica los recorridos principales (inicio de sesión, búsqueda, checkout) como secuencias MCP. Ejecuta en cada PR con capturas de pantalla + registros de consola/red adjuntos a los artefactos de CI.Presupuestos de rendimiento: Falla CI si performance_analyze_insight excede los presupuestos para LCP/TBT; incluye trazas como evidencia.Contratos de red: Usa get_network_request para validar esquemas y encabezados de caché; marca sorpresas (por ejemplo, falta de cache-control, JSON sobredimensionado o sobre-fetching).Verificaciones de accesibilidad: Combina evaluate_script para consultar heurísticas de ARIA y contraste; captura screenshots para diferencias visuales.Seguridad y restricciones a tener en cuentaTrata al navegador automatizado como un perfil separado. Evita navegar a sesiones de producción sensibles con sesión iniciada.Prefiere perfiles efímeros/aislados para ejecuciones reproducibles.Sé explícito sobre los datos de prueba y los entornos para prevenir efectos secundarios en sistemas reales.Primeros pasos (nivel alto)El repositorio documenta los detalles de instalación y configuración. A alto nivel:Instala el servidor Chrome DevTools MCP (paquete de Node.js).Configura tu cliente habilitado para MCP (Cursor, Claude Code, Gemini CLI) para registrar el servidor DevTools MCP.Inicia tu cliente; generará/se conectará a una instancia de Chrome cuando se invoquen herramientas.Llama a herramientas desde la interfaz del cliente o mediante prompts (por ejemplo, “abrir página, hacer clic en botón, recopilar traza de rendimiento”).Ejemplo de llamadas a herramientas MCP que podrías orquestar en una sesión:navigate_page -> wait_for(selector) -> click(selector) -> list_console_messages -> take_screenshot -> performance_start_trace -> trigger_interaction -> performance_stop_trace -> performance_analyze_insightConsulta la documentación oficial y el repositorio para obtener la lista más reciente de herramientas, flags y opciones de configuración.Cuándo recurrir a estoSi ya te apoyas en un asistente de IA para cambios de código, agrega DevTools MCP siempre que la corrección deba fundamentarse en el navegador: correcciones visuales/UI, interacciones inestables, depuración de tiempo de ejecución y red, y cualquier cosa relacionada con el rendimiento.ReferenciasAnuncio y documentación de Chrome DevTools MCPDescripción general del Model Context Protocol (MCP)Puppeteer y Chrome DevTools Protocol (CDP)¡Espero que esto haya sido útil y/o te haya enseñado algo nuevo!Profile@khriztianmoreno �