Cómo MCP y Claude 3.7 Están Redefiniendo la Eficiencia de la IA
¡Bienvenidos a Desplegando.cloud! 🚀Desplegando.cloud es tu fuente semanal en español para mantenerte al día con lo más relevante de AWS y Serverless.Esta semana hubo anuncios de todo tipo: novedades en Bedrock (como siempre), pero también en observabilidad, DynamoDB, Firehose y WAF. Así que hay bastante para ponerse al día. Además, se habló mucho sobre Model Context Protocol (MCP), y te traigo un artículo para entender cómo funciona con Bedrock.También vi una avalancha de artículos sobre gente construyendo aplicaciones con Amazon Q, pero la mayoría son solo tutoriales paso a paso, así que decidí no incluirlos esta vez. Prefiero compartir contenido que aporte más valor. Pero no te preocupes, que sí encontrarás algunos artículos interesantes sobre GenAI para desarrolladores Serverless.🎧 Recuerda que esta newsletter también tiene un podcast, donde resumo cada edición. Si prefieres escuchar en lugar de leer, puedes encontrarlo en las principales plataformas y en cada correo que recibas.🗓 ¿Organizas un evento en español sobre AWS o Serverless? Escríbeme en redes o en los comentarios, y con gusto lo menciono.📢 Si te gusta esta newsletter, compártela con tus colegas para que más personas puedan estar al día con el mundo serverless.Si tienes comentarios o sugerencias, escríbeme en LinkedIn, X o Instagram.¡A desplegar! 🚀📰 Noticias Relevantes🧠 Evaluación de RAG en Amazon Bedrock Ya DisponibleAmazon Bedrock ha lanzado la disponibilidad general de su función de Evaluación de RAG (Retrieval Augmented Generation), permitiendo a los usuarios medir y optimizar aplicaciones RAG, ya sea en Knowledge Bases de Bedrock o sistemas personalizados.Esta evaluación utiliza modelos de lenguaje grande (LLMs) como jueces, proporcionando métricas detalladas como relevancia del contexto, exactitud, completitud y fidelidad. Además, incluye indicadores de IA responsable, como evaluación de sesgos y riesgos potenciales.Gracias a este enfoque, los desarrolladores pueden comparar evaluaciones, reducir costos y mejorar la calidad de sus aplicaciones de IA sin depender de evaluaciones manuales extensas. Un paso clave para construir sistemas de IA más precisos y adaptables.🔗 Leer más🌍 CloudWatch RUM Ahora Monitorea Múltiples Dominios con un Solo App MonitorAmazon CloudWatch RUM ha mejorado su capacidad de monitoreo al permitir rastrear múltiples dominios de nivel superior (TLDs) y de segundo nivel (SLDs) con un solo App Monitor. Esto simplifica la supervisión de aplicaciones web que operan en varios dominios, ya sea por ubicación geográfica o migraciones de dominio.Con esta actualización, los usuarios pueden especificar una lista de dominios e incluso usar comodines como example.* o example.co.* para consolidar el monitoreo de todas sus aplicaciones frontend en un solo panel. También se mantiene el soporte para subdominios, facilitando la observabilidad en plataformas distribuidas.Disponible en todas las regiones comerciales de AWS donde CloudWatch RUM opera, esta mejora permite gestionar la transición de dominios con mayor eficiencia y optimizar la experiencia del usuario en entornos multi-dominio.🔗 Leer más🔥 Firehose Ahora Envía Datos en Tiempo Real a Amazon S3 TablesAmazon Data Firehose ahora permite transmitir datos en tiempo real directamente a Amazon S3 Tables, eliminando la necesidad de escribir código o gestionar procesos complejos. Esta integración facilita la ingesta de datos desde fuentes como Amazon Kinesis Data Streams, Amazon MSK y AWS WAF, mejorando el manejo y análisis de datos en entornos serverless.Además, los datos pueden ser enrutados dinámicamente a diferentes tablas en S3 según su contenido, utilizando expresiones JSON Query o aplicando operaciones de actualización y eliminación a nivel de fila. Esto resulta útil para correcciones de datos y cumplimiento de normativas como el derecho al olvido.Esta mejora optimiza la construcción de data lakes y pipelines de analítica, permitiendo a las empresas centrarse en la toma de decisiones basada en datos en lugar de la gestión de infraestructura. Firehose sigue operando de forma serverless, cobrando solo por los bytes procesados.🔗 Leer más🛡️ AWS WAF Ahora Soporta Reglas Basadas en Fragmentos de URIAWS Web Application Firewall (WAF) ha añadido soporte para inspeccionar y filtrar fragmentos de URI, permitiendo crear reglas de seguridad más precisas. Los fragmentos de URI, identificados por el símbolo #, suelen utilizarse para navegar dentro de una página web sin reenviar información al servidor. Con esta mejora, WAF ahora puede detectar y bloquear accesos no autorizados analizando patrones en los fragmentos.Esta funcionalidad es útil para proteger áreas sensibles de una aplicación web sin generar costos adicionales más allá de los cargos estándar de WAF. Está disponible en todas las regiones de AWS compatibles y puede aplicarse a CloudFront y Application Load Balancer, permitiendo un control de seguridad más detallado.Con esta actualización, AWS sigue reforzando la seguridad de aplicaciones web, ofreciendo a los usuarios herramientas más avanzadas para mitigar amenazas y mejorar la protección de sus sitios.🔗 Leer más🔗 Otras noticias que te pueden interesar* 🛠️ CloudWatch RUM ahora soporta mapas de origen JavaScript para depuración de errores → Leer más* ⚡ Amazon DynamoDB Accelerator (DAX) SDK para JavaScript versión 3 ya disponible → Leer más* 🚀 Amazon DynamoDB Accelerator (DAX) SDK para Go versión 2 ya disponible → Leer más* 💰 Amazon S3 reduce el precio del etiquetado de objetos en un 35% → Leer más* 🌐 Amazon Kinesis Data Streams ahora soporta IPv6 → Leer más* 🛡️ Amazon Bedrock Guardrails introduce políticas de cumplimiento para IA responsable → Leer más📚 Artículos InteresantesEsta semana exploramos cómo la optimización de tokens en Claude 3.7 Sonnet en Amazon Bedrock permite reducir costos y mejorar la latencia en aplicaciones de IA. También analizamos el Model Context Protocol (MCP), un estándar abierto que facilita la integración de modelos de IA con fuentes de datos externas, ampliando sus capacidades. Además, profundizamos en el trilema del serverless, un modelo que ayuda a equilibrar costo, rendimiento y complejidad en arquitecturas sin servidores. Por último, revisamos una arquitectura serverless diseñada para detectar la ausencia de Guardrails en llamadas a la API de Amazon Bedrock, asegurando prácticas responsables en aplicaciones de IA generativa.⚖️ El Trilema de Serverless: Costo, Rendimiento y ComplejidadEste artículo explora un nuevo enfoque para tomar decisiones en arquitecturas serverless. En lugar del tradicional trilema de costo, rendimiento y confiabilidad, se plantea un modelo más realista donde la confiabilidad es un beneficio inherente de serverless, y el verdadero desafío radica en equilibrar el costo, el rendimiento y la complejidad.Cada decisión en serverless tiene implicaciones en estos tres ejes. Por ejemplo, elegir entre Aurora Serverless y DynamoDB implica un trade-off: DynamoDB puede ser más eficiente en costo y rendimiento, pero introduce mayor complejidad en la gestión de esquemas y consultas.Puntos clave:* La confiabilidad en serverless está garantizada por diseño, pero el costo, rendimiento y complejidad varían según las decisiones arquitectónicas.* Tecnologías como EventBridge vs. SNS o lenguajes como Rust vs. Go para Lambda afectan el rendimiento y la complejidad de integración.* Es clave alinear las decisiones con los objetivos del negocio y las capacidades del equipo.* No hay respuestas definitivas: este modelo ayuda a visualizar los trade-offs y tomar decisiones informadas.🎯 Reflexión: No existe una arquitectura perfecta en serverless, solo la mejor opción para cada contexto. Comprender y documentar estos trade-offs permite construir soluciones escalables y eficientes.📖 Leer más🛡️ Arquitectura Serverless para Detectar la Ausencia de Guardrails en Amazon BedrockEste artículo detalla cómo implementar una arquitectura serverless para detectar automáticamente la falta de Guardrails en llamadas a la API de inferencia de Amazon Bedrock. Aunque Amazon Bedrock proporciona modelos fundacionales de alto rendimiento, los Guardrails son opcionales por defecto, lo que puede generar problemas de cumplimiento y seguridad si no se aplican correctamente en todas las solicitudes.Para solucionar esto, se propone una arquitectura basada en Amazon S3, EventBridge y Step Functions que supervisa las llamadas a la API de Bedrock y genera alertas si faltan Guardrails en las solicitudes.Puntos clave:* Guardrails en Amazon Bedrock ayudan a filtrar contenido dañino y prevenir ataques de inyección de prompts.* La solución usa logs de invocación de modelos almacenados en S3, procesados por EventBridge y analizados en Step Functions.* Si se detecta la ausencia de Guardrails, se genera una alerta a través de Amazon SNS.* La arquitectura es escalable y compatible con múltiples cuentas AWS, incluyendo mecanismos para evitar notificaciones excesivas.* Se proporciona una plantilla de AWS CloudFormation para desplegar la solución rápidamente.🎯 Reflexión: Asegurar prácticas de IA responsables no debe ser una tarea manual. Automatizar la detección de Guardrails en Amazon Bedrock permite escalar aplicaciones de IA sin comprometer la seguridad y el cumplimiento.📖 Leer más🔗 Model Context Protocol (MCP) y su Integración con Amazon BedrockEste artículo explora el Model Context Protocol (MCP), un estándar abierto desarrollado por Anthropic que permite a los modelos de IA conectarse a diversas fuentes de datos de manera estandarizada. MCP actúa como un conector universal para modelos de lenguaje, similar a cómo USB-C facilita la interoperabilidad en hardware. Su objetivo es proporcionar a los modelos acceso a información externa sin necesidad de entrenamientos adicionales.Al integrarse con Amazon Bedrock, MCP permite que los desarrolladores aprovechen la Converse API para crear aplicaciones conversacionales más avanzadas, en las que los modelos pueden interactuar con herramientas externas para obtener y procesar información en tiempo real.Puntos clave:* MCP es un estándar abierto para conectar modelos de IA con datos externos de forma estructurada.* Amazon Bedrock ofrece un acceso unificado a modelos de Anthropic y otros proveedores de IA.* El protocolo MCP soporta varios métodos de transporte, como stdio (procesos locales) y HTTP con Server-Sent Events (SSE) para comunicación en tiempo real.* Casos de uso: MCP puede ayudar a un modelo a extraer el contenido de un blog a partir de una URL y generar un resumen con Amazon Bedrock.* La integración de MCP con Amazon Bedrock facilita la creación de IA más contextual y con acceso a fuentes de información en tiempo real.🎯 Reflexión: La combinación de MCP y Amazon Bedrock abre nuevas posibilidades para desarrollar aplicaciones de IA más inteligentes y conectadas. A medida que la IA avanza, contar con protocolos abiertos que faciliten el acceso a datos externos será clave para su evolución y adopción.📖 Leer más⚡ Optimización de Tokens con Claude en Amazon BedrockAnthropic ha lanzado una nueva función beta llamada token efficient tool use para Claude 3.7 Sonnet en Amazon Bedrock, que reduce significativamente el consumo de tokens al interactuar con herramientas externas. En algunos casos, la reducción alcanza el 70%, con un promedio del 14%, lo que disminuye costos y mejora la latencia en aplicaciones basadas en IA.La capacidad de uso de herramientas en modelos de IA permite extraer datos estructurados, interactuar con sistemas externos y ejecutar tareas complejas, pero esto puede ser costoso. Con esta optimización, los desarrolladores pueden mejorar la eficiencia de sus aplicaciones sin afectar la funcionalidad.Puntos clave:* Reduce el consumo de tokens hasta un 70%, disminuyendo costos y mejorando la respuesta.* Disponible en Claude 3.7 Sonnet en Amazon Bedrock.* Se puede implementar a través de la InvokeModel API, la Converse API o el AnthropicBedrock SDK.* Ideal para aplicaciones con un alto uso de herramientas, ya que minimiza la latencia y la carga computacional.* Para activarlo, solo es necesario agregar un encabezado específico en las solicitudes.* Mejores prácticas: realizar pruebas de rendimiento, validar calidad de respuestas y gestionar correctamente el almacenamiento en caché.🎯 Reflexión: Reducir el consumo de tokens no solo impacta en costos, sino que también permite que las aplicaciones de IA sean más eficientes y accesibles. Adoptar esta optimización puede marcar la diferencia en escalabilidad y rendimiento.📖 Leer más📝 Eventos en Español📅 26 Marzo: Mujeres en tech: Ser parte de una comunidad y crecer juntas 📍 AWS UG Chile 🔗 Más info📅 27 Marzo: Network & Security Track | Tu viaje a la nube "powered by" la red global de AWS 📍 AWS Experience Iberia (Barcelona) 🔗 Más info📅 27 Marzo: Desarrollo y despliegue de aplicaciones serverless mediante IaC 📍 AWS UG Sevilla 🔗 Más info📅 27 Marzo: EC2, ECS y Lambda: La larga noche del despliegue 📍 AWS UG Manizales 🔗 Más info📅 27 Marzo: AWS Builders: De Errores y Experiencias Reales en la Nube 📍 AWS UG Monterrey 🔗 Más info📅 27 Marzo: AWS: El Secreto para Acceder a Más y Mejores Oportunidades Laborales 📍 AWS UG Mixtli Cholula 🔗 Más info📅 28 Marzo: Episodio IV: AI Practitioner – Una Nueva Era: Amazon SageMaker 📍 AWS Women Colombia UG 🔗 Más info📅 29 Marzo: AWSome Women Summit 📍 Perú 🔗 Regístrate📅 4 Abril: AWS Modernízate - Observabilidad de sus aplicaciones con Inteligencia Artificial 📍 AWS UG Puerto Rico 🔗 Más info📅 8 Abril: Agents, Agents and more Agents! 📍 AWS UG Barcelona 🔗 Más info🌟 8 Abril: Innovate Gen AI + Data 📍 AWS Latam 🔗 Más info🌟 11 Junio: AWS Summit Madrid 📍 IFEMA 🔗 Regístrate😂 Meme de la SemanaFuente: https://x.com/LeeJamesGilmore/status/1488159590520926210Gracias por leer Desplegando.cloud!Eso es todo por esta semana. Recuerda que también puedes escuchar Desplegando.cloud en formato podcast en tus plataformas favoritas. ¡Nos vemos la próxima semana con más novedades del mundo AWS!¡Feliz despliegue!Marcia. This is a public episode. If you would like to discuss this with other subscribers or get access to bonus episodes, visit desplegando.substack.com