Hugging Face anunció oficialmente el lanzamiento de Open Responses como un nuevo estándar de inferencia. Esta iniciativa técnica busca reemplazar el formato Chat Completion predominante en la industria. El objetivo principal es facilitar el desarrollo de sistemas de inteligencia artificial autónomos.
El ecosistema actual depende en gran medida de interfaces diseñadas para conversaciones básicas turnadas. Los agentes modernos requieren capacidades de planificación y acción sobre horizontes temporales largos. La interfaz existente no abarca estas necesidades técnicas complejas para la inferencia avanzada.
La nueva especificación se basa en la API de Respuestas de OpenAI lanzada en marzo de 2025. Sin embargo, Open Responses elimina las restricciones de propiedad de esa plataforma original. Esto permite que múltiples proveedores de inferencia interactúen sin problemas en el mercado global.
Un cambio técnico clave permite la exposición de contenido de razonamiento crudo a los clientes. Los modelos anteriores solo devolvían resúmenes o contenido encriptado sin transparencia. Los desarrolladores ahora pueden recibir flujos de razonamiento si su proveedor lo soporta técnicamente.
La especificación distingue claramente entre proveedores de modelos de IA y enrutadores intermediarios. Los clientes pueden especificar un proveedor junto con opciones específicas de la API durante las solicitudes. Esto facilita la orquestación eficiente entre múltiples proveedores de servicios de inferencia.
El estándar soporta dos categorías principales de herramientas internas y externas para la ejecución. Las herramientas externas se implementan fuera del sistema del proveedor mediante servidores MCP. Las herramientas internas gestionan el bucle completo dentro de la infraestructura del proveedor.
Open Responses formaliza el bucle de agentes mediante un ciclo repetitivo de razonamiento y respuesta. Este ciclo incluye razonamiento, invocación de herramientas y generación de resultados finales. Los flujos de trabajo de múltiples pasos como redactar correos utilizan una sola solicitud.
Los clientes que ya apoyan la API de Respuestas existente pueden migrar con poco esfuerzo técnico. La documentación técnica está disponible para quienes deseen profundizar en el detalle de la especificación. Las extensiones no documentadas de la API legacy se normalizan en el nuevo estándar uniforme.
Los proveedores de endpoints locales como vLLM podrían soportar herramientas alojadas en el futuro cercano. Este patrón es común para agentes que delegan trabajo a bucles de herramientas secundarios eficientes. La comunidad espera ver más patrones de interoperabilidad en el desarrollo técnico actual.
Hugging Face ofrece una versión de acceso temprano en sus espacios de trabajo para pruebas. Los desarrolladores pueden probar el cumplimiento con sus clientes actuales mediante herramientas de validación. La colaboración con la comunidad continuará en el desarrollo futuro de la especificación técnica.