Hugging Face ha anunciado Open Responses, un estándar abierto para la inferencia de modelos de inteligencia artificial. Esta iniciativa busca resolver las limitaciones del formato Chat Completion en entornos de agentes autónomos. La organización planea colaborar con proveedores de inferencia durante los próximos meses.
La mayoría de los ecosistemas actuales utilizan interfaces diseñadas para conversaciones turn-based que no soportan flujos agénticos complejos. Los desarrolladores están migrando hacia sistemas que razonan, planifican y actúan sobre horizontes de tiempo prolongados. El formato existente resulta insuficiente para estas nuevas necesidades operativas.
La propuesta se basa en la dirección establecida por OpenAI con su API de Respuestas lanzada en marzo de 2025. Hugging Face extiende y abre el código de esta API para desarrolladores y proveedores de enrutamiento. Esto permite la interoperabilidad y la colaboración sobre intereses compartidos en la industria.
Un cambio clave implica cómo se expone el contenido de razonamiento en las respuestas del sistema. Modelos anteriores solo revelaban resúmenes o contenido cifrado sin detalles técnicos internos. Con Open Responses, los proveedores pueden exponer el razonamiento crudo a través de la API para mayor transparencia.
El estándar formaliza el bucle agéntico mediante la invocación de herramientas internas y externas de manera nativa. Las herramientas externas se implementan fuera del sistema del proveedor. Las herramientas internas se ejecutan dentro de la infraestructura del proveedor sin intervención del desarrollador.
Los clientes ahora pueden especificar un proveedor junto con opciones específicas de API al realizar solicitudes. Los intermediarios conocidos como Routers pueden orquestar solicitudes entre proveedores upstream. Esta arquitectura estandariza el punto final y soporta opciones de configuración donde sea necesario.
La migración para clientes que ya soportan la API de Respuestas requiere un esfuerzo relativamente bajo. Las extensiones no documentadas y las interpretaciones de la API de Completación legada se normalizarán. Esto debería mejorar la calidad de la experiencia de inferencia general para los usuarios finales.
El proyecto busca reemplazar las interfaces arraigadas con un formato compartido capaz de satisfacer requisitos agénticos. Las organizaciones esperan reducir las workarounds complejas que surgen de la falta de un estándar unificado. La colaboración comunitaria es esencial para adaptar la especificación a diferentes casos de uso.
Los usuarios pueden probar Open Responses con los Proveedores de Inferencia de Hugging Face disponibles hoy. Existe una versión de acceso temprano disponible para usar en Hugging Face Spaces con herramientas de cumplimiento. La organización espera trabajar con el equipo de Open Responses en el desarrollo futuro de la especificación.
Se prevé que los proveedores de endpoints locales, como vLLM, soporten herramientas alojadas en el futuro. Este patrón se observará frecuentemente en agentes que delegan trabajo a bucles de herramientas. Las implicaciones sugieren un cambio en cómo se construyen las aplicaciones de inteligencia artificial autónoma.