GitHub anunció hoy una modificación significativa en la forma en que utiliza los datos de interacción para mejorar sus herramientas de asistencia de código. A partir del 24 de abril, las interacciones de usuarios de Copilot Free, Pro y Pro+ serán utilizadas para entrenar modelos de inteligencia artificial. Esta decisión busca refinar la precisión de las sugerencias generadas automáticamente en entornos de desarrollo y proteger al usuario.
Los usuarios pueden optar por no participar en este programa de entrenamiento mediante la configuración de privacidad en su cuenta personal. Las preferencias establecidas anteriormente se conservarán, por lo que quienes ya se negaron al uso de datos no verán cambios en su tratamiento actual. Esta flexibilidad garantiza que las elecciones de privacidad del usuario se mantengan respetadas durante la transición completa del sistema.
La compañía explicó que los modelos iniciales se construyeron con datos públicos y muestras de código manuales hasta hace poco. Sin embargo, la incorporación de datos de interacción reales durante el último año demostró mejoras significativas en las tasas de aceptación global. GitHub pretende replicar este éxito utilizando datos de empleados de Microsoft como base inicial para el entrenamiento técnico.
El alcance de la recopilación incluye entradas enviadas al modelo, salidas aceptadas y contexto circundante de la posición del cursor. También se procesarán comentarios, documentación escrita por el usuario y patrones de navegación dentro del repositorio de archivos. La retroalimentación directa sobre las sugerencias, como las calificaciones de aprobación o rechazo, forma parte de este conjunto de datos.
Existen claras exclusiones para proteger a ciertos segmentos de usuarios y tipos de contenido específicos de la plataforma. Las cuentas de Copilot Business y Enterprise no se ven afectadas por esta actualización de política de uso. Además, el contenido de repositorios privados en reposo no se utilizará, aunque sí los datos de interacción durante el uso activo.
La información recopilada puede ser compartida con afiliados corporativos, incluyendo a Microsoft, pero no con proveedores externos de modelos de inteligencia artificial. Esta medida se alinea con prácticas establecidas en la industria de la tecnología para el desarrollo de herramientas de software inteligentes. El objetivo es mejorar la capacidad del sistema para identificar errores potenciales antes de llegar a producción.
Mario Rodriguez, director de producto, destacó que el futuro del desarrollo asistido depende de estos datos reales de programadores. Su experiencia respalda la estrategia actual de priorizar el aprendizaje basado en interacciones de la comunidad durante más de 20 años en roles de liderazgo. Su trayectoria incluye el lanzamiento y crecimiento de Copilot en miles de organizaciones y millones de usuarios.
Los desarrolladores que participen contribuirán a construir herramientas que sirven a toda la comunidad de programación global. Quienes prefieran no participar seguirán teniendo acceso completo a las funciones de inteligencia artificial conocidas. La empresa asegura que ambos caminos permiten acelerar los flujos de trabajo y construir software de manera más segura.