GitHub actualiza política de uso de datos para entrenar modelos de Copilot

GitHub anunció hoy una modificación significativa en la forma en que utiliza los datos de interacción para mejorar sus herramientas de asistencia de código. A partir del 24 de abril, las interacciones de usuarios de Copilot Free, Pro y Pro+ serán utilizadas para entrenar modelos de inteligencia artificial. Esta decisión busca refinar la precisión de las sugerencias generadas automáticamente en entornos de desarrollo y proteger al usuario.

Los usuarios pueden optar por no participar en este programa de entrenamiento mediante la configuración de privacidad en su cuenta personal. Las preferencias establecidas anteriormente se conservarán, por lo que quienes ya se negaron al uso de datos no verán cambios en su tratamiento actual. Esta flexibilidad garantiza que las elecciones de privacidad del usuario se mantengan respetadas durante la transición completa del sistema.

La compañía explicó que los modelos iniciales se construyeron con datos públicos y muestras de código manuales hasta hace poco. Sin embargo, la incorporación de datos de interacción reales durante el último año demostró mejoras significativas en las tasas de aceptación global. GitHub pretende replicar este éxito utilizando datos de empleados de Microsoft como base inicial para el entrenamiento técnico.

El alcance de la recopilación incluye entradas enviadas al modelo, salidas aceptadas y contexto circundante de la posición del cursor. También se procesarán comentarios, documentación escrita por el usuario y patrones de navegación dentro del repositorio de archivos. La retroalimentación directa sobre las sugerencias, como las calificaciones de aprobación o rechazo, forma parte de este conjunto de datos.

Existen claras exclusiones para proteger a ciertos segmentos de usuarios y tipos de contenido específicos de la plataforma. Las cuentas de Copilot Business y Enterprise no se ven afectadas por esta actualización de política de uso. Además, el contenido de repositorios privados en reposo no se utilizará, aunque sí los datos de interacción durante el uso activo.

La información recopilada puede ser compartida con afiliados corporativos, incluyendo a Microsoft, pero no con proveedores externos de modelos de inteligencia artificial. Esta medida se alinea con prácticas establecidas en la industria de la tecnología para el desarrollo de herramientas de software inteligentes. El objetivo es mejorar la capacidad del sistema para identificar errores potenciales antes de llegar a producción.

Mario Rodriguez, director de producto, destacó que el futuro del desarrollo asistido depende de estos datos reales de programadores. Su experiencia respalda la estrategia actual de priorizar el aprendizaje basado en interacciones de la comunidad durante más de 20 años en roles de liderazgo. Su trayectoria incluye el lanzamiento y crecimiento de Copilot en miles de organizaciones y millones de usuarios.

Los desarrolladores que participen contribuirán a construir herramientas que sirven a toda la comunidad de programación global. Quienes prefieran no participar seguirán teniendo acceso completo a las funciones de inteligencia artificial conocidas. La empresa asegura que ambos caminos permiten acelerar los flujos de trabajo y construir software de manera más segura.

Etiquetas

ai copilot github privacy

GitHub actualiza política de uso de datos para entrenar modelos de Copilot

Etiquetas

Comentarios

Sigue leyendo

Más de Tecnología

Cipher Digital sube acciones nueve % tras acuerdo de centro de datos con inquilino hiperscaler

Microsoft trabaja en eliminar el requisito de cuenta online para Windows 11

Antiguo jefe de Windows revela planes olvidados para reducir la huella de memoria de Windows 11

Últimas noticias

BitGo y ZKsync construyen infraestructura de depósitos tokenizados para llevar bancos a la cadena

Obex despliega un mil millones de dólares para vincular USDS con activos del mundo real

Bitcoin prueba 72000 dólares mientras el apalancamiento sugiere volatilidad futura