top of page
20220530_Trinity_En_Aplus (1)(1).jpg

Las herramientas de Microsoft Office supuestamente recopilan datos para el entrenamiento de IA, requiriendo la exclusión manual

Foto del escritor: MasterbitzMasterbitz

La suite Office de Microsoft es el elemento básico en herramientas de productividad, con millones de usuarios que introducen datos sensibles personales y de la empresa en Excel y Word. Según @nixCraft, autor de Cyberciti.biz, Microsoft dejó activada por defecto su función «Connected Experiences», que supuestamente utiliza contenido generado por los usuarios para entrenar los modelos de IA de la compañía. Esta función está activada por defecto, lo que significa que los datos de los archivos de Word y Excel pueden utilizarse en el desarrollo de la IA a menos que los usuarios opten manualmente por no hacerlo. Como opción predeterminada, esta configuración plantea problemas de seguridad, especialmente en el caso de las empresas y los trabajadores de la administración pública que confían en Microsoft Office para realizar trabajos propios. La función permite que documentos como artículos, datos gubernamentales y otros archivos confidenciales se incluyan en el entrenamiento de IA, lo que plantea problemas éticos y legales en relación con el consentimiento y la propiedad intelectual.


Para deshabilitar la función es necesario ir a: Archivo > Opciones > Centro de confianza > Configuración del Centro de confianza > Opciones de privacidad > Configuración de privacidad > Experiencias conectadas opcionales, y desmarcar la casilla. Incluso con unos pasos de exclusión innecesariamente largos, el acuerdo GPDR de la Unión Europea, que Microsoft cumple, exige que todos los ajustes sean de inclusión y no de exclusión por defecto. Esto contradice directamente las leyes GDPR de la UE, lo que podría dar lugar a una investigación por parte de la UE. Microsoft aún no ha confirmado si el contenido de los usuarios se utiliza activamente para entrenar sus modelos de IA. Sin embargo, su Acuerdo de Servicios incluye una cláusula que concede a la empresa una «licencia de propiedad intelectual mundial y libre de regalías» para utilizar los contenidos generados por los usuarios con fines como la mejora de los productos de Microsoft. La polémica suscitada por este hecho no es nueva, sobre todo cuando más empresas aprovechan los datos de los usuarios para el desarrollo de IA, a menudo sin consentimiento explícito.


Para los actuales modelos de IA de LLM, los datos con los que se entrenan son la clave para distinguirlos de los competidores. Los datos de calidad son el premio, y cuando se recopila un conjunto de datos único como al que tiene acceso Microsoft, ese modelo de IA podría superar a la competencia con creces en tareas como la escritura y el razonamiento básico. Especialmente con datos sensibles no disponibles al público, Microsoft podría ampliar su ventaja en IA. Sin embargo, los modelos de IA no son inmunes a filtrar parte de sus datos de entrenamiento, por lo que un profesional experto podría extraerlos. Por ahora, se aconseja a los usuarios que deseen proteger su propiedad intelectual que revisen cuidadosamente su configuración.


Fuente: vía Tom's Hardware

1 visualización0 comentarios

Comments


Aplus_MARS_2107_Eng(1).png
bottom of page