Data Equity: Foundational Concepts for Generative AI

Data-Equity-Foundational-Concepts-for-Generative-AI.jpg

En los últimos meses han surgido una serie de avances tecnológicos gracias a las herramientas de inteligencia artificial generativa (genAI), entre ellas ChatGPT, Bard, Midjourney y Stable Diffusion. El uso de estas herramientas ha suscitado una gran atención y ha captado la imaginación del público y de las partes interesadas del sector debido a sus capacidades, amplia gama de aplicaciones y facilidad de uso. Dado su potencial para desafiar las prácticas empresariales y los paradigmas operativos establecidos, y la promesa de una rápida innovación unida a la probabilidad de una importante disrupción, la genAI está suscitando conversaciones a escala mundial. Estas consecuencias anticipadas y de gran alcance tienen una dimensión social y requerirán un compromiso exhaustivo de las principales partes interesadas, como la industria, los gobiernos, el mundo académico y la sociedad civil. En el centro de estos debates se encuentra el concepto de «equidad de datos», una noción fundamental dentro de la gobernanza de datos centrada en el impacto de los datos sobre la equidad de los sistemas técnicos para individuos, grupos, empresas y ecosistemas. Incluye conceptos de imparcialidad, parcialidad, acceso, control y responsabilidad de los datos, todos ellos respaldados por principios de justicia, no discriminación, transparencia y participación inclusiva. La equidad de los datos no es un concepto nuevo; se basa en los derechos humanos y forma parte del trabajo en curso sobre la privacidad, la protección, la ética, la soberanía y la inevitable  responsabilidad de los datos indígenas. Sin embargo, la intersección de la equidad de datos y genAI es nueva y presenta retos únicos. Los conjuntos de datos utilizados para entrenar modelos de IA son propensos a sesgos que refuerzan las desigualdades existentes. Esto requiere auditar proactivamente los datos y algoritmos e intervenir en cada paso del proceso de IA, desde la recopilación de datos hasta el entrenamiento de modelos y la implementación, para garantizar que las herramientas genAI resultantes representen de forma justa a todas las comunidades. Con el advenimiento de la genAI, que aumenta significativamente el ritmo al que se despliega y desarrolla la IA, explorar marcos para la equidad de los datos es más urgente que nunca. Este documento informativo profundiza en estas cuestiones, centrándose especialmente en la equidad de los datos dentro de los modelos fundacionales, tanto en términos del impacto de la genAI en la sociedad como en el desarrollo futuro de las herramientas de genAI. Los objetivos son tres: establecer un vocabulario común para facilitar la colaboración y el diálogo; delimitar las preocupaciones iniciales para establecer un marco de investigación en el que puedan centrarse las partes interesadas; y configurar el desarrollo futuro de tecnologías prometedoras de forma proactiva y positiva.

La equidad de los datos de entrada se centra en los datos recopilados y utilizados en la construcción de modelos de base, al tiempo que aborda las posibles deficiencias que estos datos podrían conllevar. Como se ha señalado, los datos de entrenamiento de los modelos de base pueden reflejar desigualdades sociales y dar lugar a sesgos sociales. En consecuencia, GenAI genera resultados que reflejan o amplifican estos patrones.
Por lo tanto, asegurar una representación equitativa de diversos individuos, grupos y comunidades en los conjuntos de datos es fundamental para garantizar la relevancia y precisión de los resultados generados. Este requisito va más allá de la representación individual y abarca la representación precisa de las comunidades en el etiquetado de la información. Para que los resultados de los modelos fundacionales reflejen fielmente las perspectivas y realidades de todos los individuos y grupos inherentes a los datos, es imprescindible promover prácticas de equidad, mitigación de sesgos e igualdad de poder explicativo. Además, las etiquetas empleadas deben ser adaptables para su uso en modelos de aprendizaje algorítmico. La equidad de los datos de entrada también debe abarcar los derechos y el bienestar de los sujetos de los datos. Esto abarca aspectos como la obtención de un consentimiento informado, la justa compensación para quienes aportan y anotan datos, y la navegación por las intrincadas compensaciones vinculadas a la inclusión de datos. Estas compensaciones son complejas.
 Aunque una mayor inclusión de datos puede resolver problemas de equidad, al mismo tiempo puede agravar los problemas de privacidad al aumentar la vigilancia. Del mismo modo, la generación de nuevos contenidos puede ampliar las opciones creativas, pero no siempre garantizar una compensación equitativa a los creadores cuyas obras contribuyen a la formación del modelo. El grado de equidad de datos previsto en el lado de los insumos podría variar en función de la naturaleza y los objetivos de los modelos fundacionales. Las aplicaciones comerciales, por ejemplo, podrían dar prioridad a la transparencia para los usuarios finales, revelando el alcance y la cobertura de los datos, junto con análisis de sensibilidad dirigidos a grupos específicos. En otros ámbitos, como la asignación del bienestar o las aplicaciones jurídicas, la equidad del lado de los insumos puede exigir la inclusión explícita de todas las comunidades pertinentes para garantizar una inclusión auténtica y tangible.

El informe aborda la cuestión de la equidad de datos en el contexto de la inteligencia artificial generativa. Proporciona una visión integral de los conceptos fundamentales relacionados con la equidad de datos, destacando la importancia de garantizar que los datos utilizados para entrenar modelos generativos sean representativos y justos. El informe destaca la necesidad de abordar prejuicios y sesgos en los datos para evitar la replicación de desigualdades en las aplicaciones de IA generativa. También se exploran estrategias para lograr la equidad de datos, como la recopilación y el etiquetado de datos éticos, la diversificación de conjuntos de datos y la transparencia en los procesos de desarrollo de modelos generativos. En resumen, el informe destaca la importancia de la equidad de datos como un pilar fundamental en el desarrollo de la inteligencia artificial generativa.

Para leer más ingrese a:

https://www.weforum.org/publications/data-equity-foundational-concepts-for-generative-ai/

https://www3.weforum.org/docs/WEF_Data_Equity_Concepts_Generative_AI_2023.pdf

¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)

Compartir artículo

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Busca los documentos, noticias y tendencias más relevantes del sector eléctrico

Buscador de documentos
Buscador de noticias y tendencias

Banco de Información

Descripción del semáforo tecnológico

Los documentos se clasifican en varios colores tipo semáforo tecnológico que indican el nivel de implementación de la tecnología en el país

Tecnología en investigación que no ha sido estudiado o reglamentado por entidades del sector.

La tecnología se aplica de manera focal y se encuentra en estudio por parte de las entidades del sector.

La tecnología se aplica de manera escalable y se encuentran políticas y regulaciones focales establecidas.

La tecnología se aplica a través de servicios  y se encuentran políticas y regulaciones transversales establecidas.

La tecnología se aplica de manera generalizada  y se tiene un despliegue masivo de esta.

Para acceder a todos los documentos publicados y descargarlos ingresa aquí