La iniciativa de la Unión Europea sobre espacios de datos europeos tiene como objetivo fomentar la innovación y el crecimiento económico al facilitar el intercambio seguro e interoperable de datos en sectores clave como la salud, la energía y la movilidad. Dentro de estos espacios de datos, se otorga alta prioridad al cumplimiento de los principios FAIR, por lo que los datos y los servicios deben ser encontrables, accesibles, interoperables y reutilizables. Las ontologías, en su función de modelos semánticos, desempeñan un papel fundamental en la consecución de la interoperabilidad semántica, dado que proporcionan un marco común para el acceso, descubrimiento, comprensión y reutilización de datos y servicios. Sin embargo, la complejidad inherente de las iniciativas de espacios de datos, junto con la diversidad de los dominios subyacentes, representa un desafío clave para alcanzar una FAIRness óptima. Esta situación hace necesaria la implementación de una metodología ágil que se alinee con los principios de estos espacios, integre estándares de dominio existentes, consolide el uso de metadatos para mejorar la FAIRness de las ontologías e involucre a los distintos actores implicados (expertos en dominios, proveedores de servicios de datos e ingenieros de ontologías) en el desarrollo de una ontología común.
En el marco del proyecto OMEGA-X, cuyo propósito es la construcción de un espacio de datos energético, se ha desarrollado AIME, una metodología para el diseño de ontologías que incorpora la reutilización de estándares y ontologías de referencia, permitiendo así la creación de ontologías modulares. AIME aplica principios ágiles con el fin de mejorar la comunicación entre los diferentes actores a lo largo de diversas etapas: selección de estándares de referencia y ontologías, identificación de casos de uso, diseño y selección de modelos de interacción que capturan los intercambios de datos, creación de módulos ontológicos, automatización y funciones de integración continua para respaldar el proceso de ingeniería ontológica y su reutilización dentro del espacio de datos. La Unión Europea (UE) ha delineado una estrategia digital integral destinada a fomentar la innovación y estimular el crecimiento económico mediante el establecimiento de espacios de datos europeos. Estos entornos seguros e interconectados facilitan el intercambio de datos y servicios en diversos sectores, incluidos la energía, la salud, la agricultura y la movilidad. Con el fin de cumplir con los principios FAIR, los datos y servicios compartidos deben anotarse con metadatos estandarizados.
La adopción de la FAIRness en un ecosistema tan dinámico presenta desafíos significativos, entre ellos la heterogeneidad de datos, servicios y actores, la variedad de casos de uso y la naturaleza cambiante de los intercambios de datos. Las ontologías y vocabularios proporcionan recursos esenciales para la anotación semántica y contribuyen a la mejora de los mecanismos de encontrabilidad y reutilización de datos. Las soluciones basadas en ontologías pueden integrarse con múltiples componentes del espacio de datos, tales como la provisión de metadatos en catálogos de datos, la semantización en conectores de datos y las capas de intercambio. El desarrollo de una ontología para un espacio de datos constituye un proceso complejo y exigente. Además de los desafíos mencionados, la ontología es altamente susceptible a actualizaciones frecuentes, lo que amplía de manera constante el alcance de los casos de uso y exige una metodología rigurosa para garantizar su evolución.
El empleo de metodologías de desarrollo de ontologías representa una de las mejores prácticas en ingeniería del conocimiento. Las metodologías más recientes incorporan principios ágiles con el propósito de mejorar la colaboración y asegurar la calidad de la ontología resultante. No obstante, muchas de estas metodologías son genéricas y abordan de manera limitada la fase de adquisición del conocimiento, que resulta esencial para ampliar el alcance de la ontología y, por ende, mejorar la FAIRness del espacio de datos. Existen otros requisitos de los espacios de datos que las metodologías actuales consideran de manera limitada, como la integración de estándares de dominio y la definición de directrices homogéneas para la anotación de estándares ontológicos. Un componente clave de los espacios de datos es el catálogo de mercado, que permite localizar conjuntos de datos y servicios mediante catálogos basados en definiciones de metadatos compartidos.
Según los estándares de la UE, las ontologías de metadatos genéricos, como Gaia-X (que utiliza DCAT), se emplean ampliamente. Sin embargo, estas no cubren de manera exhaustiva los requisitos de metadatos relacionados con la calidad y la procedencia de los datos. Además, proporcionan palabras clave genéricas que no permiten capturar atributos específicos de determinados dominios dentro del espacio de datos, como los sectores energético o educativo. Estos vocabularios se obtienen de ontologías específicas de dominio, diseñadas para describir el contenido de los conjuntos de datos y servicios. La provisión de metadatos específicos de dominio y sus respectivas taxonomías representa un desafío crucial que las metodologías de desarrollo de ontologías deben abordar desde sus primeras etapas. La metodología AIME (Metodología Basada en Modelos de Interacción Ágil para Espacios de Datos Europeos) ha sido desarrollada para responder a estos desafíos. Basada en metodologías preexistentes, como LOT y ACIMOV, AIME permite la integración de estándares de dominio y refina el proceso de adquisición de conocimiento mediante el uso de modelos de interacción (IM). Un IM describe los datos intercambiados entre dos actores para alcanzar un objetivo específico y, por lo general, se representa mediante diagramas de secuencia. Este enfoque permite que la ontología resultante capture múltiples niveles de interoperabilidad dentro del dominio, incrementando así la encontrabilidad y reutilización de conjuntos de datos y servicios.
El desarrollo de la metodología AIME se ha llevado a cabo dentro del proyecto europeo OMEGA-X, cuyo propósito es la creación de un espacio de datos para el sector energético. La aplicación de esta metodología ha facilitado la construcción de una ontología modular para el Espacio de Datos Energético Europeo, abordando requisitos específicos orientados a los negocios, la vinculación con diversos casos de uso y la adaptación continua a nuevos conceptos y estándares. A medida que las iniciativas de espacios de datos continúan evolucionando y expandiéndose en sectores como la salud, la energía y la movilidad, AIME tiene el potencial de implementarse en estos ámbitos. Su enfoque metodológico proporciona una base sólida para el desarrollo de ontologías, favoreciendo así el intercambio y la reutilización eficiente de datos dentro de los espacios de datos europeos.
Para leer más ingrese a: