accesskey_mod_content

Unha linguaxe común para permitir a interoperabilidade entre catálogos de conxuntos de datos abertos

  • Escoitar
  • Copiar
  • Imprimir PDF
  • Compartir

31 agosto 2023

A condición de que estean protexidos, tratados e respecten os aspectos éticos necesarios, os datos poden ser o ingrediente crave para o alcanzar o éxito dun proxecto.

Co fin de aproveitar plenamente as vantaxes dos datos abertos na sociedade, a Unión Europea conta con diversas iniciativas(Abre en nova xanela) para impulsar a economía do dato(Abre en nova xanela) , un modelo dixital único que fomenta o intercambio de datos, destacando a soberanía e o goberno dos mesmos, o marco ideal e necesario para os datos abertos.

Na economía do dato, tal e como recolle a regulación vixente(Abre en nova xanela) garántese a privacidade das persoas e a interoperabilidade dos datos. O marco regulatorio encárgase de velar polo cumprimento desta premisa. Exemplo diso pode ser a modificación da Lei 37/2007 para a reutilización de información do sector público(Abre en nova xanela)  en cumprimento da Directiva Europea 2019/1024(Abre en nova xanela) . Esta regulación alíñase coa Estratexia de datos da Unión Europea(Abre en nova xanela)  que define un horizonte con un mercado único de datos no que se facilite un intercambio mutuo, libre e seguro entre o sector público e o privado.

Para lograr este obxectivo, débense abordar cuestións crave, como preservar certas garantías xurídicas(Abre en nova xanela)  ou acordar unhas características comúns de descrición de metadatos(Abre en nova xanela)  que deben cumprir os dataset para facilitar o acceso e uso dos datos entre sectores, é dicir, utilizar unha linguaxe común que permita a interoperabilidade entre catálogos de conxuntos de datos.

Que son os estándares de metadatos?

Un primeiro paso cara á interoperabilidade e reutilización dos datos é desenvolver mecanismos que habiliten unha descrición homoxénea dos mesmos e que, ademais, dita descrición sexa facilmente interpretable e procesable tanto por humanos como por máquinas. Neste sentido, se han ido creando diferentes vocabularios que, co tempo, se han ido acordando ata converterse en estándares. 

Os vocabularios estandarizados ofrecen unha semántica que serve como base para a publicación de conxuntos de datos(Abre en nova xanela)  que actúa como "lenda" para facilitar a comprensión do contido dos datos. Á fin e ao cabo, pódese dicir que estes vocabularios proporcionan unha colección de metadatos para describir os datos que se publican; e como todos os usuarios deses datos teñen acceso aos metadatos e entenden o seu significado, é máis fácil interoperar e reutilizar os datos.

W3C: Estándares DCAT e DCAT-AP

A nivel internacional, pódense destacar varias organizacións que crean e manteñen estándares:

  • World Wide Web Consortium ( W3C ): desenvolve o Vocabulario de Catálogos de Datos (DCAT): un estándar de descrición deseñado co obxectivo de facilitar a interoperabilidade entre catálogos de conxuntos de datos publicados na web.
    • Posteriormente, tomando como base DCAT, desenvolveuse DCAT-AP, unha especificación para o intercambio de descricións de datos publicados en os portais de datos en Europa que conta con extensións de DCAT-AP máis específicas como:
      • GeoDCAT-AP que estende DCAT-AP para a publicación de datos  espaciais.
      • StatDCAT-AP que igualmente, estende DCAT-AP para describir datasets de contidos estatísticos.

ISO: Organización de Estandarización Internacional

Ademais de World Wide Web Consortium, existen outras organizacións que se dedican á estandarización, por exemplo, a  Organización de Estandarización Internacional(Abre en nova xanela)  ( ISO , polas súas siglas en inglés  Internacional Standarization Organisation ).

  • Entre outros moitos tipos de estándares,  ISO  tamén definiu normas de estandarización de metadatos de catálogos de datos:
    • ISO 19115(Abre en nova xanela)  para describir información xeográfica. Como ocorre en  DCAT , tamén se desenvolveron extensións e especificacións técnicas a partir de  ISO  19115, por exemplo:
      • ISO 19115-2(Abre en nova xanela)  para datos ráster e imaxes.
      • ISO 19139(Abre en nova xanela)  proporciona unha implementación en XML do vocabulario.

O horizonte nos estándares de metadatos: retos e oportunidades

Tanto W3C como ISO traballan no desenvolvemento e mantemento de vocabularios estandarizados e adaptados ás necesidades dos usuarios. O seu traballo contribúe a lograr unecosistema de datos abertos interoperables que facilite a reutilización. Con todo, a interoperabilidade a miúdo atópase con obstáculosderivados de debilidades de calidade, como poden ser datos obsoletos, dificultades para acceder e interoperar con eles ou metadatos incompletos.

A pesar diso, como se demostrou, a compartición de datos é un mecanismo fundamental na economía do dato. Así que garantir a interoperabilidade e reutilización destes(Abre en nova xanela)  é unha acción crave para abordar o desenvolvemento da economía dos datos en liña coas expectativas das organizacións no que se refire a innovación(Abre en nova xanela) .

Entre as múltiples vantaxes que ofrece a reutilización de conxuntos de datos e a súa interoperabilidade pódese destacar a creación de aplicacións aplicacións(Abre en nova xanela)  e servizos(Abre en nova xanela)  que achegan un valor á sociedade ou axudan na avaliación de políticas, por exemplo.

Ademais, a reutilización e interoperabilidade dos conxuntos de datos favorece o desenvolvemento económico en xeral, e a economía do dato, en particular. Estímase que esta industria alcanzará un valor de 829.000 829.000 millóns de euros en 2025,(Abre en nova xanela)  segundo previsións da Unión Europea. Para poder aproveitar os beneficios que ofrece compartir datos, primeiro, débense acordar e respectar unhas normas de descrición comúns: os estándares para describir metadatos de catálogos de conxuntos de datos.

Fonte orixinal da noticia(Abre en nova xanela)

  • Información e datos do sector público