accesskey_mod_content

Quantificant el valor de les dades

  • Escoltar
  • Copiar
  • Imprimir PDF
  • Compartir

"Notícia disponible únicament amb finalitats històriques i d'hemeroteca. La informació i enllaços mostrats es corresponen amb els quals estaven operatius a la data de la seva publicació. No es garanteix que continuïn actius actualment".

28 setembre 2022

Davant la recurrent -i sempre en l'aire- pregunta sobre quin és el valor d'un conjunt de dades, Dades.gob publica una petita anàlisi que ens apropa una mica més a la resposta o, almenys, a saber els criteris als quals hem d'atendre per a una correcta avaluació.

Quin és el valor d'un conjunt de dades? Aquesta és una pregunta extremadament difícil de respondre donada no solament la complexitat inherent a les pròpies dades, que creix a més exponencialment quan comencem a combinar-los, sinó també als diferents punts de vista des dels quals es pot abordar la qüestió del valor.

  • Si sabem que el valor no serà immediat, com podem preveure i quantificar els possibles beneficis en un moment futur?
  • Podria el valor de les dades arribar a ser negatiu en alguns casos, si amb ells podem causar també algun tipus de ‘dany’?
  • Pot el valor de les dades degradar-se al llarg del temps?

Des d'aquest espai hem analitzat el valor de les dades obertes per a l'administració  de forma recurrent des de diferents enfocaments: les  dades d'alt valor  i la seva  identificació , la  perspectiva dels proveïdors , les  claus del valor de les dades , com  generar valor a través de les dades  o quin és el  valor de les dades en temps real . No obstant això, el treball d'anàlisi i recerca en aquesta àrea segueix creixent imparable. En aquest sentit, volem ressaltar un treball publicat recentment des de la Universitat de Cambridge. Es tracta d'un  estudio en el desgranen alguns dels mètodes més comuns per a la valoració de les dades .

Partint de la seva  anàlisi prèvia sobre les característiques de les dades i el seu valor associat , s'ha realitzat la revisió dels mètodes que existeixen actualment. Amb això han arribat a la conclusió d'aquests mètodes poden dividir-se en diverses categories, que les seves característiques detallem a continuació.

Mètodes basats en anàlisis de costos

Aquest enfocament es basa en el principi tradicional estadístic de la “suma de costos”. Per a això es tenen en compte els costos de generació, recopilació, emmagatzematge i substitució dels conjunts de dades, així com els costos per a l'organització en cas que les dades donin lloc a algun tipus de pèrdua. Aquests mètodes compten amb l'avantatge que són relativament fàcils de calcular, però, d'altra banda, compten amb la dificultat d'haver de diferenciar entre els costos directament atribuïbles a les dades i altres costos indirectes relacionats, per exemple, amb la varietat de labors professionals involucrades o els diferents elements de programari utilitzats.

Un exemple d'aplicació d'aquest mètode és  el cas del departament d'estadístiques de Canadà  amb la seva anàlisi de valoració dels costos associats a la inversió en dades, bases de dades i ciència de dades al país.

Mètodes basats en anàlisis d'ingressos

En aquest cas s'utilitzen les expectatives de fluxos d'ingressos, prenent com a referència el mercat potencial existent per a l'explotació de les dades. Per a això es poden tenir en compte, per exemple, els cànons per ús, les marques registrades o les patents. Les principals limitacions d'aquests mètodes consisteixen, generalment, en què requereixen aplicar criteris una mica més subjectius i en la complexitat d'estimar aquest valor quan les dades no s'exploten directament sinó indirectament, per exemple, mitjançant analítica.

Aquests mètodes s'utilitzen en el  estudio de l'OECD sobre les perspectives del valor de les dades . En ell es calculen els ingressos declarats relacionats amb la recopilació i venda de dades a través de l'enquesta empresarial dels Estats Units.

Mètodes basats en anàlisis de mercat

Generalment aquests són els mètodes de preferència que se solen usar quan tots els elements necessaris per fer els càlculs estan disponibles. No obstant això, avui dia existeix encara una gran quantitat de dades en les organitzacions d'ús exclusivament intern, la qual cosa dificulta l'ús d'aquests mètodes, al no ser visible el seu comportament al mercat. A més, aquests mètodes tampoc poden incorporar totalment el valor social de les dades.

Un exemple d'aquest mètode és l'anàlisi realitzada en l'estudi dut a terme per la Comissió Econòmica per a Amèrica Llatina i el Carib (CEPAL) sobre  els mercats de dades engegades per la Unió Europea i el Govern de Colòmbia , respectivament.

Experiments i enquestes

Aquesta aproximació al valor de les dades consisteix a avaluar el sentiment de mercat en relació a les dades, preguntant directament sobre la disposició a pagar per certes dades o a prescindir d'ells. Generalment s'utilitza quan el valor públic de mercat no és conegut o en aquells casos en el qual el valor social té un pes important, com pot ser, per exemple, a l'àrea mediambiental. Una limitació d'aquests mètodes és que, quan els enquestats no són especialistes, pot resultar bastant complicat per a ells avaluar els possibles usos de les dades i, per tant, el seu valor complet.

El  estudi realitzat per l'oficina nacional d'estadística del Regne Unit  és un clar exemple d'aquests mètodes de valoració.

Mètodes basats en l'impacte

En aquest cas la valoració es duu a terme a través de experiments o casos pràctics que analitzen el efecte causal sobre determinats resultats atribuïbles a les dades. Aquesta opció és particularment útil per als responsables de l'elaboració de polítiques públiques dirigides per l'evidència, ja que permeten establir una relació causa-efecte, la qual cosa facilita la comprensió dels beneficis i l'elaboració d'una narrativa en favor de l'ús de les dades. No obstant això, si els experiments no estan ben dissenyats o no s'ajusten bé al context específic que volem analitzar, correm el risc d'obtenir una valoració excessivament subjectiva.

El  framework d'avaluació basat en decisions , proposat per la Internet of Water Coallition, és un bon exemple de com aplicar els mètodes centrats en l'impacte a un cas particular.

Mètodes basats en la cadena d'actors

Amb aquests mètodes el que se cerca és usar una visió més completa per valorar les dades des de diferents punts de vista. Això fa que les avaluacions puguin ser també més complexes en involucrar diferents definicions del que constitueix el valor de les dades. No obstant això, també ho converteix en el mètode més adequat quan es vol avaluar un ecosistema de dades en el seu conjunt. A més, és un mètode en alça per a les organitzacions que tenen en compte la inversió socialment responsable.

Un exemple de com es poden aplicar aquests mètodes en la pràctica en el  caso d'estudi dut a terme amb l'entitat gestora de les autopistes a Anglaterra  – Highways England.

Mètodes basats en l'anàlisi d'opcions reals

El principal avantatge d'aquests mètodes és que poden aplicar-se fins i tot quan encara no estan definits tots els possibles casos d'ús per a les dades. El seu objectiu és aconseguir una estimació del valor que tindrien les dades en certs possibles escenaris futurs – generalment a través de la simulació per computació – de manera que si s'aconsegueix aquest escenari es podria justificar l'explotació de les dades. Així doncs, certes decisions i inversions relacionades amb les dades podrien ser ajornades fins que s'arribi a l'escenari ideal que maximitzi el valor d'aquestes dades, podent minimitzar així els costos i riscos associats fins a aquest moment.

El  cas d'estudi sobre el sector del transport dut a terme en Regne Unit  ens ofereix un exemple de com es podrien aplicar aquests mètodes usant models financers.

I quin és el mètode que hauria d'usar en el meu cas particular?

Desafortunadament no existeix una regla d'or que ens permeti seleccionar un mètode en concret. No obstant això, hi ha una sèrie de qüestions que els autors de l'estudi suggereixen plantejar-nos a l'hora de trobar el mètode més adequat per a cada cas:

  • Què és exactament el que estem valorant: les dades passen a través de diversos estats en el seu cicle de vida – des de les dades en cru a les dades processades, l'anàlisi o el coneixement generat. Depenent d'en quina fase vulguem centrar la nostra anàlisi alguns mètodes poden ser més apropiats que uns altres.

  • Des de quin punt de vista es duu a terme la valoració: el valor pot tenir diferents definicions depenent del punt de vista de qui realitza o encarrega una valoració. En alguns casos per exemple la contenció de costos a causa de restriccions pressupostàries pot ser el prioritari, mentre que en uns altres es podria optar per intentar maximitzar el valor social.

  • En quin moment té lloc el procés d'avaluació: bàsicament caldrà tenir en compte si l'avaluació es durà a terme de forma predictiva abans de disposar de tots els elements avaluats o si es realitzarà a posteriori, una vegada totes les variables siguin ja conegudes.

  • Quin és el propòsit de l'avaluació: diversos dels mètodes disponibles ometen o minimitzen certs aspectes de les dades centrant-se en altres característiques del seu procés d'avaluació. Per tant, serà necessari conèixer amb claredat quins són les prioritats de la nostra avaluació a l'hora de seleccionar el mètode més adequat. És l'impacte social el que ens interessa? La millora de la productivitat? Maximitzar la rendibilitat de les dades?

Per tant, el primer que hauríem de fer és una anàlisi de les nostres necessitats i la nostra pròpia definició del valor, preguntant-nos para això què és exactament el que volem avaluar i quin és la millor forma de dur a terme aquesta avaluació, per passar després a  elaborar el nostre propi marc de valoració  usant els mètodes més apropiats d'entre l'àmplia varietat disponible.

Font original de la notícia(Obre en nova finestra)

  • Informació i dades del sector públic