accesskey_mod_content

Repositoris oberts d'imatges per a entrenament de models d'Intel·ligència Artificial

  • Escoltar
  • Copiar
  • Imprimir PDF
  • Compartir

"Notícia disponible únicament amb finalitats històriques i d'hemeroteca. La informació i enllaços mostrats es corresponen amb els quals estaven operatius a la data de la seua publicació. No es garantix que continuen actius actualment".

19 octubre 2022

Potser, un dels usos més quotidians de la intel·ligència artificial que podem experimentar en el nostre dia a dia siga mitjançant la interacció amb sistemes de visió artificial i identificació d'objectes.

Potser, un dels usos més quotidians de la intel·ligència artificial que podem experimentar en el nostre dia a dia siga mitjançant la interacció amb sistemes de visió artificial i identificació d'objectes. Des del desbloquege del nostre smartphone, fins a la cerca per imatges en Internet. Tots estes funcionalitats són possibles gràcies a models d'intel·ligència artificial en el camp de la detecció i classificació d'imatges. En este post recopilem alguns dels repositoris oberts d'imatges més importants, gràcies als quals, hem pogut entrenar els models actuals de reconeixement d'imatges.

Introducció

Tornem per un moment a la fi de 2017, principis del 2018. La possibilitat de desbloquejar els nostres smartphones amb algun tipus de lector d'empremta dactilar s'ha estés. Amb major o menor encert, la major part dels fabricants havien aconseguit incloure el lector biomètric en les seues terminals. El temps de desbloquege, la facilitat d'ús i la seguretat extra aportada eren excepcionals enfront dels clàssics sistemes de contrasenyes, patrons, etc. Com vé ocorrent des de l'any 2008, el líder indiscutible en innovació digital en terminals mòbils - Apple - tornava a revolucionar el mercat incorporant un nou sistema de desbloquege en el iPhone X mitjançant la imágen de la nostra cara. El denominat sistema  FaceID(Obri en nova finestra)  escaneja la nostra cara per a desbloquejar el terminal en desenes de segon sense haver d'utilitzar les mans. La probabilitat de suplantació d'identitat amb este sistema era d'1 a 1.000.000; 20 vegades més segur que el seu predecessor el  TouchID(Obri en nova finestra) .

Valga esta petit història sobre una funcionalitat quotidiana, per a introduir un tema important en el camp de la intel·ligència artificial, i en particular del camp del processament d'imatges per ordinador: els repositoris d'imatges d'entrenament de models de IAHem parlat molt en este espai sobre este camp de la intel·ligència artificial. Pocs mesos després del llançament de el  FaceID , publiquem  un post sobre IA(Obri en nova finestra) , en el qual esmentem la classificació d'imatges a nivell quasi-humà com un dels assoliments més importants de la IA en els últims anys. Açò no seria possible sense la disponibilitat de bancs oberts de imatges anotades amb els quals poder entrenar models de reconeixement i classificació d'imatges. En este post llistem alguns dels repositoris d'imatges (de lliure accés) més importants per a l'entrenament de models.

Probablement els 2 repositoris més coneguts d'imatges són  MNIST(Obri en nova finestra)  i  ImageNET(Obri en nova finestra) .

  • MNIST , és un conjunt de 70.000 imatges en blanc i negre de nombres manuscrits normalitzats en grandària, llistes per a entrenar algoritmes de reconeixement de nombres. L'article original del professor LeCun és de l'any 1998.
  • ImageNET  és una base de dades enorme de conceptes (paraules o conjunts de paraules). Cada concepte amb significat propi es denomina  synset . Cada  synset  està representat per centenars o milers d'imatges. En la pròpia web de  ImageNET  se cita el projecte com una ferramenta indispensable per al recent avanç de el  Deep Learning  i la visió per ordinador. 

    "The project has been instrumental in advancing computer vision and deep learning research.The data is available for free to researchers for non-commercial use".

    El subconjunt més utilitzat de  ImageNet  és el conjunt de dades de classificació i localització d'imatges  ImageNet Large Scale Visual Recognition Challenge(Obri en nova finestra)   ILSVRC . Este subconjunt d'imatges es va utilitzar des de 2010 fins a 2017 per a les competicions de detecció d'objectes i classificació d'imatges a nivell mundial. Este conjunt de dades abasta 1000 classes d'objectes i conté més d'un milió d'imatges d'entrenament, 50.000 imatges de validació i 100.000 imatges de prova.  Este subconjunt està disponible en Kaggle.(Obri en nova finestra)

A més d'estos dos clàssics repositoris que ja formen part de la història del processament d'imatges per intel·ligència artificial, disposem d'alguns repositoris temàtics més actuals i variats. Estos són alguns exemples:

  • Els tan molests  CAPTCHAs  reCAPTCHAs  que trobem en multitud de llocs web per a verificar els qui estem intentant accedir som humans són un bon exemple d'intel·ligència artificial aplicat al camp de la seguretat. Per descomptat, els  CAPTCHAs  també necessiten  el seu propi repositori(Obri en nova finestra)  per a comprovar cuán efectius són per a evitar accessos no desitjats. Et recomanem llegir este interessant article sobre la història d'estos companys de navegació per la web.
  • Com hem vist diverses vegades en el passat, una de les aplicacions més prometedores de la IA en el camp de la imatges és la d'assistir als metges en el diagnòstic de malalties a partir d'una prova d'imágen mèdica (rajos-x, tomografia computerizada, etc.) Per a convertir açò en una realitat, no són pocs els esforços a recopilar, anotar i posar a la disposició de la comunitat investigadora repositoris d'imatges mèdiques anonimizadas i de qualitat per a entrenar models de detecció d'objectes, formes i patrons que puguen revelar una possible malaltia. El 30% de tots els càncers que patixen les dones en el món correspon amb el càncer de mama. D'ací la importància d'explicar  amb bancs d'imatges (Obri en nova finestra) que faciliten l'entrenament de models específics.
  • El diagnòstic de malalties basades en la sang sovint implica la identificació i caracterització de mostres de sang de pacients.  Els mètodes  automatitzats (mitjançant imatge mèdica)(Obri en nova finestra)  per a detectar i classificar els subtipos de cèl·lules sanguínies tenen importants aplicacions mèdiques.
  • Fa 3 anys el Covid19 va irrompre en les nostres vides posant a les societats desenvolupades potes enlaire amb esta pandèmia d'abast mundial i conseqüències terribles en termes de pèrdues humanes i econòmiques. La comunitat científica al complet es va bolcar a donar solució en temps record per a atallar les conseqüències del nou coronavirus. Van ser molts els esforços en la millora del diagnòstic de la malaltia.  Algunes tècniques van apostar per l'anàlisi d'imatge assistides per IA(Obri en nova finestra) .  Al mateix temps, les autoritats sanitàries van incorporar un element nou en la nostra rutina diària - les mascarillas-. Encara avui a algunes situacions la mascarilla seguix sent d'obligat ús, i durant estos 3 anys hem hagut de vigilar el seu adequat ús en quasi tot tipus de llocs. Tant és així que en estos mesos han proliferat  els bancs d'imatges específics(Obri en nova finestra)  per a entrenar models de IA i visió artificial que detecten l'ús de mascarillas de forma autònoma.
  • Per a ampliar informació sobre repositoris oberts relacionats amb la salut i el benestar, et deixem  este post (Obri en nova finestra) que publiquem fa uns mesos.

A més d'estos curiosos exemples que hem citat en este post, t'animem a explorar la secció de conjunts de dades que Kaggle inclouen imatges com a dades. Tan solament tens 10.000 conjunts per a recórrer.

Font original de la notícia(Obri en nova finestra)

  • Informació i dades del sector públic