Repositorios abiertos de imágenes para entrenamiento de modelos de Inteligencia Artificial

Potser, un dels usos més quotidians de la intel·ligència artificial que podem experimentar en el nostre dia a dia siga mitjançant la interacció amb sistemes de visió artificial i identificació d'objectes. Des del desbloquege del nostre smartphone, fins a la cerca per imatges en Internet. Tots estes funcionalitats són possibles gràcies a models d'intel·ligència artificial en el camp de la detecció i classificació d'imatges. En este post recopilem alguns dels repositoris oberts d'imatges més importants, gràcies als quals, hem pogut entrenar els models actuals de reconeixement d'imatges.

Introducció

Tornem per un moment a la fi de 2017, principis del 2018. La possibilitat de desbloquejar els nostres smartphones amb algun tipus de lector d'empremta dactilar s'ha estés. Amb major o menor encert, la major part dels fabricants havien aconseguit incloure el lector biomètric en les seues terminals. El temps de desbloquege, la facilitat d'ús i la seguretat extra aportada eren excepcionals enfront dels clàssics sistemes de contrasenyes, patrons, etc. Com vé ocorrent des de l'any 2008, el líder indiscutible en innovació digital en terminals mòbils - Apple - tornava a revolucionar el mercat incorporant un nou sistema de desbloquege en el iPhone X mitjançant la imágen de la nostra cara. El denominat sistema FaceID (Obri en nova finestra) escaneja la nostra cara per a desbloquejar el terminal en desenes de segon sense haver d'utilitzar les mans. La probabilitat de suplantació d'identitat amb este sistema era d'1 a 1.000.000; 20 vegades més segur que el seu predecessor el TouchID .

Valga esta petit història sobre una funcionalitat quotidiana, per a introduir un tema important en el camp de la intel·ligència artificial, i en particular del camp del processament d'imatges per ordinador: els repositoris d'imatges d'entrenament de models de IA. Hem parlat molt en este espai sobre este camp de la intel·ligència artificial. Pocs mesos després del llançament de el FaceID , publiquem un post sobre IA (Obri en nova finestra) , en el qual esmentem la classificació d'imatges a nivell quasi-humà com un dels assoliments més importants de la IA en els últims anys. Açò no seria possible sense la disponibilitat de bancs oberts de imatges anotades amb els quals poder entrenar models de reconeixement i classificació d'imatges. En este post llistem alguns dels repositoris d'imatges (de lliure accés) més importants per a l'entrenament de models.

Probablement els 2 repositoris més coneguts d'imatges són MNIST (Obri en nova finestra) i ImageNET .

MNIST , és un conjunt de 70.000 imatges en blanc i negre de nombres manuscrits normalitzats en grandària, llistes per a entrenar algoritmes de reconeixement de nombres. L'article original del professor LeCun és de l'any 1998.

ImageNET és una base de dades enorme de conceptes (paraules o conjunts de paraules). Cada concepte amb significat propi es denomina synset . Cada synset està representat per centenars o milers d'imatges. En la pròpia web de ImageNET se cita el projecte com una ferramenta indispensable per al recent avanç de el Deep Learning i la visió per ordinador.
"The project has been instrumental in advancing computer vision and deep learning research.The data is available for free to researchers for non-commercial use".

El subconjunt més utilitzat de ImageNet és el conjunt de dades de classificació i localització d'imatges ImageNet Large Scale Visual Recognition Challenge ILSVRC . Este subconjunt d'imatges es va utilitzar des de 2010 fins a 2017 per a les competicions de detecció d'objectes i classificació d'imatges a nivell mundial. Este conjunt de dades abasta 1000 classes d'objectes i conté més d'un milió d'imatges d'entrenament, 50.000 imatges de validació i 100.000 imatges de prova. Este subconjunt està disponible en Kaggle.

A més d'estos dos clàssics repositoris que ja formen part de la història del processament d'imatges per intel·ligència artificial, disposem d'alguns repositoris temàtics més actuals i variats. Estos són alguns exemples:

Els tan molests CAPTCHAs i reCAPTCHAs que trobem en multitud de llocs web per a verificar els qui estem intentant accedir som humans són un bon exemple d'intel·ligència artificial aplicat al camp de la seguretat. Per descomptat, els CAPTCHAs també necessiten el seu propi repositori per a comprovar cuán efectius són per a evitar accessos no desitjats. Et recomanem llegir este interessant article sobre la història d'estos companys de navegació per la web.

Com hem vist diverses vegades en el passat, una de les aplicacions més prometedores de la IA en el camp de la imatges és la d'assistir als metges en el diagnòstic de malalties a partir d'una prova d'imágen mèdica (rajos-x, tomografia computerizada, etc.) Per a convertir açò en una realitat, no són pocs els esforços a recopilar, anotar i posar a la disposició de la comunitat investigadora repositoris d'imatges mèdiques anonimizadas i de qualitat per a entrenar models de detecció d'objectes, formes i patrons que puguen revelar una possible malaltia. El 30% de tots els càncers que patixen les dones en el món correspon amb el càncer de mama. D'ací la importància d'explicar amb bancs d'imatges que faciliten l'entrenament de models específics.

El diagnòstic de malalties basades en la sang sovint implica la identificació i caracterització de mostres de sang de pacients. Els mètodes automatitzats (mitjançant imatge mèdica) per a detectar i classificar els subtipos de cèl·lules sanguínies tenen importants aplicacions mèdiques.

Fa 3 anys el Covid19 va irrompre en les nostres vides posant a les societats desenvolupades potes enlaire amb esta pandèmia d'abast mundial i conseqüències terribles en termes de pèrdues humanes i econòmiques. La comunitat científica al complet es va bolcar a donar solució en temps record per a atallar les conseqüències del nou coronavirus. Van ser molts els esforços en la millora del diagnòstic de la malaltia. Algunes tècniques van apostar per l'anàlisi d'imatge assistides per IA . Al mateix temps, les autoritats sanitàries van incorporar un element nou en la nostra rutina diària - les mascarillas-. Encara avui a algunes situacions la mascarilla seguix sent d'obligat ús, i durant estos 3 anys hem hagut de vigilar el seu adequat ús en quasi tot tipus de llocs. Tant és així que en estos mesos han proliferat els bancs d'imatges específics per a entrenar models de IA i visió artificial que detecten l'ús de mascarillas de forma autònoma.

Per a ampliar informació sobre repositoris oberts relacionats amb la salut i el benestar, et deixem este post que publiquem fa uns mesos.

A més d'estos curiosos exemples que hem citat en este post, t'animem a explorar la secció de conjunts de dades que Kaggle inclouen imatges com a dades. Tan solament tens 10.000 conjunts per a recórrer.

Font original de la notícia (Obri en nova finestra)

Repositoris oberts d'imatges per a entrenament de models d'Intel·ligència Artificial

Introducció