accesskey_mod_content

Repositorios abertos de imaxes para adestramento de modelos de Intelixencia Artificial

  • Escoitar
  • Copiar
  • Imprimir PDF
  • Compartir

"Noticia dispoñible unicamente con fins históricos e de hemeroteca. A información e ligazóns mostradas correspóndense cos que estaban operativos á data da súa publicación. Non se garante que continúen activos actualmente".

19 outubro 2022

Quizais, un dos usos máis cotiáns da intelixencia artificial que podemos experimentar no noso día a día sexa mediante a interacción con sistemas de visión artificial e identificación de obxectos.

Quizais, un dos usos máis cotiáns da intelixencia artificial que podemos experimentar no noso día a día sexa mediante a interacción con sistemas de visión artificial e identificación de obxectos. Desde o desbloqueo do noso smartphone, ata a procura por imaxes en Internet. Todos estas funcionalidades son posibles grazas a modelos de intelixencia artificial no campo da detección e clasificación de imaxes. Neste post recompilamos algúns dos repositorios abertos de imaxes máis importantes, grazas aos cales, puidemos adestrar os modelos actuais de recoñecemento de imaxes.

Introdución

Volvamos por un momento a finais de 2017, principios do 2018. A posibilidade de desbloquear os nosos smartphones con algún tipo de lector de pegada dactilar estendeuse. Con maior ou menor acerto, a maior parte dos fabricantes conseguiran incluír o lector biométrico nos seus terminais. O tempo de desbloqueo, a facilidade de uso e a seguridade extra achegada eran excepcionais fronte aos clásicos sistemas de contrasinais, patróns, etc. Como vén ocorrendo desde o ano 2008, o líder indiscutible en innovación dixital en terminais móbiles - Apple - volvía revolucionar o mercado incorporando un novo sistema de desbloqueo en o iPhone X mediante a imágen da nosa cara. O denominado sistema  FaceID(Abre en nova xanela)  escanea nosa cara para desbloquear o terminal en décimas de segundo sen ter que utilizar as mans. A probabilidade de suplantación de identidade con este sistema era de 1 a 1.000.000; 20 veces máis seguro que o seu predecesor o  TouchID(Abre en nova xanela) .

Valga esta pequena historia sobre unha funcionalidade cotiá, para introducir un tema importante no campo da intelixencia artificial, e en particular do campo do procesamento de imaxes por computador: os repositorios de imaxes de adestramento de modelos de IAHemos hablado mucho en este espacio sobre este campo de la inteligencia artificial. Poucos meses despois do lanzamento de o  FaceID , publicamos  un post sobre IA(Abre en nova xanela) , no que mencionamos a clasificación de imaxes a nivel case-humano como un dos logros máis importantes da IA nos últimos anos. Isto non sería posible sen a dispoñibilidade de bancos abertos de imaxes anotadas cos que poder adestrar modelos de recoñecemento e clasificación de imaxes. En este post listamos algunos de los repositorios de imágenes (de libre acceso) más importantes para el entrenamiento de modelos.

Probablemente os 2 repositorios máis coñecidos de imaxes son  MNIST(Abre en nova xanela)  e  ImageNET(Abre en nova xanela) .

  • MNIST , é un conxunto de 70.000 imaxes en branco e negro de números manuscritos normalizados en tamaño, listas para adestrar algoritmos de recoñecemento de números. O artigo orixinal do profesor LeCun é do ano 1998.
  • ImageNET  es una base de datos enorme de conceptos (palabras o conjuntos de palabras). Cada concepto con significado propio se denomina  synset . Cada  synset  está representado por cientos o miles de imágenes. En la propia web de  ImageNET  cítase o proxecto como unha ferramenta indispensable para o recente avance de o  Deep Learning  e a visión por computador. 

    "The project has been instrumental in advancing computer vision and deep learning research.The data is available for free to researchers for non-commercial use".

    O subconjunto máis utilizado de  ImageNet  é o conxunto de datos de clasificación e localización de imaxes  ImageNet Large Scale Visual Recognition Challenge(Abre en nova xanela)   ILSVRC . Este subconjunto de imágenes se utilizó desde 2010 hasta 2017 para las competiciones de detección de objetos y clasificación de imágenes a nivel mundial. Este conjunto de datos abarca 1000 clases de objetos y contiene más de un millón de imágenes de entrenamiento, 50.000 imágenes de validación y 100.000 imágenes de prueba.  Este subconjunto está dispoñible en Kaggle.(Abre en nova xanela)

Ademais destes dous clásicos repositorios que xa forman parte da historia do procesado de imaxes por intelixencia artificial, dispomos dalgúns repositorios temáticos máis actuais e variados. Estes son algúns exemplos:

  • Os tan molestos  CAPTCHAs  reCAPTCHAs  que atopamos en multitude de sitios web para verificar quen estamos a tentar acceder somos humanos son un bo exemplo de intelixencia artificial aplicado ao campo da seguridade. Por suposto, os  CAPTCHAs  tamén necesitan  o seu propio repositorio(Abre en nova xanela)  para comprobar cuán efectivos son para evitar accesos non desexados. Recomendámosche ler este interesante artigo sobre a historia destes compañeiros de navegación pola web.
  • Como vimos varias veces no pasado, unha das aplicacións máis prometedoras da IA no campo das imaxes é a de asistir aos médicos no diagnóstico de enfermidades a partir dunha proba de imágen médica (raios-x, tomografía computerizada, etc.) Para converter isto nunha realidade, non son poucos os esforzos en recompilar, anotar e pór a disposición da comunidade investigadora repositorios de imaxes médicas anonimizadas e de calidade para adestrar modelos de detección de obxectos, formas e patróns que poidan revelar unha posible enfermidade. O 30% de todos os cancros que padecen as mulleres no mundo corresponde co cancro de mama. De aí a importancia de contar  con bancos de imaxes (Abre en nova xanela) que faciliten o adestramento de modelos específicos.
  • O diagnóstico de enfermidades baseadas no sangue a miúdo implica a identificación e caracterización de mostras de sangue de pacientes.  Os métodos  automatizados (mediante imaxe médica)(Abre en nova xanela)  para detectar e clasificar os subtipos de células sanguíneas teñen importantes aplicacións médicas.
  • Hai 3 anos o Covid19 irrompeu nas nosas vidas pondo ás sociedades desenvolvidas patas para arriba con esta pandemia de alcance mundial e consecuencias terribles en termos de perdas humanas e económicas. A comunidade científica ao completo envorcouse en dar solución en tempo record para atallar as consecuencias do novo coronavirus. Foron moitos os esforzos na mellora do diagnóstico da enfermidade.  Algunhas técnicas apostaron pola análise de imaxe asistidas por IA(Abre en nova xanela) .  Ao mesmo tempo, as autoridades sanitarias incorporaron un elemento novo na nosa rutina diaria - as máscaras-. Aínda hoxe nalgunhas situacións a máscara segue sendo de obrigado uso, e durante estes 3 anos tivemos que vixiar o seu adecuado uso en case todo tipo de lugares. Tanto é así que nestes meses proliferaron  os bancos de imaxes específicos(Abre en nova xanela)  para adestrar modelos de IA e visión artificial que detecten o uso de máscaras de forma autónoma.
  • Para ampliar información sobre repositorios abertos relacionados coa saúde e o benestar, deixámosche  este post (Abre en nova xanela) que publicamos hai uns meses.

Ademais destes curiosos exemplos que citamos neste post, animámosche a explorar a sección de conxuntos de datos de que Kaggle inclúen imaxes como datos. Tan só tes 10.000 conxuntos para percorrer.

Fonte orixinal da noticia(Abre en nova xanela)

  • Información e datos do sector público