Visió artificial amb aprenentatge automàtic: què és i com pot ajudar-nos?

Visión-artificial-con-aprendizaje-automático-Qué-es-cómo-puede-ayudarnos-Itequia

Visió artificial amb aprenentatge automàtic: què és i com pot ajudar-nos?

Què és la visió artificial?

La visió artificial és un camp de la intel·ligència artificial (IA) que permet als ordinadors i sistemes extreure informació significativa a partir d’imatges digitals, vídeos i altres entrades visuals, gràcies a elles, aquests poden prendre mesures o fer recomanacions en funció d’aquesta informació.

Que-es-vision-artificial-Itequia

Podríem dir que si la IA permet als ordinadors pensar, la visió artificial els permet veure, observar i comprendre.

La visió artificial clàssica té múltiples aplicacions al dia a dia. Des de codis de barres, a lectors de matrícules, fins a sistemes per detectar defectes a les línies de producció.

Tot i això, les seves capacitats són limitades, i la seva implementació, de vegades, és molt costosa i amb una fiabilitat baixa per a algunes de les tasques més complexes.

Però el gran avenç de l’aprenentatge automàtic en els darrers anys ha revolucionat el camp de la visió artificial, permetent noves aplicacions que fa uns anys semblaven impensables.

Com funciona la visió artificial?

La visió artificial necessita alimentar-se de moltes dades. Aquesta tecnologia executa l’anàlisi de dades una vegada i una altra fins que percep diferències i finalment reconeix imatges.

Como-funciona-vision-artificial-Itequia

Per exemple, per entrenar un ordinador perquè reconegui fars d’automòbils, cal incorporar-hi una gran quantitat d’imatges de fars i elements relacionats amb els fars perquè pugui aprendre les diferències i pugui reconèixer un far d’automòbil, especialment un sense defectes.

Principalment s’utilitzen dues tecnologies bàsiques per aconseguir això:

  • Un tipus de Machine Learning anomenat Deep Learning
  • Una xarxa neuronal convolucional (CNN, per les sigles en anglès)

Machine Learning

El Machine Learning utilitza diferents models algorísmics que permeten a un ordinador ensenyar-se a si mateix el context de les dades visuals.

Si s’introdueixen dades suficients a través del model, l’ordinador “observarà” les dades i aprendrà a diferenciar una imatge d’una altra. Els algorismes són tan importants perquè permeten que la màquina aprengui per si mateixa, en lloc que algú la programi perquè reconegui una imatge.

Xarxa Neuronal Convolucional

Una CNN ajuda un model de Machine Learning o Deep Learning a “observar” desglossant les imatges en patrons.

Aquesta xarxa neuronal executa una sèrie d’operacions matemàtiques i comprova l’exactitud de les seves prediccions en una sèrie d’iteracions fins que les prediccions tenen certa fiabilitat. És en aquell moment quan aconsegueix reconèixer o veure imatges de manera similar als humans.

Programació clàssica Vs aprenentatge automàtic

Vegem ara les diferències principals entre la programació clàssica i l’aprenentatge automàtic, desenvolupat durant els últims anys.

A la programació tradicional es defineixen unes regles mitjançant codi de programació ia partir d’una sèrie de dades d’entrada se n’obtenen uns resultats:

Programación-Clasica-VS-aprendizaje-automatico-Itequia-CT

Per contra, a l’aprenentatge automàtic, l’objectiu és que la màquina aprengui les regles necessàries per aconseguir que, a partir d’unes dades d’entrada, s’obtinguin les respostes adequades.

Aquest procés es pot resumir en dues fases:

Fase 1 | Aprenentatge

Fases-Aprendizaje-Machine-Learning-Itequia-CT

És la fase més costosa en temps i recursos computacionals. Es comença amb un primer model aleatori que va canviant en múltiples passos mitjançant càlculs estadístics, fins a trobar una configuració on les respostes generades a partir de les dades d’entrenament (Train Data) siguin les millors possibles.

Posteriorment, es procedeix a avaluar el rendiment del model predictiu a partir de dades que no s’hagin utilitzat a la fase d’entrenament (Test Data).

Fase 2 | Inferència

Fase-Inferencia-Aprendizaje-Automatico-Itequia-CT

Un cop disposem del model entrenat i validat, obtenim les respostes a partir de noves dades.

El procés d’aprenentatge automàtic a la visió artificial es realitza mitjançant xarxes neuronals profundes, on hi ha una sèrie de capes ocultes de neurones artificials que permeten modelar relacions no lineals complexes, juntament amb una primera capa que rep les dades d’entrada i una darrera capa que ens proporciona els resultats.

Redes-Neuronales-Profundas-Aprendizaje-Automatico-Itequia-CT

Quines aplicacions pràctiques té la visió artificial?

Vegem a continuació algunes de les aplicacions practiques de la visió artificial amb aprenentatge automàtic:

Diagnòstic per imatge

Diagnostico-por-imagen-Aprendizaje-automatico-Itequia

A partir de grans bases de dades amb imatges mèdiques com TACs i ressonàncies magnètiques, juntament amb dades associades a aquestes, s’han construït models molt avançats, capaços de diagnosticar, en molts casos, amb més precisió que els millors especialistes mèdics.

1: *Imatge generada mitjançant intel·ligència artificial (DALL-E)

Conducció autònoma

Conducción-Autonoma-Aprendizaje-Automatico-Itequia

Al camp de la conducció autònoma, la visió artificial mitjançant aprenentatge automàtic és una peça fonamental del sistema.

Aquest tipus de vehicles compten amb multitud de càmeres i sensors, que permeten veure i analitzar el seu entorn per poder reaccionar davant de qualsevol circumstància.

1: *Imatge generada mitjançant intel·ligència artificial (Stable Diffusion)

Control de qualitat

Control-de-Calidad-Aprendizaje-Automatico-Itequia

Si bé la visió artificial clàssica ja fa temps que s’utilitza en el control de qualitat a la indústria, amb l’aprenentatge automàtic hi ha hagut un gran salt qualitatiu quant a fiabilitat i precisió en la detecció de problemes a la línia de producció, que combinats amb altres sistemes d’intel·ligència artificial permeten no només detectar problemes sinó que també permet anticipar-s’hi.

1: *Imatge generada mitjançant intel·ligència artificial (Stable Diffusion)
Jordi Puig Reñé – Software Developer at Itequia