La mejor actualidad tecnológica

Reconocimiento de imágenes con Inteligencia Artificial

Reconocimiento de imágenes con Inteligencia Artificial

La visión por ordenador consiste esencialmente en reconocer determinados patrones o características en las imágenes. Para ello, hay que analizar cada píxel o grupo de píxeles, y darles un significado.

Te recomiendo que ANTES de seguir leyendo sobre cómo funciona el procesamiento automático de imágenes, leas un poco sobre el procesamiento básico de una imagen digital.

El algoritmo en la IA

¿Cómo reconocen los ordenadores los píxeles que componen determinadas imágenes?

Para ello, necesitamos algoritmos que analicen todas las condiciones y patrones que permiten detectar la presencia de un determinado objeto en una imagen, lo que se denomina entrenamiento, machine learning o aprendizaje por refuerzo, como la máquina que gano al campeón de Go Lee Sedol Alphago

Los algoritmos son un conjunto de instrucciones o reglas definidas, no ambiguas, ordenadas y finitas, que suelen permitir resolver un problema, realizar un cálculo, procesar datos y llevar a cabo otras tareas o actividades.

Identificación automática de patrones en una imagen

El entrenamiento puede hacerse por repetición. El ordenador debe recibir el mayor número posible de imágenes identificadas o etiquetadas. Por ejemplo, si se quiere enseñar a un ordenador a reconocer ovejas, se le mostrarían numerosas imágenes con ovejas etiquetadas. Para etiquetar las ovejas, el ordenador identificaría qué píxeles concretos tienen patrones o características de una oveja y luego asociaría esa estructura de píxeles con las ovejas.

Este caso se conoce como aprendizaje supervisado en el aprendizaje automático.

Ahora estos patrones o características pueden ser millones, y para ello utilizamos la inteligencia artificial, en este ejemplo las redes neuronales, que son uno de los tipos de aprendizaje automático más populares en la inteligencia artificial.

¿Qué son las redes neuronales?

No, no voy a explicar qué es una red neuronal. Sólo voy a mencionar que en el caso de la visión por ordenador, es un algoritmo que procesa e imita la corteza visual del ojo humano para reconocer diversas características en las entradas (lo hemos visto en el procesamiento de imágenes) que finalmente le permiten identificar y finalmente “ver” objetos.

Puede reconocer puntos, líneas, curvas y rasgos hasta reconocer formas complejas como una cara o la silueta de un animal.

No hay que olvidar que la propia red neuronal tiene que aprender a reconocer un gran número de objetos en las imágenes, y que para ello necesitamos un gran número de imágenes.

A continuación, explicaremos una de las técnicas de procesamiento automático para entender la complejidad y los pasos que se siguen. Hay muchas más técnicas, pero todas tienen el mismo objetivo: el reconocimiento de patrones.

Hasta hace unos años, la gente etiquetaba manualmente las imágenes para enseñar a la máquina dónde estaban las orejas o la cola de un gato. Esto se llamaba “características etiquetadas a mano” y solía ser común, pero consumía mucho tiempo y era puramente “comparativo” y no un aprendizaje real de las características de las imágenes.

En la siguiente imagen vemos la imagen de un gato, luego la conversión a gris, que permite ver mejor las líneas principales en grupos de píxeles, y luego la selección de partes del gato (orejas, boca, nariz, etc.). Con esta información, nuestra red neuronal debería ser capaz de reconocer un gato en la imagen.

Pero si un gato agacha las orejas o se aleja de la cámara: la red neuronal no podrá identificarlo.

Así que tenemos que intentar que la máquina aprenda las características por sí misma, basándose en las líneas de base. Un método podría ser dividir toda la imagen en bloques de 8 × 8 píxeles y asignar a cada uno un tipo de línea dominante, ya sea horizontal [-], vertical [|] o diagonal [/].

El resultado de nuestro proceso son varias tablas formadas por “palos”, que son de hecho las características más simples que representan los bordes de los objetos de la imagen. Son simplemente imágenes formadas por palos. Así que, una vez más, podemos tomar un bloque de 8 × 8 y ver si coinciden. Y así sucesivamente.

En una tarea interminablemente tediosa y aburrida pero que con la potencia de cómputo actual es algo chupado.

 

RELACIONADOS

ANUNCIOspot_img

ÚLTIMOS

Utilizamos cookies, al aceptar entiende las condiciones.    Configurar y más información
Privacidad