IA: Google Vision


Cada día se utiliza con más frecuencia el análisis de imágenes a través de Inteligencia Artificial, no sólo a nivel de reconocimiento facial en plan Gran Hermano Chino si no también para automatizar procesos que antes tenían que ser realizados por una persona.

Normalmente en esta primera oleada se están automatizando tareas repetitivas y sencillas, todavía no hemos llegado al futuro distópico de la película Yo Robot.

Todas las grandes empresas tecnológicas y algunas comunidades de Open Source están desarrollando sus herramientas para aplicar Inteligencia Artificial al análisis de la manera más eficaz posible.

Google ha puesto a disposición de los desarrolladores un conjunto de herramientas para esta tarea que se agrupan en torno a Autovision ML y a API Vision.

Autovision ML sirve para crear modelos de análisis de imágenes, un modelo de análisis se crea "enseñando" a la máquina a aprender de cada imagen que le procesamos, para ello estas imágenes se clasifican con unos metadatos, se le entregan a la máquina y conforme va recibiendo imágenes va "aprendiendo" a diferenciar unas de otras, con este aprendizaje será capaz de analizar una imagen que no haya participado nunca en el proceso.

Podemos usar Autovision para cualquier tipo de imágenes que queramos siendo conscientes que para que una IA aprenda necesita un mínimo de imágenes y que cuantas más imágenes tenga más precisa será. Esta herramienta tiene sentido para aprendizaje de temas muy específicos.

API Vision sirve para clasificar el contenido de una serie de imágenes, detecta objetos y caras, lee texto y consigue metadatos de cada imagen. Aquí no hay mucho trabajo de desarrollo, está todo desarrollado por Google y tan sólo nos limitamos a usar su motor.

Dependiendo de tu objetivo debes usar Autovision ML o la API Vision.

En ambos casos el servicio no es gratuito, dependiendo de los recursos que consumas Google dispone de unos rangos para cobrar.

Comentarios