Moverá u$s 40.000 millones

Esta es la última tecnología que usa Apple y que quieren implementar las empresas: para qué sirve

"Computer vision" propone romper las barreras entre lo físico y lo digital y revolucionó el mercado tras el anuncio del lanzamiento de los Apple Vision Pro. Cómo podría implementarse en industrias que van desde retail hasta agro o, incluso, seguridad y logística.

En esta noticia

Dicen que una imagen vale que mil palabras. El concepto de "visión por computadora" recoge el guante de este antiguo dicho y propone utilizar la inteligencia artificial (IA) para transformar videos y otros elementos audiovisuales en datos accionables para la toma de decisiones dentro de una empresa o, incluso, generar recomendaciones de manera automática. Entre otras habilidades, esta tecnología es clave para reconocer objetos, identificar rostros o comprender de manera precisa entornos tridimensionales.

No se trata de una novedad. "Es un campo que viene desarrollándose desde hace 10 años de forma empírica", define Érika Chacón, líder de arquitectos de soluciones en IBM Argentina, quien detalla las dos tecnologías esenciales que anidan en su base: deep learning, que permite diferenciar entre imágenes sin necesidad de una programación específica, y las redes neuronales convolucionales (CNN).

El anuncio de los lentes de realidad virtual Apple Vision Pro en junio pasado fue un sacudón para el mercado: se trata de un dispositivo clave para mejorar la integración entre el mundo virtual y el real, favorece la integración humano-computadora y habilita una navegación espacial precisa. De hecho, es la base de lo que se conoce como "computación espacial", una suerte de rotura entre el mundo físico y el virtual, una integración entre los datos y los átomos. Si bien es un producto de precio muy elevado, por lo que difícilmente sea adoptado de manera masiva, fue útil para poner la conversación sobre la mesa.

El anuncio de los lentes de realidad virtual Apple Vision Pro en junio pasado  fue un sacudón para el mercado.

Por esto, entre otras cosas, el uso de la visión por computadora crece a gran velocidad. Allied Market Research estima que a nivel mundial el negocio va a mover más de US$ 40.000 millones en 2030 (es más del cuádruple de lo que mueve hoy).

La evolución de esta tecnología se está dando a velocidad de montaña rusa. Juan Pablo Chemes, director de Innovación de Accenture Argentina, enumera tres avances clave para el desarrollo de esta tecnología: "El desarrollo de nuevos algoritmos de aprendizaje automático que habilitan tareas más complejas, como la detección de objetos en movimiento, la clasificación de imágenes y la comprensión del lenguaje natural; el aumento de la disponibilidad de datos de entrenamiento para IA y el desarrollo de nuevas plataformas de hardware y software que permiten a los desarrolladores crear sistemas de computer vision más eficientes y adaptables".

Hasta donde llegan los ojos

En la medida en que se integra con otras tecnologías, su poder aumenta. "Combinada con la IA genérica y la robótica, se puede decir que es uno de los motores de innovación del siglo XXI, clave en áreas de suma importancia como la realidad mixta o la conducción autónoma de vehículos", explica Renzo Guastavino, desarrollador senior en la consultora especializada en transformación digital Endava.

Respecto de los vehículos autónomos, Chacón afirma que "es un caso interesante a nivel mundial: las técnicas de visión artificial permiten interpretar la información visual captada por cámaras y otros sensores de los automóviles para identificación de elementos como otros vehículos, señales de tráfico, carriles, peatones, bicicletas y demás, para asistir al conductor".

"Lo que comenzó con modelos principalmente dirigidos al reconocimiento de objetos evolucionó y se especializó en numerosas áreas", describe Francisco Laborda, ingeniero de datos senior de Mofiler, especializada en inteligencia de localización: recopilación y análisis de datos geoespaciales para lograr insights y entender el comportamiento de las personas.

Respecto de los vehículos autónomos, las técnicas de visión artificial permiten interpretar la información visual captada por cámaras y otros sensores de los automóviles para identificación de elementos como otros vehículos, señales de tráfico, carriles, peatones, bicicletas y demás, para asistir al conductor.

El futuro parece instalarse en el presente. "Todo lo que trae aparejada esta innovación tecnológica creo que es lo que siempre imaginamos que iba a pasar desde pequeños cuando hacíamos future thinking", Rodrigo Scandura, CEO de la agencia de marketing Cuatro Coronas. "Lo que se viene con Apple Vision Pro es una primera versión: seguirán miles de iteraciones con sus respectivas mejoras para estos dispositivos que vienen empujados por Oculus y Meta desde hace muchos años, habrá que ver cómo usamos todos estos dispositivos y qué vienen a reemplazar", afirma.

"El ser humano no solo detecta objetos, sino que entiende lo que pasa y eso, que faltaba en computer vision, ahora se está incorporando: la capacidad de comprender y analizar qué está pasando en una imagen o video", cuenta Nahuel Alberti, responsable de Ingeniería de la consultora en innovación Paisanos, quien destaca el lanzamiento reciente de GPT Vision, una funcionalidad nueva de ChatGPT que y brinda información sobre imágenes, desde entender la letra de una receta médica hasta interpretar un diagrama complejo.

Una mirada a los casos de uso

En un informe reciente, DHL asegura que se convertirá en una parte integral de las operaciones estándar en logística durante los próximos cinco años y además ofrece numerosos casos de uso para esta tecnología. En particular, es muy útil para automatizar y simplificar el proceso de dimensionamiento en los envíos, en especial en los casos en que las mediciones precisas de las áreas o volúmenes de los objetos son esenciales para calcular las capacidades de almacenamiento, la planificación de la carga, la logística del transporte y la facturación de los envíos. También permite comprobar que los envíos cumplan las normas y estén correctamente ordenados para su clasificación, así como automatizar los ciclos de conteo de inventario.

Javier Minhondo, arquitecto de soluciones de negocio en Nubiral, destaca que esta tecnología "puede hacer posible el desarrollo del metaverso, lo que abre oportunidades emocionantes en entretenimiento, educación y otras".

Para Alberti, buena parte del poder de esta tecnología es que no se limita a las grandes industrias. "Puede ayudar tanto a rediseñar tu cuarto con un enfoque específico, como ‘moderno' o ‘rústico', como para, si te dedicás a la tecnología, ayudarte a entender un diagrama de flujo, un gráfico o una métrica y hasta para escribir código a partir de un boceto".

Más seguros, más eficientes

Los casos de uso se multiplican en la medida en que se expande la imaginación. Parece no haber límites para esta tecnología. En el área de seguridad en el lugar de trabajo, por ejemplo, puede identificar peligros potenciales en diferentes instalaciones y ayudar con su prevención. Desde una caja mal ubicada que esté a punto de desplomarse hasta un vehículo que esté a punto de provocar un accidente. En simultáneo, es capaz de evaluar el estado de los activos -como las maquinarias y los vehículos dentro de una instalación industrial-, incluyendo la detección de defectos o anomalías en su funcionamiento. Estas habilidades son muy valoradas en industrias como la química, la minería, la de petróleo y gas, la metalmecánica o la de construcción.

Otro caso de uso muy transitado es el de videovigilancia: analiza intrusiones o entradas no autorizadas a un sitio en particular, que puede ser un edificio completo o, por ejemplo, el centro de datos o, en el caso de un laboratorio, donde se guardan determinadas pruebas o reactivos. Una de las aplicaciones es reconocimiento facial masivo, ideal para incrementar la seguridad en eventos públicos, prevenir delitos o colaborar con la justicia en la búsqueda de prófugos.

Computer vision se convertirá en una parte integral de las operaciones estándar en logística durante los próximos cinco años.

También se puede utilizar para mejorar la salud de los empleados: advertir sobre malas posturas o movimientos, identificar si se usan los equipos de protección -cascos, anteojos, barbijos o los que apliquen a cada industria- o incluso detectar signos de fatiga.

Desde el punto de vista de las operaciones, puede utilizarse para armar mapas de calor que permitan el análisis de flujo de trabajo y así, optimizar ineficiencias o eliminar cuellos de botella.

¿Cuándo nos vemos?

¿Qué tan desarrollada está esta tecnología en nuestro país? "El camino en la Argentina es todavía muy largo", indica Tomás Márquez Macri, CEO y cofundador de Eureka, proveedora de soluciones tecnológicas publicitarias con presencia en una decena de países. "Si bien, hay empresas en distintos rubros que comenzaron a implementarla en sus experiencias de venta, sigue siendo un negocio en pañales", afirma. Cuenta que en la región el uso más extendido es la realidad aumentada, que contextualiza productos en lugares reales, evitando la visita física a la tienda. "Se ve en pinturerías, mueblerías y locales de venta de objetos para los hogares, aunque cada vez se prueban más en negocios de venta de indumentaria, tiendas de comestibles y apps de delivery", relata.

Aun así, aparecen en el país las primeras aplicaciones concretas. Guastavino, por ejemplo, cuenta que la agricultura ya cuenta con drones para controlar cultivos y los organismos de planeamiento urbano, en la detección de espacios disponibles para estacionar.

Google mira a Buenos Aires
Distintos avances tecnológicos de Google vinculados al mundo de la visión por computadora ya están disponibles -o están a punto de hacerlo- en la capital de Argentina. Por ejemplo, la funcionalidad "Vista Inmersiva" de Maps, presentada a principios de este año para entregar representaciones realistas en tres dimensiones de las ciudades, incluye 500 sitios emblemáticos del mundo, entre ellos algunos spots de Buenos Aires: el Obelisco, el Teatro Colón, la Casa Rosada, el Palacio Barolo, el Museo Nacional de Bellas Artes y el MALBA. Además, se habilitó Lens (para hacer búsquedas de imágenes por contenidos) en unas 50 nuevas localidades, entre ellas Buenos Aires.

  Puntualmente, en el mundo de los agronegocios se abre un enorme potencial para computer vision. "Con sensores y cámaras, se pueden recopilar datos sobre las condiciones del suelo, el clima y la salud de las plantas para aumentar la producción, predecir resultados de cultivos y optimizar el uso de recursos, crucial para el sector agrícola argentino", dice Minhondo. También destaca que puede contribuir al monitoreo continuo y la detección temprana de problemas en animales de granja.

"La Argentina es un país con una matriz productiva muy interesante para la aplicación de computer vision", analiza Fredi Vivas, CEO de RockingData. "La ganadería extensiva, el agro, la minería, los parques de energías renovables, las represas y los pozos petroleros son ámbitos donde esta tecnología puede brindar grandes oportunidades... Somos un país enorme, nuestras principales actividades económicas no se dan en espacios reducidos, y eso muchas veces se dificulta si sólo tenemos a disposición el ojo humano".

Más allá del agro

En efecto, la adopción de esta tecnología en el país va más allá de los agronegocios. "Muchas empresas en la Argentina han implementado sistemas de visión para mejorar la eficiencia en la fabricación", afirma Héctor Ferraro, director de Back End & Cognitive de la consultora tecnológica Snoop Consulting. "También vemos una potencial tendencia de adopción entre las tiendas de comercio electrónico, en especial para la recomendación de productos basada en imágenes", agrega.

"En nuestra industria, ayuda entregar soluciones que mejoren y agilicen los diagnósticos médicos con la menor repercusión sobre el paciente: exámenes o estudios de imagenología que antes tardaban días en arrojar un resultado, hoy solo demoran unas horas", cuenta Markus Schreyer, CEO y fundador de The Ganesha Lab, scale up global especializada en biotecnología.

La empresa tiene en su portafolio la experiencia de la startup argentina Vali, que combinó esta tecnología con un equipo humano de expertos en citogenética para realizar análisis de cariotipo asociando 20 a 30 imágenes de metafases y duplicando la capacidad de procesamiento. También trabajan con Tensocare, que está probando computer vision en América latina el uso de imágenes complejas como resonancias magnéticas (MRI) para mejorar significativamente el diagnóstico y la capacidad de identificar un inicio temprano de la osteoartritis.

Filtrado en lo cotidiano

Damián García, responsable de Delivery de la comunidad de desarrolladores de software Devify at Ingenia, puntualiza en algunos segmentos de la medicina, como la dermatología. "Las imágenes también cumplen un rol muy importante en los diagnósticos y seguimientos de tratamientos (psoriasis, dermatitis, eccema, cáncer de piel, entre otras)". También pone de relevancia la capacidad de las aseguradoras para trabajar con imágenes de siniestros y preprocesar los casos de sus clientes, pudiendo sacar informes o derivar a los expertos con una previa evaluación y análisis de daños del evento denunciado.

En el segmento retail, "puede ayudar a identificar tendencias de compra, gestionar el inventario de manera eficiente y mejorar la experiencia del cliente", enumera Minhondo.

Con sensores y cámaras, se pueden recopilar datos sobre las condiciones del suelo, el clima y la salud de las plantas para aumentar la producción.

Se suma a esta idea Martín Rabaglia, CEO de la agencia creativa Genosha y miembro de Interact, la asociación argentina que nuclea agencias, consultoras y productoras del ecosistema digital. "Por ejemplo, estás en un local y querés preguntar sobre un producto y esa información se puede dar únicamente con lo que una computadora puede entender de lo que hay a tu alrededor", aporta. "Dentro de las disciplinas publicitarias, de comunicaciones y de servicios el potencial es enorme", agrega.

Incluso, ocurre que muchas veces utilizamos aplicaciones que ya incorporaron la tecnología sin darnos cuenta. "Un ejemplo es el de las billeteras virtuales que al registrarte te piden una selfie y que hagas algún gesto junto con tu DNI: no es más que visión por computadora enfocada en el análisis de documentación y rostros", indica Alberti.

Visión sin barreras

Por supuesto, si una tecnología emerge, aparecen también los obstáculos.

"La principal barrera en la Argentina es la falta de talento especializado", expresa Alejandro Mitaritonna, coordinador del curso de posgrado Inteligencia Artificial aplicado a los negocios de la UB. "La demanda de profesionales en esta área supera la oferta", especifica.

El mencionado informe de DHL hace referencia a las barreras de aceptación del público. "En especial, de aquellos que temen un monitoreo constante", especifica. La ciberseguridad y la privacidad de los datos constituyen otro gran punto a resolver. "A pesar de estas barreras, la visión por computadora en lentes de realidad mixta tiene un gran potencial para transformar industrias y la interacción con el mundo digital y real a medida que se aborden estos desafíos y se impulsen soluciones innovadoras", dice Guastavino.

"La falta de regulaciones claras también puede ser un obstáculo: sería ideal que las normas se apliquen en modo universal para que no generen nuevos conflictos entre comunidades", indica Márquez Macri.

"A pesar de los obstáculos, como los altos costos de infraestructura y software, la falta de estándares y regulaciones o la ausencia de conciencia sobre sus ventajas, el mercado posee mucho potencial", dice Chemes.

Es que los beneficios exceden por mucho a las barreras. Parafraseando mal a El principito, en este caso, lo esencial tampoco es invisible para computer vision.

Esta nota se publicó originalmente 359 de revista Apertura.

Temas relacionados
Más noticias de innovación

Las más leídas de Apertura

Las más leídas de Negocios

Noticias de tu interés

Compartí tus comentarios

¿Querés dejar tu opinión? Registrate para comentar este artículo.