Nueva técnica de visión artificial para contar aglomeraciones de personas

Tècniques de visió artificial per comptar aglomeracions de persones

Investigadores del CVC-UAB y de la Universidad de Florencia han desarrollado una nueva técnica basada en un algoritmo que permite contabilizar el número de personas dentro de aglomeraciones de manera más precisa que la existente hasta ahora, con un margen de error de solo entre el 10 y el 20%.

27/02/2018

Contar el número de personas en grandes aglomeraciones en espacios abiertos no resulta fácil y según las metodologías empleadas las cifras pueden variar sustancialmente. Ahora, los investigadores Xialei Liu y Joost Van de Weijer, del Centro de Visión por Computador-acreditado con el sello TECNIO de ACCIÓ-, en un estudio conjunto con la Universidad de Florencia, han desarrollado un algoritmo que utiliza técnicas de visión artificial que estima con mayor precisión el número de personas que aparecen en imágenes fijas o videográficas, con una franja de error de entre solo un 10 a un 20%. Esta es la mayor precisión conseguida a día de hoy en este ámbito. La nueva técnica la han dado a conocer en el marco del Mobile World Congress, en Barcelona.

Un software de este estilo puede ser imprescindible dentro del área de la vídeo vigilancia, monitorización y análisis de comportamientos. Hasta ahora, la problemática científica era evidente: distorsiones de perspectiva, distribución desigual, iluminación compleja, variación de escalas y un largo etcétera, hacían que los algoritmos de visión artificial no fuesen capaces de contar cabezas dentro de una imagen. Los investigadores han alcanzado un algoritmo estable haciendo uso de mapas de densidad, que ayudan a anular la mayoría de estas distorsiones.

Además, la técnica elimina la problemática principal: la necesidad de imágenes previamente procesadas para entrenar los algoritmos de visión. Enseñar a los ordenadores a contar en grandes aglomeraciones necesita imágenes que hayan sido tratadas por un humano. Este le dice al ordenador lo que hay dentro de cada píxel (como un profesor cuando enseña a un niño una materia que nunca ha estudiado). El Dr. Van de Weijer y su equipo eliminan esta variable, haciendo el proceso mucho más rápido y barato, ¿Cómo? Enseñando a los ordenadores a comparar imágenes.

El proceso es sencillo en esencia, pero complejo en la práctica: se le da al ordenador una primera imagen y, tras ello, se le dan recortes de la misma. Entonces, el ordenador tiene que aprender que hay menos gente en la segunda fotografía (el recorte) que en la primera (la original). Esta técnica, afinada, es la base del aprendizaje de este nuevo algoritmo.

La visión artificial necesita de una ingente cantidad de imágenes para poder aprender. Estas imágenes son difíciles de obtener, especialmente aquellas que deben ser anotadas y procesadas por humanos para conseguir que el ordenador las entienda. Con este algoritmo, Van de Weijer y su equipo abren las puertas a posibilidades inmensas en ámbitos de seguridad y vigilancia, y pueden ayudar en el debate abierto sobre la cantidad de personas en diferentes movilizaciones ciudadanas alrededor del mundo.

Los investigadores presentarán su nueva técnica en el prestigioso CVPR (Computer Vision & Pattern Recognition Conference) de este año, que tendrá lugar en Salt Lake City, Utah, el próximo mes de junio.