• UABDivulga
04/2010

Sistema de detección de peatones

Sistema per a la detecció de vianants

Durante la próxima década, los sistemas de protección de peatones jugarán un papel fundamental en el reto de mejorar la seguridad viaria. El objetivo principal de estos sistemas, detectar peatones en entornos urbanos, implica procesar imágenes de escenas exteriores desde una plataforma móvil para buscar objetos de aspecto variable como son las personas. Dadas estas dificultades, estos sistemas hacen uso de las últimas técnicas de visión por computador. Esta propuesta consiste en un sistema de tres módulos basado tanto en información 2D como en 3D. El primer módulo utiliza información 3D para hacer una estimación de los parámetros de la carretera y seleccionar regiones de interés que serán analizadas después. El segundo módulo utiliza un clasificador de ventanas 2D para etiquetar las mencionadas regiones como peatón o no peatón. El módulo final vuelve a utilizar de nuevo la información 3D para verificar las regiones clasificadas y, con información 2D, refinar los resultados finales. Los resultados experimentales son positivos tanto en rendimiento como en tiempo de cómputo.

Hoy en día, los accidentes de tráfico representan una de las mayores causas de muerte. De acuerdo con la Organización Mundial de la Salud (OMS), cada día tres mil personas mueren como resultado de un accidente de tráfico. Durante la última década, además de los populares airbags o el ABS, una nueva línea de investigación enfocada a sistemas más inteligentes está ganando interés por parte de la comunidad científica. Estos sistemas, conocidos como sistemas avanzados de asistencia al conductor (conocidos como ADAS, su acrónimo en inglés), predicen y anticipan los accidentes para evitarlos en vez de paliar sus consecuencias como era habitual con los otros métodos. Algunos ejemplos de ADAS son los sistemas de aviso de cambio de carril o los controles adaptativos de crucero. Uno de los ADAS más complejos son los sistemas de protección de peatones, debido a que las personas son una de las clases más difíciles de modelar. Su variabilidad en términos de medida, distancia o apariencia es muy grande. Además, el propio movimiento del vehículo añade dificultades como el cambio constante de la escena y de la posición de los objetos en ésta cuando son vistos desde la cámara.

En este trabajo proponemos un sistema basado en tres módulos, cada uno dirigido a una tarea diferente.

• El primer módulo hace uso de la información 3D reconstruida desde una cámara Pointgrey Bumblebee. En este caso proponemos el algoritmo adaptive road scanning, que primero estima la posición relativa entre la cámara y la carretera mediante RANSAC, y después recorre el plano carretera en 3D con ventanas de la medida de un peatón. Estas ventanas son proyectadas a la imagen y enviadas al siguiente módulo.

• El segundo módulo recibe los candidatos, proyectados a la imagen en 2D, y los clasifica como peatones o no peatones mediante el algoritmo de aprendizaje Real AdaBoost. Este clasificador hace uso de características de Haar e histogramas de orientación de contornos. El clasificador ha sido entrenado en nuestra propia base de datos de peatones, que consiste en 1000 ejemplos positivos y 5000 negativos.

• Finalmente, el tercer módulo realiza dos tareas. Primero verifica que las detecciones (ventanas clasificadas como peatón) sean realmente un peatón. Esto se lleva a cabocomprobando que la distancia teórica de la ventana (o sea, dependiendo de su medida y de los parámetros del sensor a cada ventana le corresponde una distancia) y los valores de distancia de los píxeles adentro de la ventana (información 3D) concuerdan. La segunda tarea corresponde al refinamiento de las ventanas solapadas: se utiliza el conocido algoritmo de clustering Mean shift para agrupar las detecciones que corresponden al mismo peatón.

Los resultados experimentales muestran que tanto los módulos independientemente como el sistema dan resultados satisfactorios en secuencias representativas. En el caso de la estimación de la posición relativa carretera-cámara, se ha comparado el resultado en forma de línea del horizonte (es una medida fácil y directa de resumir esta posición relativa) calculado por el algoritmo con la anotación manual en una secuencia. En el caso del clasificador propuesto, el rendimiento se ha comparado con los conocidos histogramas de orientación de gradientes. Aquí hemos consiguiendo ganancias cuantitativas en tiempos de cálculo o en rendimiento, dependiendo de la configuración escogida. Respeto a la verificación y el refinamiento y del sistema, las evaluaciones han sido cualitativas utilizando tanto imágenes como secuencias, consiguiendo resultados prometedores tanto en rendimiento como en tiempo de cálculo.

Esta investigación ha sido llevada a cabo por los investigadores David Gerónimo, Angel D. Sappa, Daniel Ponsa y Antonio López, del grupo de sistemas avanzados de asistencia al conductor (ADAS) del Centre de Visió per Computador, y parcialmente financiado por los proyectos TRA2007-62526/AUT, Consolider Ingenio 2010: MIPRCV, (CSD200700018) y la beca BES-2005-8864 del Ministerio de Educación y Ciencia y el Fondo Social Europeo.

David Gerónimo, Antonio López

Referencias

"A Global Approach to Vision-Based Pedestrian Detection for Advanced Driver Assistance Systems". Tesis doctoral defendida por David Gerónimo el 12 de febrero de 2010 a las 12h, en la Sala d'Actes del Centre de Visió per Computador. Director: Antonio Manuel López Peña.

 
View low-bandwidth version