AVISARA: Atención Visual Activa para Residencias de Ancianos
En este proyecto se propone el desarrollo de un sistema de identificación de personas en interiores que permita realizar un seguimiento en tiempo real de la ubicación de las personas dentro de una residencia. Utilizando esta localización, se podrá realizar un sistema de alarmas que avise a los cuidadores en tiempo real sobre situaciones de peligro.
La idea de este sistema consiste en realizar el reconocimiento a distintos niveles: a corto y largo plazo.
En el largo plazo, la identificación de las personas se realiza mediante reconocimiento facial, ya que se trata de características más estables para reconocer a cada persona y que, por tanto, permanecen sin cambio durante un mayor periodo de tiempo.
Sin embargo, para realizar este tipo de reconocimiento se requiere de unas condiciones muy concretas en la imagen como, por ejemplo, que sea frontal, sin oclusiones y sin complementos que puedan modificar el aspecto de la cara. Para solucionar estos problemas, se propone de un sistema de reconocimiento a corto plazo, basado en la apariencia del cuerpo, para realizar el seguimiento de la persona.
El funcionamiento de este sistema consiste en que, en primer lugar, se realice el reconocimiento de la persona mediante reconocimiento facial, principalmente en estancias controladas como las salidas de las habitaciones o en la entrada del edificio. En ese momento, el sistema de reconocimiento a corto plazo deberá aprender las características visuales de su apariencia actual para permitir su seguimiento a lo largo del edificio, aunque a partir de ese momento no se pueda realizar más el reconocimiento utilizando el sistema a largo plazo. Durante el resto del tiempo, el sistema de reconocimiento a corto plazo se encargará del seguimiento de la persona en las distintas estancias. Este seguimiento deberá realizarse haciendo uso de técnicas de tracking para optimizar el funcionamiento del sistema.
En la Figura 1 se muestra un esquema del sistema propuesto.
El sistema de identificación requiere de un conjunto de cámaras convenientemente situadas y debidamente localizadas para realizar el seguimiento. La idea de este sistema es la de utilizar la infraestructura de videovigilancia que ya tienen integradas las residencias, por lo que se requerirá de un sistema centralizado para el procesamiento de las imágenes.
En el procesamiento de imágenes, la tarea principal a ejecutar es la detección de personas en la imagen, que devuelva los recuadros en los que se sitúa cada persona. Una vez detectada la persona, se ejecuta un algoritmo de detección de caras para ayudar en el reconocimiento. La segunda tarea consiste en la generación de descriptores para las caras y el cuerpo de las personas detectadas, lo que permitirá comparar con identidades previamente aprendidas. Finalmente, la última tarea consiste en utilizar los descriptores con un clasificador para obtener la identidad de la persona detectada.
En caso de ser una identidad desconocida, se contempla que el sistema sea capaz de aprender nuevas identidades en tiempo real, lo que lo diferencia de muchos otros sistemas que requieren que las identidades y las apariencias sean aprendidas con anterioridad. Para ello, hará uso de las características generadas por descriptores basado en Deep learning utilizando clasificadores clásicos que tengan una velocidad de aprendizaje que permita realizarlo en tiempo real.
Utilizando la información sobre la identificación de las personas en la residencia, se contempla que el sistema sea capaz de detectar ciertas situaciones de peligro basadas en su localización, como pueden ser el acceso a zonas restringidas por parte de personal no autorizado, o la fuga del edificio por parte de un residente. Así mismo, se contempla la incorporación de módulos que permita la detección de otras situaciones de riesgo sobre las personas, como pueden ser las caídas.
Finalmente, se contempla que el sistema pueda mostrar la información obtenida con el procesamiento de los datos de forma clara y que resulte útil para las personas responsables de la residencia, de forma que puedan conocer en todo momento la localización de cada residente y las situaciones de peligro que se puedan producir. Esto se realizará mediante una aplicación móvil y/o portal web sencillos.
Así pues, los objetivos concretos del proyecto son los siguientes:
O1 – Creación de un sistema basado en Deep learning que sea capaz de reconocer a las personas en tiempo real usando tanto características visuales a largo plazo (reconocimiento visual) como características visuales a corto plazo (reconocimiento de vestimenta y apariencia del cuerpo).
O2 – Desarrollo de un sistema de alarmas modular que permita la detección de situaciones de peligro para los residentes.
O3 – Mostrar adecuadamente las alarmas creadas por el sistema para que puedan reaccionar adecuamente los responsables de la residencia.
Este proyecto público competitivo, que durará hasta finales de 2024, está financiado bajo el programa SUBVENCIONES PARA LA REALIZACIÓN DE PROYECTOS DE I+D+i DESARROLLADOS POR GRUPOS DE INVESTIGACIÓN EMERGENTES (GE 2023) por la Generalitat Valenciana, Referencia: CIGE/2022/170.