La analítica de vídeo mejora el panorama de la seguridad
La analítica de vídeo puede determinar si alguien se mueve a demasiada velocidad entre un grupo de personas e identificar un paquete abandonado o a una persona merodeando. Y pronto podrá decirnos si alguien está a punto de hacer algo que no debe.
El problema de los vídeos de seguridad es que son larguísimos y, en su mayor parte, muy aburridos. Nadie en su sano juicio querría pasarse horas mirando una pantalla en la que no pasa nada. Por tanto, ¿cómo utilizar el vídeo de modo que realmente ayude a mejorar la seguridad?
La respuesta es la analítica de vídeo, pero muchos profesionales del sector se apresurarán a decirte que eso es esperar demasiado, y demasiado pronto. Courtney Dillon Pedersen, directora de comunicaciones de Milestone Systems, responsables del proyecto XProtect Analytics, que se propone integrar distintas cámaras y herramientas analíticas en una IP, cree que “la analítica de vídeo ha sido celebrada como una panacea demasiado pronto”. Y según Johan Paulsson, director del departamento de tecnología de Axis Communications: “No se puede utilizar la analítica de vídeo para actividades o misiones críticas.” Sería demasiado arriesgado confiar enteramente en un sistema en el que no intervienen seres humanos para evitar que entren intrusos en una zona de alta seguridad, por ejemplo.
Entonces, ¿para qué se puede utilizar? “Ayuda a los operadores”, dice Paulsson. “Añade valor al vídeo”, dice Pedersen.
Seamos un poco más precisos: Rasmus Crüger Lund, arquitecto de sistemas de Milestone, opina que “la analítica de vídeo puede ayudar a los operadores en sus tareas de vigilancia, ayudándoles a centrar su atención en los momentos correctos. Sirve para eliminar todo el material al que los vigilantes no tienen por qué prestar atención, permitiéndoles reaccionar rápido cuando ocurre algo.”
La “panacea” a la que se refería Pedersen era la falsa idea de que la analítica de vídeo podía determinar qué incidentes eran una verdadera amenaza para la seguridad. Todavía no puede hacer eso, pero se está acercando. La analítica puede decir si alguien se mueve en la dirección equivocada o con demasiada velocidad entre un grupo de gente, identificar un paquete abandonado o a una persona que parezca estar merodeando, detectar si alguien está pasando por una barrera pegándose a la persona que le precede, o identificar matrículas. Y por supuesto, puede determinar fácilmente si alguien ha entrado en un área en la que no debería haber entrado.
Pero no puede decirnos si estos accidentes son o no significativos. Únicamente puede alertar a un operador, que será quien tome esa decisión. Estas “falsas alarmas” no son tan falsas: un operador mirando a la pantalla seguramente tendría que haber examinado con más atención este tipo de incidentes, sólo para decidir que no era necesaria acción alguna. Pero sí son irritantes, y cuando se acumulan muchas pueden destruir nuestra confianza en el sistema.
Paulsson cree que una de las claves es la preparación de los empleados. “La analítica de vídeo es sin duda mucho mejor que un ser humano mirando una pantalla a las tres de la mañana, que es algo que no nos da ninguna garantía”, afirma. “Con la analítica, se espera a que salte la alarma. Puede ser una falsa alarma, pero eso ya depende que cómo se gestionen las expectativas de los empleados al respecto.”
James Orwell, director del Visual Surveillance Research Group de la Kingston University de Londres, cree que una de las razones por las que hay tantas falsas alarmas es la infraestructura tan primitiva que tienen muchas instalaciones de vídeo. “La resolución es a menudo muy pobre, con una señal analógica convertida a digital y comprimida de cualquier manera”, explica. “En comparación con los gráficos generados por ordenador de las películas que vemos en los cines, estamos aún en la Edad de Piedra.”
Pero las cosas están mejorando. Paulsson cree que el vídeo de alta resolución está facilitando el diseño de buenas aplicaciones.
Lund opina que otro de los problemas radica en la complejidad de las instalaciones, pero cree que se avecina un cambio: “En el futuro, los sistemas se instalarán ellos solos, o como mínimo le dirán al operador qué parámetros no pueden ajustar por sí mismos”, pronostica. “Los mejores sistemas supervisarán el lugar de la acción y aprenderán qué actividades son normales y cuáles no.”
A medida que la analítica va mejorando, se irá haciendo más precisa en la identificación de situaciones que afectan a la seguridad. Lund observa con interés las investigaciones que están teniendo lugar en universidades de cara a la detección de conductas erráticas. “Se están estudiando aquellos pequeños movimientos faciales y formas de caminar que indican que alguien está a punto de hacer algo que no debe”, afirma.
Hasta el momento, esta detección tan detallada requiere unas condiciones muy controladas. La identificación biométrica aún exige que la gente esté erguida en el momento de mirar a la cámara. “Los algoritmos siguen siendo demasiado simples”, dice Lund, “pero los equipos que trabajan en identificación por 3D utilizan ya varias cámaras.”
En la Kingston University, un equipo se esfuerza en estos momentos por identificar a los posibles portadores de armas. Jean-Christoph Nebel declaró a la página web videoanalytics.info que las personas normalmente no suelen llevar armas, así que cuando alguien lo hace “es muy habitual que su estado emocional se vea alterado.”
Se pedirá a los operadores de seguridad más veteranos que observen imágenes filmadas de delincuentes justo antes de llevar a cabo un atraco a mano armada e imágenes de personas normales, para que digan si les da la impresión de que hay algo sospechoso, aún cuando no sepan de qué se trata. Los detalles que les llamen la atención serán almacenados en un sistema de aprendizaje de máquina.
Orwell cree que el aprendizaje de máquina tiene un gran potencial. “Si los operadores pueden etiquetar de forma repetida lo que ellos consideran sospechoso, esos datos se pueden utilizar para generar algoritmos” , explica. “Y puesto que no es necesario identificar por qué algo parece sospechoso, se pueden incluir elementos del subconsciente.”
Este tipo de análisis está siendo posible gracias a una mayor capacidad de procesamiento. Las cámaras tiene ya de por sí tal capacidad de procesamiento que buena parte del análisis se puede hacer “al filo”, es decir, dentro de la misma cámara y sobre un material sin comprimir. Y con las compresiones de hoy en día, incluso los materiales comprimidos siguen siendo muy utilizables. “En general se acepta que la analítica tendrá que llevarse a cabo a partir de materiales comprimidos”, dice Orwell.
Pero sobre todo en el análisis post-eventos, el nuevo reto son los metadatos: los datos que porta la señal de vídeo y que nos dicen lo que contiene, permitiéndonos encontrarlo de manera eficaz. “Esto va ser algo tremendo”, afirma Lund. “Podremos encontrar vídeo sin necesidad de reanalizarlo, puesto que los metadatos estarán en una base de datos. Se podrá localizar todo el vídeo en el que aparezca una marca concreta de coches, o una persona cruzando una línea determinada.”
Dos organizaciones del sector, la PSIA y el ONVIF, ya están trabajando en el establecimiento de estándares de metadatos (ver artículos relacionados). “Estas dos organizaciones no se han puesto de acuerdo, pero es mejor tener dos estándares que doscientos.” O que no tener ningún estándar, podríamos añadir.