Mírese una pared desnuda en una habitación cualquiera: no es probable que se aprenda de ello algo más que el color de la pintura. Pero una nueva tecnología puede hacer discretamente un barrido de esa misma pared en busca de sombras y reflejos imperceptibles para el ojo humano, y analizarlos para determinar detalles, por ejemplo el número de personas que hay en la habitación, y además lo que están haciendo. De esa forma se puede espiar algo que ocurre al otro lado de la esquina, sacar más cosas en limpio cuando se dispone solo de una visión parcial de un espacio u observar a alguien que no cae en el campo de visión de una cámara.

Cuando las personas se mueven por una habitación van bloqueando partes de cualquier luz que pueda haber, con lo que crean en las paredes unas sutiles, indistintas «sombras blandas». La ropa de vivos colores puede arrojar un resplandor apagado, reflejo. Pero esas débiles señales quedan de ordinario ahogadas por la luz ambiente que mana de una fuente principal. «Si pudiésemos hacer algo parecido a sustraer ese término ambiental de lo que quiera que estemos observando, no habría otra cosa que ruido de la cámara… y señales», dice Prafull Sharma, estudiante de doctorado del Instituto de Tecnología de Massachusetts (MIT). Él y otros investigadores del MIT aislaron ese término ambiental de esta manera: filmaron una pared en una habitación mientras sus ocupantes se movían por ella y tomaron promedios de los fotogramas a lo largo del tiempo; de esta forma eliminaron las sombras cambiantes arrojadas por los seres humanos y dejaron solo la luz de la fuente principal, más las sombras de los muebles o de otros objetos estacionarios. Los investigadores retiraron entonces ese término del vídeo en tiempo real y desvelaron así sombras en la pared.

Luego, grabaron las paredes desnudas de varias otras habitaciones donde los investigadores representaron diversas escenas y actividades. Grupos de una o dos personas se movían fuera del campo de visión de la cámara, otros se agachaban, saltaban o meneaban los brazos. El equipo introdujo el vídeo en un modelo de aprendizaje maquinal para enseñarle los comportamientos correspondientes a los distintos patrones de sombras blandas. El sistema resultante puede analizar automáticamente en tiempo real la película tomada de una pared desnuda de cualquier habitación y determinar el número de personas en ella y sus actos. El trabajo fue aceptado como presentación oral en el Congreso Internacional de Visión Computarizada, que se acaba de celebrar.

Aunque este sistema puede funcionar sin calibrado en cualquier habitación, no lo hace bien cuando el alumbrado es escaso o hay luces que parpadean, las de un televisor, por ejemplo. Solo puede registrar tamaños de grupos y actividades para las que haya sido entrenado, y necesita una cámara de alta resolución; una cámara digital corriente crea demasiado ruido de fondo y los resultados con la de un teléfono no son muy buenos.

Pese a sus limitaciones, este método pone de manifiesto cuánto pueden la creación de imágenes y el aprendizaje automático transformar indicios imperceptibles en vigilancia efectiva. «Es un hallazgo científico muy bonito el que con una señal de intensidad tan baja se pueda predecir información», Dice Sharma. «Y, claro está, como hemos establecido, el ojo humano no puede hacer nada de esto».

Una pared desnuda dista de ser el primer objeto de apariencia inocente que desvela secretos de lo que lo rodea. «En general, a esto se le llama ataque de canal lateral o vigilancia de canal lateral», dice Bennett Cyphers, tecnólogo de la Fundación Frontera Electrónica, organización sin ánimo de lucro que promueve los derechos digitales. «Consiste en recurrir a fuentes de información que no son directamente lo que se busca, fuentes que no están entre las formas normales de recabar información, para saber cosas que no parece que se puedan llegar a saber».

Los ataques de canal lateral pueden sacar partido de señales de entrada modestísimas. El año pasado, unos investigadores se valieron de los reflejos de varios objetos brillantes, entre ellos una bolsa de patatas fritas, para reconstruir una imagen de la habitación circundante. Los sonidos y otras vibraciones pueden aportar también mucha información indirecta. Por ejemplo, el audio de una persona que teclea en un ordenador puede descubrir las palabras que está escribiendo. Y un ordenador mismo puede hacer de micrófono: en 2019 se crearon unos programas que detectaban y analizaban cómo el sonido ambiente hacía vibrar la cabeza lectora de un disco duro, y de esa forma se llegaron a grabar las conversaciones que se producían cerca de la máquina. Se han desarrollado también sensores de suelo que detectan las vibraciones de los pasos, que disciernen las identidades de individuos y que hasta diagnostican ciertas enfermedades. Muchas de estas técnicas se basan en el aprendizaje automático para detectar patrones que escapan a la inteligencia humana. Como cada vez están más extendidas las grabaciones audiovisuales de alta resolución y una mayor potencia de computación, cabe entrenar sistemas con muchas señales de entrada para extraer información de indicios a menudo pasados por alto.

Al menos por ahora, no parece que lo que todo esto podría suponer para la vigilancia mantenga despiertos por la noche a muchos defensores de la intimidad. «Este ataque por medio de las paredes desnudas y otros ataques de canal lateral muy depurados no deberían preocupar a la gente común», dice Riana Pfefferforn, investigadora universitaria del Observatorio de Internet de Stanford. «Son trucos muy vistosos de investigadores universitarios que están muy lejos de resultarles operativos a las fuerzas policiales». El uso rutinario «es cosa muy del futuro, si es que se produce alguna vez, e incluso aunque llegara a ocurrir, la policía seguiría sin poder allanar moradas e instalar cámaras en las ventanas». Cyphers piensa lo mismo. «Todo el mundo lleva encima un teléfono inteligente, muchísima gente tiene altavoces inteligentes en casa, sus coches están conectados a Internet», señala. «Las empresas y los Gobiernos no tienen de ordinario que echar mano de algo como filmar una pared desnuda para reunir el tipo de información que desean».

Aunque por ahora no es probable que los métodos de canal lateral tengan como blanco una persona común, al final podrían tener alguna aplicación en el mundo real. «Los militares y los servicios de inteligencia siempre han encontrado usos concretos para cualquier tipo de método de vigilancia que caiga en sus manos», dice Cyphers. Sharma coincide en que usos así son posibles, pero apunta también que podría haber otros más inocuos: por ejemplo, los vehículos podrían examinar las paredes desnudas como parte de un sistema autónomo de detección de peatones en zonas con poco ángulo de visión, en aparcamientos, por ejemplo. Y hay investigadores que exploran las técnicas de canal lateral que piensan que valdrían para monitorizar a los ancianos y detectar caídas u otros problemas.

Sharma dice que su sistema podría detectar caídas, siempre que se cuente con ejemplos para entrenarlo. Pero, bromea, «me niego a caerme en veinte habitaciones diferentes para reunir los datos».

Sophie Bushwick

Referencia: «Lo que puede aprender mirando fijamente una pared en blanco», De Prafull Sharma et al., ICCV 2021 (Oral).



Ver Publicación Original

Comparte el Conocimiento

No responses yet

Leave a Reply

%d bloggers like this: