Con ondas de radio y visión artificial, esta red neuronal sabrá con exactitud qué es lo que haces detrás de una pared

 

Comprender las acciones e interacciones de las personas normalmente depende de que puedan verse: aunque…¿qué pasa si es demasiado oscuro, o si la persona se encuentra detrás de una pared? Un equipo de ingenieros estadounidenses creó una impresionante red neuronal que puede “ver” las acciones de las personas a través de la pared escaneando las ondas de radio, y también através de lugares cerrados y oscuridad.

Los autores lo consiguieron convirtiendo los datos de personas a modo esquelético, y luego aplicando un algoritmo único para reconocer acciones. El avance se presentará en la Conferencia Internacional sobre Visión por Computadora, y un video del estudio fue compartido por el portal del Instituto Tecnológico de Massachusetts (MIT).

En la visión por computadora, las tecnologías para reconocer la postura del cuerpo a través de las grabaciones de video se usan con bastante frecuencia. A menudo, estos algoritmos se utilizan para determinar los parámetros de comportamiento de una persona o de muchas personas a la vez. Para esto, el algoritmo crea un modelo esquelético del cuerpo que se puede relacionar con las posturas características de ciertas actividades. Un claro ejemplo es el avión creado por ingenieros indios que tiene la capacidad de reconocer la violencia en la multitud; o el algoritmo ruso que permite reconocer las caídas o comportamientos inusuales de personas mayores en casa.

Generalmente los algoritmos para crear un modelo de cuerpo dependen en gran medida de la calidad de la imagen y la iluminación, y tampoco funcionan cuando el cuerpo del marco está cerrado por otros objetos (por ejemplo, vidrios). Existen además tecnologías que usan solamente ondas de radio, aunque su precisión no es tan alta.

 

Un método más preciso

Los ingenieros del MIT, bajo la dirección de Dina Katabi, crearon un algoritmo que combina ambos tipos de datos.

El modelo funciona en tres etapas: toma señales de radiofrecuencia (RF) como entrada, genera esqueletos humanos en 3D y reconoce las acciones e interacciones de varias personas a lo largo del tiempo.

En resumen, el modelo alcanza una precisión comparable a la de los sistemas de reconocimiento basados en la visión en escenarios visibles, en tanto que su plus es que sigue trabajando con la misma precisión cuando la gente no se puede ver (por ejemplo, puede detectar un apretón de manos a través de una pared en medio u oscuridad).

La tecnología detrás

Para obtener datos visuales, los desarrolladores utilizaron un sistema de varias cámaras, el algoritmo abierto AlphaPose y un algoritmo que convierte los modelos esqueléticos bidimensionales en tridimensionales. Para el escaneo de ondas de radio a través de paredes y otros obstáculos, los ingenieros crearon un transceptor que funciona a frecuencias de 5,4 a 7,2 gigahertz. 

El transceptor está equipado con dos conjuntos de antenas orientadas vertical y horizontalmente. Ellas emiten ondas de radio y luego reciben reflejos de los objetos. Las imágenes bidimensionales se forman a partir de estas señales, y luego la red neuronal que crea modelos esqueléticos recibe estas imágenes.

Esquema de funcionamiento del algoritmo. Tianhong Li et al. / MIT CSAIL

Los desarrolladores entrenaron a las redes neuronales incluidas en el algoritmo en varios conjuntos de datos, incluido datos sobre sí mismos para crear un modelo utilizando señales de radio.

También usasron el conjunto de datos de reconocimiento de acción PKU-MMD, disponible públicamente. Al probar el algoritmo, se demostró que su precisión para determinar la acción cuando la persona es visible es del 87.8%, y a través de la pared, la precisión disminuye al 83%.

Recientemente, otros ingenieros estadounidenses crearon un método para identificar a una persona a través de una pared usando video y Wi-Fi. 

 

Daniel Meza​​​​​​​

Esta noticia ha sido publicada originalmente en N+1, tecnología que suma.

Sobre N+1: Es la primera revista online de divulgación científica y tecnológica que permite la reproducción total o parcial de sus contenidos por medios de comunicación, bloggers e influencers, realizando la mención del texto y el enlace a la web: “Esta noticia ha sido publicada originalmente en la revista N+1, tecnología que sumawww.nmas1.org”.​​

Novedades

Suscríbete

Déjanos tu mail para recibir nuestro boletín de noticias

La confirmación ha sido enviada a tu correo.