Esta red neuronal sabe detectar cuando la gente está besándose en una película de Hollywood

Intriga internacional (1959)
Wikicommons

Un desarrollador de la Universidad de Stanford presentó un algoritmo capaz de detectar a las personas que se besan en un video. Según el artículo publicado en arXiv, el algoritmo fue entrenado en más de 260 escenas con besos de películas de Hollywood. 

El reconocimiento de varios objetos es una de las tareas más importantes para los desarrolladores de las redes neuronales. Aunque esa tarea ya esté totalmente resuelta, los investigadores no se limitan solo a la detección de objetos en las imágenes estáticas. Trabajar con imágenes dinámicas, como el video, puede ser aun más difícil. En este caso la visión artificial debe no solo detectar un objeto, sino también reconocer sus acciones.

Amir Ziai, el desarrollador de la Universidad de Stanford, cree que es muy importante saber detectar los sujetos particulares en el video. Según el investigador, esa posibilidad permitiría editar los videos con mayor eficacia, así como personalizar el contenido para los usuarios en la red. Por eso decidió crear un algoritmo experimental que pueda detectar un beso en el video.


Nuestro último verano (2019), Netflix
amirziai / github.com

Besos hollywoodenses 

El dicho algoritmo fue entrenado en más de cien películas de Hollywood, incluso a Anna Karenina (1935), La Sombra del Amor (1990) y Casino Royale (2006). Ziai utilizó 263 escenas con besos y 363 escenas sin besos con la duración de 10 segundos a dos minutos.

El algoritmo consta de dos partes, una de las cuales analiza las pistas de video y audio en unos fragmentos que duran un segundo. Luego las clasifica y transmite a la red neuronal convolucional VGG que, a su vez, se utiliza para analizar las características acústicas. La segunda parte del algoritmo evalúa los datos sobre la presencia posible de un beso en cada fragmento de video y les muestra de tal manera que los extractos no se repitan. Al recibir el video, el algoritmo lo analiza y presenta los fragmentos separados de diferentes escenas que involucran besos. Ziai asegura que la precisión de reconocimiento de su sistema es de un 95%


Noé (2014)
amirziai / github.com

Según el sitio IEEE Spectrum, Ziai está trabajando actualmente para Netflix, pero el servicio de streaming no está relacionado con su algoritmo. Al mismo tiempo, dicha tecnología podría ser implicada justo para tantos servicios. Por ejemplo, el algoritmo podría ayudar a narrar el video las para personas con discapacidades visuales.

Anteriormente, un programador mostró en la red un programa que emplea la inteligencia artificial para borrar los coches de una foto o video de la calle y los sustituye por paisaje, como si fuera Photoshop. 
 

Yana Berman
Esta noticia ha sido publicada originalmente en N+1, ciencia que suma.

Sobre N+1: Es la primera revista online de divulgación científica y tecnológica que permite la reproducción total o parcial de sus contenidos por medios de comunicación, bloggers e influencers, realizando la mención del texto y el enlace a la web: “Esta noticia ha sido publicada originalmente en la revista N+1, ciencia que sumawww.nmas1.org”.

Suscríbete

Déjanos tu mail para recibir nuestro boletín de noticias

La confirmación ha sido enviada a tu correo.