La inteligencia artificial aprende a leer labios mejor que los profesionales

Investigadores de inteligencia artificial de la Universidad de Oxford crearon un programa de lectura de labios usando el Deep Learning (aprendizaje profundo). LipNet –así se llama el sistema– demostró que podía superar la performance de lectores de labios profesionales en un grado significativo, alcanzando un 93.4% de exactitud en ciertas pruebas, una cifra alta si se compara con el 52.3% logrado por los expertos humanos.  Aun en su etapa temprana, el software fue rapidísimo para procesar videos silenciosos y convertirlos en transcripciones de texto casi en tiempo real.

La lectura de labios no es sencilla: en promedio, las personas pueden reconocer una en diez palabras al ver los labios de alguien, según un estudio. La precisión tiende a variar, por lo que no hay grandes eruditos en el campo. Para resolver este problema, los expertos se vuelcan a la técnica del Deep Learning —que se asemeja mucho a cómo trabajan las redes neurales humanas—. Antes, la inteligencia artificial basada en el procesamiento de vastas cantidades de información ya había mejorado el reconocimiento de voz en audio con niveles casi humanos de exactitud.

Pero el trabajo de Oxford aun no se asemeja al poderoso aparato lector de labios del clásico "2001: Una Odisea del Espacio". Entre sus limitaciones, significativas, está el hecho de que el sistema solamente fue entrenado y probado en una base de datos pequeña: una colección de decenas de miles de videos cortos de solo 34 voluntarios leyendo oraciones sin sentido, y con subtítulos. Cada clip es tres segundos largo, y cada oración sigue el patrón: orden, color, proposición, carta, dígito, adverbio. Las oraciones incluyen por ejemplo: “set blue by A four please” y “place red at C zero again”. Incluso, el universo de palabras dentro del patrón son limitadas —solo hay cuatro órdenes y colores usados.

Para algunos críticos del portal OpenReview.net, las conclusiones del trabajo son algo exageradas. En diálogo con The Verge, los investigadores Yannis Assael y Brendan Shillingford admitieron que estaban trabajando con vocabulario y gramática restringida por limitaciones de información disponible, pero su que su trabajo “se trata de un buen indicador de que el programa puede hacerlo tan bien con una base de datos más grande”.

Consultados por las implicancias de su trabajo en el campo del espionaje, subrayaron que el mismo no las tiene porque para interpretar lo que alguien dice el video debería estar hecho de frente al interlocutor y enfocando y alumbrando los movimientos de la lengua. “Es técnicamente imposible o al menos muy, muy difícil”. En cuanto a lo mismo, los autores del trabajo indicaron que si bien uno de sus supervisores trabaja con Deep Mind, la firma de IA de Google, el gigante de Internet no está involucrado con el desarrollo del sistema de LipNet.

La inteligencia artificial poco a poco está cumpliendo con tareas que hace poco se pensaban exclusivas para el hombre. Un bot, por ejemplo, logró algo tan impresionante como predecir fallos sobre derechos humanos. En el campo de los videojuegos, los bots pudieron pasar fácilmente juegos como Doom, venciendo incluso a jugadores humanos, y el siguiente paso es aprender a jugar el complejo juego de estrategia StarCraft II. Por otro lado, la inteligencia artificial fue también capaz de interpretar correctamente las rutas del Metro de Londres. 

 

Daniel Meza

Si te gustó esta noticia, entérate de más a través de nuestros canales de Facebook y Twitter.

Novedades

Suscríbete

Déjanos tu mail para recibir nuestro boletín de noticias

La confirmación ha sido enviada a tu correo.

Leer también

A inicios de mes, el 3 de noviembre, la República Popular China lanzó el primer cohete de carga pesada de su historia, el Larga Marcha-5, hito considerado el más grande de todos los avances espaciales del gigante asiático. Dicho lanzador empata la capacidad del imponente Delta-4 Heavy estadounidense, que puede enviar hasta 25 toneladas a la órbita baja de la Tierra. La misión pone al país presidido por Xi Jinping en una posición inmejorable en la carrera espacial y es una muestra más de cómo China es “con pleno derecho, la nueva gran potencia de la exploración espacial”, según el astrofísico Antonio Eff-Darwich. El académico y catedrático de la Universidad de la Laguna brindó una entrevista a N + 1 analizando alcances y potencialidades de aquel país en el referido campo.

China es, “con pleno derecho, la nueva gran potencia espacial” [ENTREVISTA]

El pasado 8 de septiembre la NASA lanzó desde Cabo Cañaveral la sonda OSIRIS-REx, con el objetivo de estudiar in situ al asteroide Bennu. Se trata de una misión crucial que traerá por primera vez muestras no contaminadas de un asteroide de tipo primitivo que podremos estudiar en detalle, con los mejores instrumentos de laboratorio que existen. Allí estuvo el Dr. Javier Licandro, Investigador Titular del Instituto de Astrofísica de Canarias (IAC) y colaborador en la referida misión de la agencia espacial estadounidense.

¿Estamos preparados ante el impacto de un mortal meteorito?