IA aprende a crear retratos con solo leer un texto descriptivo [VIDEO]

Animesh Karnewar /Medium

Un programador de la India diseñó un programa que puede crear retratos de personas a partir de la descripción textual de su apariencia en un lenguaje sencillo. La descripción está disponible en el blog del autor en Medium, y el código fuente se publica en GitHub.

El trabajo con imágenes es una de las esferas en las que es más notorio el progreso en el campo de los algoritmos de aprendizaje automático. Varios grupos de desarrolladores han creado algoritmos para crear imágenes de personas. Por regla general, utilizan la arquitectura de la red neuronal generativa antagónica, descrita en 2014. Dichas redes neuronales constan de dos componentes: un generador y un discriminador que compiten mutuamente. El primero crea una imagen y la pasa a un discriminador que determina si es real o fue creada por un generador.

Tras obtener una evaluación, el generador aprende gradualmente a crear una imagen lo más similar posible al objeto según los datos de entrenamiento, y el discriminador mejora en el reconocimiento de las "falsas" imágenes.

El desarrollador Animesh Karnewar utilizó en el proyecto dos algoritmos basados ​​en redes neuronales generativas antagónicas creadas previamente por otros investigadores: el algoritmo StackGAN para crear imágenes de calidad fotográfica mediante una descripción de texto simple, así como la red neuronal ProGAN para crear imágenes de alta calidad de personas. De StackGAN el programador utilizó la parte que permite codificar la descripción en vector, que luego se transmite a la red neuronal que lo sintetiza en imagen. Como sintetizador, el desarrollador usó la red neuronal ProGAN. Una de sus particularidades consiste en que durante el entrenamiento el número de capas y la resolución de la imagen aumenta poco a poco, lo que permite entrenar a la red neuronal en la creación de imágenes de alta calidad.

Para el entrenamiento, el autor utilizó el conjunto de datos Face2Text,, que consta de 400 fotografías y descripciones de texto asociadas a personas. El desarrollador señala que las imágenes que se obtuvieron después del entrenamiento no pueden considerarse realistas, pero las características de las personas representadas concuerdan con la descripción. El proceso de entrenamiento de la red neuronal se puede ver en el video:

Si un tipo de inteligencia artificial ya podía predecir resultados de tribunales de justicia, o vencer a campeones de póker, era cuestión de tiempo que naciera una dedicada a crear memes. Prueba de ello es una investigación de Stanford, que trabajó en el mejor método para enseñar a una red neural a hacerlo. El método, jugando con las denominaciones machine learning o deep learning, ha sido nombrado dank learning (aprendizaje irónico).
 

María Cervantes
Esta noticia ha sido publicada originalmente en N+1, ciencia que suma.

Sobre N+1: Es la primera revista online de divulgación científica y tecnológica que permite la reproducción total o parcial de sus contenidos por medios de comunicación, bloggers e influencers, realizando la mención del texto y el enlace a la web: “Esta noticia ha sido publicada originalmente en la revista N+1, ciencia que suma: www.nmas1.org”.​​​​​​

Novedades

Suscríbete

Déjanos tu mail para recibir nuestro boletín de noticias

La confirmación ha sido enviada a tu correo.