Google: los teléfonos Pixel 3 usan el temblor natural de las manos para mejorar la calidad de sus imágenes

Google 

Desarrolladores de Google explicaron cómo funciona el algoritmo en el teléfono inteligente Pixel 3, lo que le permite mejorar la calidad de las imágenes. La cámara utiliza el movimiento natural de la mano del usuario y, en vez de hacer una sola toma, realiza una serie de tomas desde ángulos ligeramente diferentes. Luego, el algoritmo reconoce partes de la imagen con objetos estáticos y combina varias instantáneas para aumentar el detalle y el brillo. Un artículo dedicado al algoritmo se presentará en la conferencia SIGGRAPH 2019.

Por lo general, los teléfonos inteligentes toman fotografías utilizando un conjunto de parámetros de instantáneas predefinidos, como el tiempo de exposición y la fotosensibilidad. Además, a menudo después de disparar, los algoritmos producen un procesamiento básico, por ejemplo, aumentando la nitidez.

Sin embargo, en los últimos años, los desarrolladores han comenzado a aplicar un esquema más complejo, que incluye la creación de un solo marco a partir de varios más. Inicialmente, se usó para crear imágenes HDR con un rango dinámico extendido. Durante la creación de este tipo de imágenes, la cámara crea rápidamente varios fotogramas con diferentes valores de exposición y luego los combina para que las áreas brillantes de la imagen no estén sobreexpuestas y las oscuras no estén subexpuestas.

La tecnología detrás del Pixel 3

Más tarde, los desarrolladores de smartphones fueron más lejos y comenzaron a aplicar un principio similar para tareas más complejas. Por ejemplo, el teléfono inteligente Pixel 3 tiene la función de zoom digital y grabación nocturna con mejora de imagen gracias a la combinación de varios fotogramas.

Ahora, los desarrolladores de Google han publicado un artículo que detalla el trabajo de ambos algoritmos. El método se basa en lo que generalmente se percibe como una desventaja: sacudir la mano durante el disparo. Los desarrolladores decidieron usar esto para tomar una serie de tomas desde ángulos ligeramente diferentes.

Dado que los píxeles de las cámaras contienen filtros de color, el color de cada píxel de la imagen final se forma algorítmicamente en función de los colores de los píxeles vecinos. Esto conduce a imprecisiones, porque los valores de color en cada píxel se predicen y no se miden directamente. Para no resumir el error en los cálculos de color para cada cuadro, el algoritmo desarrollado por Google no produce demosaicos para las imágenes originales y funciona con archivos RAW.

El algoritmo luego impone todos los marcos en una sola cuadrícula y comienza a procesarse. Primero, divide la imagen en regiones virtuales y trabaja por separado con ellas, analizando sus diferencias estadísticas de la región en el marco de origen, calculando los desplazamientos vectoriales de objetos en cuadros debido al movimiento de la cámara, y también seleccionando funciones nucleares para describir matrices de píxeles en la imagen. Como resultado, el algoritmo crea un mapa que refleja la consistencia de las áreas en los marcos entre sí.

Mejores fotos

Durante el procesamiento final, el algoritmo se superpone a las áreas y mejora la calidad solo si esta área en el mapa tiene un alto valor de consistencia. Esto permite mejorar la calidad de áreas con objetos estáticos y no crear artefactos de imagen para áreas con objetos en movimiento. Como resultado, al utilizar disparos con ángulos ligeramente diferentes, el algoritmo puede reemplazar efectivamente el zoom óptico o aumentar la exposición de las tomas nocturnas sin aumentar el ruido y el desenfoque.

Anteriormente, Google comenzó a utilizar el algoritmo RAISR en sus servicios, lo que aumenta la resolución de las imágenes. Analiza los contornos de los objetos en la imagen y, por lo tanto, aumenta la resolución sin dar a la imagen una "pixelación".


Victor Román
Esta noticia ha sido publicada originalmente en N+1, ciencia que suma.

Sobre N+1: Es la primera revista online de divulgación científica y tecnológica que permite la reproducción total o parcial de sus contenidos por medios de comunicación, bloggers e influencers, realizando la mención del texto y el enlace a la web: “Esta noticia ha sido publicada originalmente en la revista N+1, ciencia que sumawww.nmas1.org”. 

 

Suscríbete

Déjanos tu mail para recibir nuestro boletín de noticias

La confirmación ha sido enviada a tu correo.