blank

Google dio un nuevo golpe en la mesa: DeepLab-v3+ ahora es open-source

Con el lanzamiento del Pixel 2 en 2017, Google mostró que no era necesario disponer de doble cámara en el móvil para tomar fotos de calidad en modo retrato, como sostenía hasta el momento Apple. La herramienta utilizada en el Pixel 2 para demostrar esto fue la incorporación de la inteligencia artificial al software. Hoy Google vuelve a sorprender con una excelente noticia: la herramienta DeepLab-v3+, responsable del aspecto casi profesional de sus fotografías en modo retrato, ahora es open-source. Esto quiere decir que cualquier persona o empresa puede usarla para nuevos desarrollos e, incluso, para perfeccionarla.

¿Cómo funciona DeepLab-v3+?

Para comprender cómo trabaja esta herramienta, primero debemos recordar cómo es el funcionamiento de los dos sensores en el modo retrato al que estábamos acostumbrados. La doble cámara realiza el reconocimiento visual por separado: un sensor recoge la información del fondo de la imagen y el otro, el principal, se ocupa de lo demás; luego, ambas informaciones se combinan. El resultado es el modo retrato con el efecto bokeh en el fondo. Al hablar del trabajo de este sistema “tradicional”, sin embargo, no debemos pasar por alto que la  calidad de las fotografías en este modo siempre resulta menor que la de aquellas donde no se aplica: el desenfoque del fondo suele tener imperfecciones bastante evidentes. Por el contrario, la inteligencia artificial de Google realiza un análisis de las escenas a nivel semántico. ¿Cómo es esto? El código DeepLab-v3+ trabaja con una plataforma creada con redes neuronales, un método de machine learning que realiza el análisis de imágenes con muy buenos resultados. Es así como la cámara reconoce los elementos presentes en la imagen y los organiza en categorías; de este modo puede identificar animales, personas, objetos y hasta pequeños detalles, como cabellos. Y, por si esto fuera poco, lo hace en escasos segundos. Este es el funcionamiento que hace que los retratos tomados con el Pixel 2 muestren tan buenos resultados.

La inteligencia artificial, el avance inevitable

Según los ingenieros de software de Google, Liang-Chieh Chen y Yukun Zhu (los encargados de anunciar la noticia en el blog de Google), las herramientas basadas en deep learning han mejorado mucho en los últimos años y eso es lo que hace posible el alto grado de precisión de la segmentación de imágenes. Actualmente, también existen móviles que combinan estas herramientas, por ejemplo, el Mate 10, de Huawei, que tiene dual cámara y, además, a través del chipset Kirin 970 incorpora la NPU (neural processing unit), un área del procesador que se ocupa de los cálculos de inteligencia artificial. Al momento de tomar una foto con este dispositivo, el software reconoce los elementos presentes en la imagen y determina cuál es el modo de la cámara más conveniente, ajustando los parámetros para optimizar la imagen final. El modo retrato en el Mate 10 también tiene excelentes resultados con el efecto bokeh y  el cuidado de los detalles. Si Huawei pensara en dejar de lado la doble cámara en sus próximos dispositivos, probablemente la liberación del código DeepLab-v3+ pueda resultarle sumamente útil a sus desarrolladores. Sin dudas, esta es una gran noticia para todos, no solo para desarrolladores y empresas, sino también para los usuarios que disfrutan de tomar imágenes de excelente calidad con el móvil, emulando las de las cámaras profesionales.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Ir arriba