Y es que… Tenemos robots, chatbots, herramientas de mejora de casi cualquier cosa. Hasta algoritmos que saben jugar casi cualquier juego de playstation o xbox pero… ¿Tenemos algo que ayude a los editores de fotografía y video a mejorar fotografías y videos con inteligencia artificial?
Sí.
En este post hablare de cuales son las posibilidades en la remasterización multimedia y como podemos hacer uso de ello.
Hablemos primero de las imágenes
La Resolución
Un problema común con soluciones poco efectivas que aunque tengamos imágenes con buena calidad, al trasladarlas a pantallas más grandes sufren del “pixeleo”.
Técnicas como el reescalado bilineal y el reescalado por proximidad han sido las predominantes en software de edición como los de la suite de Adobe, que no hacen más que rellenar los espacios vacíos que se generan al agrandar una imagen, con colores similares para evitar ver los cuadros del pixel.
Completitud
Otro problema común son las fotos incompletas. Seguro que tienes algunas fotos de tu niñez o de tu familia más antigua impresas y parcialmente incompletas.
Para repararlas lo más común es un trabajo artesanal y parchar la foto a mano con el “tapón” de photoshop para completar lo que falta o en el peor de los casos, desistir y borrar la parte faltante.
Color
Y para terminar con los problemas comunes, el color. Las cámaras fotográficas a color se inventaron aproximadamente en el año 1860 pero su comercialización fue muy lenta, pasando casi 100 años sin que fueran populares como lo es hoy en día.
Convertir una imagen en B/N a una llena de matices puede ayudar a recuperar la historia y a mejorar las imágenes que se han decolorado con el pasar de los años.
Mejora de video con IA
Y ahora toca hablar del video, que recordemos que son múltiples imágenes ordenadas para ser mostradas en secuencia. Por tanto, todos los problemas que mencionamos para las fotos pueden ser reutilizados en el tratamiento de un video.
Pero falta, uno, la fluidez del video.
Incremento de Fotogramas
Y es que la fluidez está determinada por el número de imágenes que se muestran por segundo en un video, entre más imágenes, más natural es el movimiento percibido.
Para la generación de video “normal”, una taza de 24 frames por segundo es lo normal. Cuando se graba un video de cámara lenta, rondan arriba de los 120 frames por segundo.
Las cámaras antiguas grababan a una resolución por debajo de los 20 y más que video, parece que vemos un gif, con saltos entre cada movimiento de los personajes u objetos.
Esto también es útil en la filmación de clips de stop motion.
Solución con IA
Y llegamos a la parte interesante, donde cambiamos el paradigma viendo el problema desde otros enfoques que nos permite la inteligencia artificial.
Si lo piensas, ¿Qué pasaría si en lugar de completar la parte faltante, aumentar la resolución o “colorear” las cosas, sustituyéramos cada elemento por uno nuevo que se pareciera mucho al original al punto de no darnos cuenta? Pues, algo así es lo que hacen los modelos de IA con redes neuronales para esta tarea.
Tecogan
Es un modelo de IA que permite ser entrenado con imágenes previas y poder entender lo que existe en la imagen analizada, separando todos sus elementos. Una vez que entiende lo que existe en la imagen, determina cómo es que debería verse cada elemento y puede completarlo, incluyendo el color, una alta resolución y claro, sin pedazos faltantes.
Es un cambio de perspectiva que ha permitido remasterizar fotografías, fotógrafas de video e incluso gráficas de videojuegos.
Redes neuronales
Para el tema de la generación de frames, se ocupa una arquitectura de red neuronal que hace uso de las direcciones a las que se mueven los objetos en la imagen y la profundidad. Con esto, la generación de fotógrafas se vuelve más sencilla con mejores resultados que las técnicas tradicionales.
¿Cómo hacerlo?
Ya que sabes como funcionan estas tecnologías, te dejamos algunos links que te pueden ayudar de forma sencilla con este cometido.
NOTA: Puedes obtener muchos mejores resultados teniendo el software en tu computadora, donde puedas manipular todos los aspectos deseados.
Aumentar Resolución
Completar fotos
Dar color a fotografías B/N
Aumentar fotogramas en video
Video Frame Interpolation Project
¿Y tú? ¿Ya estás utilizando estas tecnologías?
Déjame saber tus comentarios.
🏆Consultor en Transformación Digital e Inteligencia Artificial desarrollando proyectos en organizaciones del Gobierno Mexicano como SAT, IMSS, CFE y en el sector privado para empresas internacionales como DHL, Santillana, citiBanamex, HSBC, Softtek y Grupo Salinas.
👨🚀 Podcast: Big Data para Negocios
⭕️CoOrganizer @tedxpolanco