En el marco de la GTC 2019, Nvidia reconocido ampliamente por sus tarjetas de gráficas para juegos y diseñadores, presentó un software llamado GauGAN que transforma bocetos en paisajes realistas.
GauGAN debe su nombre a que utiliza una especie de Inteligencia artificial llamada Redes Generativas Antagónicas (RGAs), o por su acrónimo inglés GANs. Este tipo de I.A. trabaja con redes neuronales (sistemas matemáticos que buscan reproducir, de manera simplificada el funcionamiento del cerebro), son capaces de aprender sin estar supervisados, al hacerlas competir entre ellas.
En la concepción del nombre de este tipo de I.A. está la definición ésta: dos redes neuronales (modelo matemático del cerebro) entrenadas con los mismos datos se enfrentan como si fueran el gato y el ratón. La primera red se le conoce como generativa, cuya función es crear variantes posibles de imágenes que tenga en su base de datos. La segunda se llama discriminador, donde su deber es analizar la imagen creada por la red generativa y discernir si esta forma parte del grupo inicial de imágenes con las que fueron entrenadas.
Veamos el siguiente ejemplo: Sea el grupo de imágenes de entrenamiento niños jugando a diferentes deportes con pelotas a nivel de suelo; en el caso de que la red generativa cree una imagen con niños jugando en el cielo, la red discriminadora debería eliminar dicha imagen porque los niños no están a nivel de suelo.
GauGAN se ejecuta en una plataforma de código abierto de Maching Learning desarrollada por Google llamada TensorFlow, que es capaz de entrenar redes neuronales con grandes volúmenes de datos, de las que son capaces de aprender patrones y correlaciones, asimilando, en cierto modo, el raciocinio del hombre. Y para entregar resultados en tiempo real fue necesario usar la potencia de los procesadores gráficos Titan RDX.
El entrenamiento de las redes neuronales del programa se realizó con más de un millón de fotografías presentes en Flickr bajo licencia Creative Commons.
El software de Nvidia aún está en pañales, lo que observas en el video es solo una demostración o concepto de lo que puede llegar hacer esta tecnología.
El entorno de GauGAN es muy básico, a la izquierda está compuesto por tres herramientas clásicas de Paint: El tarro de pintura, el pincel y el lápiz, más a la derecha está el boceto y la foto realista resultante del boceto, y en la parte inferior hay diferentes objetos.
Si seleccionas la herramienta lápiz, y luego agua (water) al dibujar verticalmente una línea en la rocas, el software interpreta que debe dibujar una cascada.
En los otros ejemplos que se observan en el video, puedes apreciar que las terminaciones y/o frontera entre dos elementos de la foto no queda bien definida en algunos casos.
Una de los ejemplos que me llamó la atención del video (minuto 1:36), es cuando bosquejan agua bajo el árbol de la izquierda. Inmediatamente el software interpreta que además de dibujar el agua, debe incorporar el reflejo del árbol en el agua.
¿Logras comprender el alcance de la tecnología?, ¿Imaginas en qué se podría usar esta tecnología? Te invito a comentar.
Fuente: Techcrunch