IA que convierte texto en arte: conozcamos a DALL-E 2

El panda que amasa es una creación de DALL-E 2, lo último en IA para generar imágenes.

La inteligencia artificial se consolida en herramientas de uso cotidiano, versátiles y de fácil aplicación, como el GPT3. Hoy la novedad en el segmento es la creación de imágenes: DALL-E 2, segunda generación desarrollada por OpenAI, funciona como un complejo sistema neuronal, en el cual diversas imágenes y sus correspondientes textos descriptivos se entrelazan y cobran vida.

Arte a partir de la Inteligencia Artificial

¿Qué pensaría un verdadero exponente del surrealismo como Salvador Dalí al ver en acción a DALL-E 2? La respuesta sería tan hipotética como subjetiva; aunque podríamos preguntárselo al mismísimo artista si recreamos su personaje desde la IA. Mientras tanto, desde AiManager comentamos que este es el modelo de inteligencia artificial más novedoso de OpenAI, y comienza a posicionarse como lo mejor en el segmento: artistas, dibujantes, escritores y público en general, quedan atrapados al ver algunas de sus creaciones, que resultan verdaderamente increíbles. Y es comprensible, este complejo sistema de red neuronal que genera imágenes, está pensado para ellos.

Sucesor del DALL-E 1, permite al usuario “volar” a través de su imaginación, creando imágenes a partir del machine learning, previamente direccionadas a través de un input en forma de texto. Piezas de diseño gráfico, obras de arte tradicionales “versionadas” o “completadas” por otros autores e incluso ideas surrealistas como un pavo real jugando al golf o dos osos de peluche cocinando, son algunas de las producciones que permite esta IA.

¿Cómo genera las imágenes?

Como ya explicamos, DALL-2 es un sistema neuronal, en la cual se relacionan y entrelazan constantemente las imágenes y sus correspondientes textos descriptivos. Lo más interesante es que su tecnología ha evolucionado más allá de lo que normalmente conocemos como “conexiones simples”, en algo un poco más complejo. En este caso, las “neuronas” de DALL-E 2 se han ido desarrollando hasta generar la capacidad de vincular no solo el objeto - por ejemplo “serpiente cobra”-, sino también la acción “surfeando una ola” y el estilo artístico elegido, que podría ser, “arte abstracto”.

Además de la velocidad con la que produce sus creaciones, es capaz de ofrecer múltiples propuestas a través de un mismo imput en forma de texto, es decir, recrea varias alternativas desde una misma directiva.

La representación mental codifica las principales características que son semánticamente significativas: personas, animales, objetos, estilo, colores, fondo, etc. para que DALL·E 2 pueda generar una imagen novedosa que retenga estas características mientras varía aquellas que no son esenciales.

DALL-2: un complejo sistema neuronal en el cual se relacionan y entrelazan constantemente las imágenes y sus correspondientes textos descriptivos.

¿Qué podemos hacer con DALL-E 2?

Según la presentación oficial de firma OpenAI a través de su blog oficial, a través del cual describen a esta IA como capaz de “llevar a cabo la generación de imágenes condicionales de texto jerárquico con latentes CLIP", DALL-E 2 tiene la capacidad de crear imágenes con una resolución cuatro veces mejor que su antecesor (DALL-E 1) y es el preferido por los humanos en un 70 % de las veces, tanto en coincidencia de subtítulos como en fotorrealismo. Puede incluso modificar imágenes existentes, crear variaciones de gráficos que mantengan sus características sobresalientes e incluso interpolar entre dos imágenes de entrada. Los impresionantes resultados de DALL-E 2 hacen que los usuarios se pregunten si hay algún tipo de límites para estas creaciones; mientras, aquí te mencionamos las “habilidades” más destacadas de este “Salvador Dalí” virtual:

· Retocar imágenes ya existentes, siendo capaz de agregar nuevos objetos o elementos y sustituir los ya presentes por otros. Todo esto teniendo en cuenta las características de la fotografía (luces, sombras, texturas y reflejos) para lograr un retoque inapreciable y un acabado impecable.

· Generar dibujos e imágenes, en alta calidad, a través de una sencilla descripción de los mismos. En tal sentido, es este un sistema que permite la obtención de diseños que responden a las ideas que se alojan en nuestra cabeza con tan solo ser capaces de verbalizarlas por escrito.

· Crear de nuevos diseños desde una imagen pre existente; permitiendo tantas versiones y estilos de una misma idea como el usuario desee, para que éste tenga la posibilidad de elegir aquel que se ajuste a sus necesidades.

Una cobra practicando surf: para esta IA nada es imposible.

¿Existen limitaciones para su utilización?

La respuesta es muy sencilla: sí. Al igual que su “primo” el GPT-3, este novedoso artista virtual aún se encuentra en plena fase de desarrollo, encontrándose disponible para una gran cantidad de usuarios, pero no todos.

En este período experimental, OpenAI ha contratado a ciertos desarrolladores, quienes están realizando pruebas con ella, y – tal cual ocurre con el GPT3- pueden tener acceso aquellas personas interesadas en esta IA que hayan completado la plantilla de la web de esta compañía y han recibido una respuesta positiva por parte de la misma.

Además de las restricciones de uso, existen limitaciones de conducta para evitar un uso inadecuado de esta tecnología avanzada, como por ejemplo, aquella asociada a la imposibilidad de producción de contenido violento, sexual o político, y tampoco la generación de rostros asociados a personas reales.

Una vez subsanadas estas restricciones, los especialistas aseguran que en un breve período de tiempo, esta herramienta estará disponible en el mercado y cualquier persona tendrá la posibilidad de disfrutar de ella.

Revolucionario

DALL-E 2 representa un cambio radical en la tecnología de generación de imágenes de IA. Esto es porque, a diferencia de cualquier antecesor en el segmento, tiene la capacidad de captar las indicaciones del lenguaje natural mucho mejor que cualquier otro, lo que permite un nivel de control sin precedentes sobre temas, estilos, técnicas, ángulos, fondos, ubicaciones, acciones, atributos y conceptos, y genera imágenes de una calidad extraordinaria.

Con alta calidad, genera docenas de opciones en segundos, cada una con un nivel de calidad que le llevaría horas producir a un fotógrafo, pintor, artista digital o ilustrador humano, consolidando la fantasía de cualquier director de arte.

El primer interrogante en este artículo indaga sobre la percepción que hubiese tenido Dalí sobre este recurso. Al mismo, podríamos agregar: ¿Cuánto tendremos que esperar para ver un cortometraje completo, escrito, dirigido, con banda sonora y hecho completamente por sistemas de IA? ¿Cómo deberán replantear su actividad en el futuro algunos los artistas?

Competidor inmediato

Si bien esta herramienta novedosa y revolucionaria parece única por sus características, ya cuenta con un incipiente competidor en el mercado. Se trata de Imagen, IA con funciones muy parecidas, producido y presentado recientemente por la firma Google AI.

Si bien debido a políticas de uso de esta compañía aún no se encuentra disponible para los usuarios, Jeff Dean, VP de la firma, ha publicado en su perfil de Twitter varios ejemplos de lo que es capaz Imagen, adelantando que será verdaderamente revolucionaria, como actualmente lo es DALL-E 2.

IA que convierte texto en arte: conozcamos a DALL-E 2

Read next

La importancia de que la digitalización esté al "servicio" de los empleados.

Reconstrucción facial e Inteligencia Artificial

La Inteligencia Artificial llegó para quedarse