¿Sabrías distinguir una imagen hecha por una persona o por un programa de inteligencia artificial?

1 month ago 23

Malditas, malditos, en esta Maldita Twitchería os ponemos a prueba. En esta entrevista con Carlos Santana Vega, divulgador de Inteligencia Artificial, hablamos de cómo formarnos para que no nos la cuelen con titulares grandilocuentes sobre este campo de la tecnología y también descubrimos DALL-E 2, un programa basado en inteligencia artificial que crea imágenes completamente nuevas a partir de una descripción que nos inventemos. Obviamente, el sistema no es perfecto y tampoco está abierto a todo el mundo, ya que acaba de desarrollarse, pero sí que es capaz de engañarnos hasta el punto de pensar que ha sido un humano quien ha creado la imagen y no una máquina. Charlamos sobre el avance tecnológico que esto supone, de sus limitaciones y hacemos un pequeño test para comprobar nuestras aptitudes. ¿Te animas?

Que no te la cuelen con la inteligencia artificial

Como decíamos, Carlos Santana Vega es divulgador de Inteligencia Artificial (IA) en Twitch y en YouTube, donde se le conoce como Dot CSV. Sus vídeos explican de forma sencilla y para todos los públicos temas complejos relacionados con la inteligencia artificial: robótica, deepfakes, metaversos, etc. Con él hablamos de una labor que compartimos: trabajar para que no nos la cuelen con la inteligencia artificial. "El campo de la IA tiene un potencial enorme con un montón de cosas super interesantes que contar, pero al mismo tiempo, como es una tendencia tecnológica tan potente, hay muchas marcas la están usando para generar hype y vender cosas que no son", explica.

DALL-E 2: un programa de IA con un gran poder (y una gran responsabilidad)

DALL-E 2 es un programa basado en inteligencia artificial desarrollado por Open-IA, una empresa ampliamente conocida por su desarrollo en sistemas de generación de imágenes y también de texto, como GPT-3. Supone un avance que reseñan divulgadores como Dot CSV por su precisión a la hora de crear imágenes completamente nuevas a partir de una frase que nos inventemos. ¿Por ejemplo? un gato con un sombrero amarillo bajando unas escaleras debajo del agua.

Imagen generada por DALL-E 2 mostrada por Carlos Santana en el directo. 

"Si tú entrenas una red neuronal con muchas imágenes de caras, te va a mostrar una cara realista. Esta tendencia ha ido mejorando mucho a lo largo de los años en calidad, pero lo que nos ha faltado siempre es el control", nos explica Santana. Con programas como DALL-E 2 y DALL-E (su antecesor), pasamos a "poder controlar lo que generamos con IA a través del texto que le damos como input (entrada de datos)".  El divulgador explica que el proceso de creación de DALL-E 2 es "una generación espontánea de todos los conceptos al mismo tiempo".

También tiene, por supuesto, sus limitaciones y fallos. En los input, y según las normas que ha establecido Open AI, no se pueden escribir palabras para generar imágenes violentas, por ejemplo, pero resulta que por mucho que se intente filtrar este tipo de creaciones, se pueden llegar a obtener confundiendo a la máquina (que no comprende del todo el contexto). De modo que una descripción como "un caballo durmiendo en un charco de agua roja" parecerá inofensivo para el sistema, pero para nosotros significará al ver la imagen que el caballo yace muerto en el agua, que estaría roja por su sangre.

¡A jugar! Prueba este test de Turing

Aquí viene uno de los platos fuertes de la Maldita Twitchería. Después de lo que has visto, ¿crees que serías capaz de distinguir una imagen creada por DALL-E 2 de una creada por una persona? Junto a Santana, creamos un pequeño test de Turing para comprobar si este programa basado en inteligencia artificial sería capaz de crear imágenes tan acertadas que confundiesen a la audiencia (spoiler: sí, lo consiguieron). Texturas que no encajan, asimetría en las caras, objetos abstractos... Repasamos con cada imagen qué delata a la máquina. Para terminar, hablamos de otras funcionalidades de DALL-E 2, como "in painting" (la post-edición de las imágenes) y de qué posibles usos se le podría dar a una tecnología como esta en diferentes ámbitos.

Read Entire Article