La tecnología de Inteligencia Artificial evoluciona a un ritmo vertiginoso y con ella, su extensión a diversos ámbitos y disciplinas. Hace apenas unos meses nos hacíamos eco en nuestro artículo de las principales novedades en Inteligencia artificial para este 2022. Sin embargo, no nos podemos resistir a contaros los increíbles avances en el sector y algunas de sus consecuencias más relevantes. Vamos allá.
Índice de contenidos
DALL-E y DALL-E2, tú mandas y la IA dibuja
A principios de 2021, la empresa especializada en el desarrollo de Inteligencia Artificial, OpenAI, lanzó DALL-E (en honor al ilustre pintor, Salvador Dalí), capaz de generar imágenes de hasta 256 x 256 px, totalmente originales, con el único requerimiento de una breve descripción. Lo verdaderamente espectacular de esta inteligencia artificial va más allá de la mera impresión de imágenes que coincidan en contenido con algunos de los conceptos indicados en la descripción. DALL-E es capaz de crear imágenes totalmente imaginarias y surrealistas.
A finales de año, anunciaron el desarrollo y lanzamiento de DALL-E 2, que gracias a la tecnología de CLIP, mejoraba el análisis de la información recibida y la generación de imágenes, llegando a producir archivos de 1024 px de resolución.
Esta nueva versión incorporaba novedades como la posibilidad de editar las imágenes generadas, actualizándolas con un nuevo elemento, textura o color en un área determinada de la imagen. Por último, DALL-E 2, permite crear variaciones estilísticas de una imagen original. La IA identifica los elementos característicos de la imagen y los recrea en diversos estilos, que, además, podemos usar posteriormente para generar una nueva imagen totalmente distinta. Simplemente impresionante.
IMAGEN y PARTI, las inteligencias artificiales de generación de imágenes de Google
Hace tan solo unos meses, Google anunciaba su IA de generación de imágenes, similar a DALL-E 2, basada en la tecnología Google AI. Como podemos comprobar en su sitio web, la tecnología de Google es capaz de generar impresionantes imágenes a partir de descripciones con un nivel de detalle extraordinario.
A diferencia de DALL-E y DALL-E 2, IMAGEN se centra en la creación de fotografías realistas, en vez de en la creación de pinturas. Gracias a la inteligencia artificial de modelos lingüísticos, es capaz de comprender las descripciones del usuario con gran exactitud.
Lo que sorprendió a propios y extraños fue el anuncio casi simultáneo de PARTI (Pathways Autoregressive Text-to-Image). PARTI también genera imágenes a partir de texto con gran fidelidad. Aunque a efectos prácticos pueden resultar similares, PARTI funciona de manera distinta de manera interna, y según asegura Google, en un futuro podrá resultar complementario a IMAGEN. Además, PARTI admite descripciones mucho más extensas que «el resto de sus competidores».
Como puedes observar en la imagen, el resultado a la descripción «Retrato de un tigre con un sombrero de conductor de tren y sosteniendo una patineta que tiene un símbolo de yin-yang», resulta más que satisfactorio.
Aquí podemos comprobar los distintos resultados al texto «Una fotografía de un pájaro con auriculares y hablando por un micrófono de alta gama en un estudio de grabación», solicitado en varias ocasiones.
Nuevas inteligencias artificiales de Google y Meta para videos
Si Google nos dejó boquiabiertos tanto con IMAGEN como con PARTI, con la nueva IA de generación de videos ha tirado la casa por la ventana. Al igual que con sus generadores de imagen, basta con que la Inteligencia Artificial reciba una descripción para que, en apenas unos minutos, genere un breve clip totalmente original.
Al tratarse de una tecnología en sus primeros estadios de desarrollo, el resultado no es realista, careciendo de una gran definición. Sin embargo, la generación automática progresiva dota a los clips de un aspecto artístico muy creativo y plástico. Podemos comprobarlo en el siguiente video, en el que se le ha pedido a la IA que genere un video de una fogata en el bosque nevado en una noche de cielo estrellado.
Por su parte, el gigante de la multinacional de Mark Zuckerberg, Meta, lanzó casi a la par su «Make-a-video». Una tecnología muy similar a la de Google, capaz de generar clips de apenas 16 fotogramas con una resolución de 24 x 48 px.
Aunque ambas tecnologías se encuentran «en pañales», el futuro se antoja realmente prometedor. Por eso, en cuestión de poco tiempo, podremos disfrutar de contenido de calidad, totalmente original.
Peligros y problemas habituales de la Inteligencia artificial
Como es natural, no todo son buenas noticias con el desarrollo de la IA al servicio de las nuevas tecnologías. Cualquier nueva herramienta conlleva un aprendizaje y un sinfín de pruebas y errores. El principal factor de riesgo en el campo de la IA quizás sea precisamente lo impredecible que resulta. Estos son algunos de las posibles consecuencias y peligros que entraña.
El impacto de la inteligencia artificial en el modelo actual audiovisual
Hace algunos meses os hablamos de las principales herramientas para mejorar las imágenes mediante Inteligencia Artificial. Entonces aprovechamos para comentar de soslayo el impacto de la IA sobre los distintos sectores laborales como las artes gráficas, entre otros. Es por eso que con cada nueva noticia en el desarrollo de la IA, el temor a un cierto «intrusismo laboral» acrecienta. El ejemplo es simple; si la IA genera imágenes y videos, cada vez mejores, ¿llegará el día en el que no se requieran los servicios de fotógrafos y videógrafos profesionales? ¿Y qué hay de los numerosos bancos de imágenes y video de los que se nutren a diario infinidad de profesionales del diseño y el marketing?
Generación de contenido comprometedor
El propio equipo de Google reconoce que, además de por su estado actual de desarrollo, su tecnología no se ha abierto al público por el inherente riesgo que conlleva la generación de contenido comprometedor. De esta manera, resultaría casi «natural» para IA de este tipo poder codificar estereotipos y representaciones perjudiciales y ofensivas.
Dicho de otro modo, la IA funciona similar a una mente humana, y lo que genera, lo hace en función de lo aprendido. A la IA «se le alimenta» con contenido muy diverso, evitando contenido violento, sexual o con connotaciones negativas. Sin embargo, debido a que bebe de nuestra propia realidad, los resultados suelen mostrar estereotipos presentes en ella.
En tecnologías como DALL-E 2, se especifica que la IA se han implementado algunos protocolos de seguridad, como bloqueos de caras reconocibles. De esta manera, se trata de evitar la representación «inadecuada» de personajes famosos y celebridades.
Suplantación de identidad y otros engaños mediante inteligencia artificial
Hace algunos días los principales medios de comunicación se hacían eco de una práctica de «phising» o suplantación de identidad en masa en algunas redes sociales, como LinkedIn. Lo peculiar del caso es que los perfiles en cuestión se generaban de manera artificial mediante una IA. Las fotos de perfil se habían generado de manera artificial, no correspondiendo a ninguna persona real. Las principales redes sociales informan de que semanalmente reciben cientos de solicitudes de perfiles falsos para ingresar en ellas. En muchos de estos casos, los piratas informáticos suelen tratar de infiltrarse mediante ofertas laborales en empresas de criptomonedas.
Conclusión
En definitiva, la IA no deja de ser una herramienta muy potente y en desarrollo, pero una herramienta al fin y al cabo. Y tras cada herramienta, hay un humano con un planteamiento, un algoritmo y una base de datos sobre la que genera soluciones. Como todo parece indicar, tarde o temprano habremos de convivir con distintas Inteligencias Artificiales a todos los niveles. Por eso mismo, nos conviene aprender a aprovechar todo su potencial de la manera más saludable y sostenible.
Por nuestra parte, nos despedimos por hoy. Esperamos que hayáis disfrutado de nuestro artículo. Os animamos a compartir vuestras impresiones con nosotros en la sección de comentarios. ¡Hasta la siguiente entrada!