Los generadores de arte con IA se han convertido en una tendencia fascinante y cada vez más popular en el mundo del arte digital. Estos sistemas innovadores utilizan algoritmos de inteligencia artificial para crear obras de arte originales, desdibujando la lÃnea entre la creatividad humana y el arte generado por máquinas.
El auge de los generadores de arte con IA se puede atribuir a los avances en el aprendizaje automático y las redes neuronales profundas. Estos algoritmos se entrenan en vastos conjuntos de datos de obras de arte existentes, lo que les permite aprender patrones, estilos y técnicas empleadas por artistas humanos.
Uno de los aspectos notables de los generadores de arte con IA es su capacidad para producir diversos estilos y géneros. Pueden imitar las pinceladas de pintores famosos, crear composiciones abstractas, generar retratos realistas o incluso crear formas de arte completamente nuevas y surrealistas.
Ahora, Meta ha presentado su último generador artÃstico de IA llamado CM3Leon, que según la compañÃa logra un rendimiento de última generación para la generación de texto a imagen, según un informe de TechCrunch.
Capacidades de CM3Leon
Según Meta, las capacidades de CM3Leon permiten que las herramientas de generación de imágenes produzcan imágenes más coherentes y alineadas contextualmente basadas en indicaciones de entrada. La empresa ve esto como un paso hacia la generación y comprensión de imágenes de mayor fidelidad.
A diferencia de otros generadores de imágenes modernos que dependen de la difusión, como DALL-E 2 de OpenAI e Imagen y Stable Diffusion de Google, CM3Leon es un modelo transformador.
Al emplear el mecanismo de “atención”, CM3Leon evalúa eficazmente la relevancia de los datos de entrada, ya sean texto o imágenes. Esta caracterÃstica única de los transformadores no solo mejora la velocidad del entrenamiento del modelo sino que también facilita la paralelización, lo que resulta en una mayor eficiencia computacional.
Meta afirma que CM3Leon supera la eficiencia de la mayorÃa de los transformadores, exigiendo menos recursos computacionales y un conjunto de datos de entrenamiento más pequeño. Esta ventaja posiciona a CM3Leon como una opción atractiva para diversas aplicaciones, particularmente aquellas que requieren capacidad de respuesta en tiempo real.
7 mil millones de parámetros
Meta empleó una amplia colección de imágenes con licencia de Shutterstock para entrenar a CM3Leon. La versión más avanzada de CM3Leon desarrollada por Meta cuenta con un impresionante recuento de parámetros de 7 mil millones, superando al de DALL-E 2.
El ajuste supervisado (SFT) jugó un papel crucial en la mejora del rendimiento de CM3Leon. Meta empleó esta técnica, que se ha utilizado con éxito en el entrenamiento de modelos de generación de texto como ChatGPT de OpenAI, para mejorar las capacidades de CM3Leon tanto en la generación de imágenes como en la escritura de subtÃtulos de imágenes.
Como resultado, CM3Leon ahora puede responder preguntas sobre imágenes y editarlas según instrucciones de texto.
Aunque CM3Leon de Meta marca un logro notable en la generación de arte con IA, es interesante considerar que OpenAI se habÃa aventurado previamente a utilizar transformadores para la generación de imágenes a través de su modelo Image GPT.
Sin embargo, OpenAI decidió centrar su atención en métodos basados ​​en la difusión y ahora está explorando el concepto de “consistencia” como una vÃa potencial para futuros avances en este campo.
â“’ 2023 . .