🥇 ▷ La IA de Meta para crear música y efectos de sonido

Gracias por visitarnos y por leer el artículo: La IA de Meta para crear música y efectos de sonido

Meta está haciendo una profunda apuesta por la IA generativa, y hoy lo ha ratificado con la presentación de audiocraft. Es sobre un nuevo software de código abierto capaz de crear música y efectos de sonido a partir de texto. El anuncio se produce pocas semanas después de la presentación de LLaMA 2, su último modelo de inteligencia artificial, también de código abierto.

A través de AudioCraft, Meta ofrece la capacidad de generar “música y sonidos realistas y de alta calidad”. Cabe mencionar que esta plataforma utiliza tres modelos para brindar los resultados prometidos: MusicGen, Generación de audio y el decodificador InCodec.

Según explicó, el primero entrenaba tanto con música licenciada como con música de la compañía Menlo Park. Mientras que para la formación del segundo se utilizó un catálogo público de efectos sonoros. En cuanto a EnCodec, los de Mark Zuckerberg afirman que se trata de una versión optimizada que permite obtener resultados de calidad que requieren “menos artefactos”.

¿Cómo funciona AudioCraft? Al igual que en las plataformas capaces de generar imágenes (Dall-E 2, Midjourney), o en los chatbots conversacionales (ChatGPT, Bard), el usuario debe ingresar un mensaje de texto y la herramienta se encarga del resto.

Por lo tanto, se puede pedir a AudioCraft que genere el sonido de las sirenas de la policía acercándose y saliendo. O componer una canción de un determinado género musical, utilizando instrumentos específicos o incluso incluyendo un solo. El primer ejemplo se realizaría a través de AudioGen, mientras que el segundo a través de MusicGen.

Así es como funciona AudioCraft. Foto: Gol.

Según Meta, las diferentes herramientas que componen AudioCraft no solo han sido diseñadas para ser fáciles de usar y ofrecer resultados inmediatos de calidad. También, para que tus creaciones sean consistentes a largo plazo. Al proporcionar esta inteligencia artificial como software de código abierto, los californianos quieren que los expertos puedan usarla. para entrenar sus propios modelos con sus propios conjuntos de datos. Sin embargo, también se lanzarán versiones preentrenadas del modelo AudioGen para simplificar la creación de efectos de sonido con información preexistente.

“Si bien hemos visto mucho entusiasmo en torno a la IA generativa para imágenes, video y texto, el audio parece estar un poco rezagado. Hay algo de trabajo por ahí, pero es muy complicado y no muy abierto, por lo que las personas no pueden jugar fácilmente con él. Generar audio de alta fidelidad de cualquier tipo requiere modelar señales y patrones complejos en diferentes escalas. Podría decirse que la música es el tipo de audio más difícil de generar, ya que se compone de patrones locales y de gran alcance, desde un conjunto de notas hasta una estructura musical global con múltiples instrumentos”.

Meta, sobre el lanzamiento de AudioCraft.

Será interesante ver cómo el enfoque de código abierto de AudioCraft ayuda a su adopción entre los investigadores y entusiastas de la IA generativa. En cualquier caso, es lógico pensar que las nuevas herramientas Meta podría convertirse en una fuente potencial de conflicto en el futuro. Especialmente MusicGen, considerando que las herramientas para crear música con inteligencia artificial ya están generando polémica.

De hecho, Google vencer a AudioCraft con una herramienta similar. MusicLM nació para generar canciones a partir de un simple comando de texto y entrenó con más de 280.000 horas de música. Sin embargo, aún no está disponible para el gran público porque los de Mountain View no consiguen solucionar un problema menor: plagio. Alrededor del 1% de la música que genera esta IA es una réplica de material protegido por las leyes de derechos de autor. Algo que en un principio parece menor, pero que puede suponer un fuerte quebradero de cabeza legal.

Universal Music Group, uno de los principales sellos discográficos del mundo, ha pedido Manzana y Spotify para bloquear bots que extraen letras y melodías de las canciones de sus artistas. Según la compañía, ese material protegido por derechos de autor se utiliza luego para entrenar modelos de inteligencia artificial capaces de crear música que se asemeje a la de intérpretes o compositores como Taylor Swift y Elton John. ¿Estará AudioCraft en el punto de mira de los pesos pesados de la industria musical? Lo sabremos muy pronto.

Recibe nuestra newsletter todas las mañanas. Una guía para entender lo que importa en relación con la tecnología, la ciencia y la cultura digital.

Procesando…

¡Listo! Usted ya está suscrito

Hubo un error, actualice la página y vuelva a intentarlo

También en Hipertexto: