Meta lanzó AudioCraft, un paquete de modelos de inteligencia artificial «que promete cambiar el panorama de la generación de audio», según anunciaron sus creadores.
AudioCraft tiene tres modelos llamados MusicGen, AudioGen y EnCodec. Se puede probar online el MusicGen en huggingface.co.
Uno de los grandes atractivos es la inclusión de modelos AudioGen pre-entrenados que habilita la creación de sonidos ambientales como ladridos de perros o pasos en un suelo de madera.
La creencia de Meta es que MusicGen pueda transformarse en un nuevo tipo de instrumento.
Y el hecho de que AudioCraft decida abrir el código a la comunidad también fomenta la colaboración y diversificación de los datos utilizados para entrenar los modelos. Aunque puede que aún no esté listo para ser la próxima sensación en la música pop, AudioCraft representa un paso importante en la innovación musical y sonora porque no es simplemente otra herramienta tecnológica; es una invitación a repensar cómo abordamos la creación de sonido.
Las herramientas que aporta podrían inspirar una nueva generación de artistas y técnicos a explorar territorios inexplorados en la música y el audio. y su impacto podría extenderse más allá del entretenimiento, influyendo en la educación, la terapia, el diseño de productos y más.
Aunque prometedora, la tecnología aún tiene áreas de mejora. Los sonidos generados, aunque naturales, pueden sentirse artificialmente manipulados. Existen también consideraciones éticas y legales relacionadas con el copyright y posibles sesgos en los datos de entrenamiento.
La tecnología no está sola en el campo de la generación de música AI. Gigantes tecnológicos como Google han estado trabajando en modelos similares. Sin embargo, AudioCraft se distingue por su enfoque único en la creación de sonido a partir de texto.