ElevenLabs, conocida por su tecnología de síntesis de voz, anunció el lanzamiento de Music v2, un modelo de IA generativa que puede cambiar de género musical en medio de una composición. La nueva versión amplía las capacidades del primer modelo de música de la empresa, que debutó menos de un año atrás, agregando soporte para arreglos vocales intrincados, letras multilingües y la capacidad de superponer efectos de sonido no musicales.
Los artistas ahora pueden seleccionar un segmento de una pista, como un intro, un verso o un coro, y generar una versión fresca utilizando instrucciones de texto, mientras dejan el resto de la canción intacto. El modelo puede cambiar de ópera a heavy metal, entregar versos de rap rápidos sin perder coherencia e incluso insertar ruidos ambientales o pistas cinematográficas al vuelo. En lugar de producir clips cortos, los creadores pueden construir una pieza de canción completa, pieza por pieza, uniendo secciones generadas por IA que coinciden con la estructura pretendida.
Licencia comercial lista
ElevenLabs enfatiza que Music v2 se ejecuta en un conjunto de datos habilitado para uso comercial. La empresa dice que la salida del modelo se puede implementar en marketing, publicidad y otros contextos generadores de ingresos sin temor a infracción de derechos de autor. Este enfoque en datos habilitados llega en un momento en que otras startups de música de IA, como Suno y Udio, han enfrentado desafíos legales sobre muestras no licenciadas.
El nuevo modelo ya está integrado en la plataforma ElevenCreative de ElevenLabs, que se dirige a equipos de marca y marketing, y pronto estará accesible a través de la ElevenAPI para desarrolladores. Al empaquetar la tecnología con herramientas que permiten a los usuarios editar canciones por secciones, ElevenLabs busca simplificar el flujo de trabajo para músicos, creadores de contenido y empresas que buscan producir audio original a gran escala.
Contexto de la industria y competencia
Music v2 llega en medio de una oleada de lanzamientos de música de IA. Google presentó su herramienta Flow Music en la conferencia I/O reciente, ofreciendo creación de versiones fáciles, edición por secciones y videos de música generados por IA. Stability AI introdujo un modelo que puede generar pistas más largas y complejas, mientras que Suno anunció un sistema centrado en la síntesis de voces de alta fidelidad. Todos estos competidores destacan una tendencia más amplia: la IA generativa se está moviendo desde clips cortos y novedosos hacia composiciones de producción de gran calidad y longitud completa.
La afirmación de ElevenLabs de una mayor confiabilidad en varios idiomas y estilos vocales podría darle una ventaja en los mercados globales donde el contenido multilingüe es esencial. La capacidad de agregar efectos de sonido no musicales directamente en una pista también distingue a Music v2 de los modelos que se centran únicamente en notas y instrumentación musicales.
Si bien la tecnología promete libertad creativa, los expertos advierten que la facilidad de generar canciones pulidas puede plantear nuevas preguntas sobre originalidad y compensación para los músicos humanos. Sin embargo, ElevenLabs posiciona a Music v2 como una herramienta que empodera a los creadores en lugar de reemplazarlos, ofreciendo una canvas flexible para la experimentación.
A medida que la música generada por IA se vuelve más mainstream, es probable que la industria vea un fortalecimiento de los marcos de licencia y quizás nuevos estándares para la atribución. Por ahora, el modelo más reciente de ElevenLabs se erige como un hito notable, demostrando lo lejos que ha avanzado el audio generativo en menos de un año.
Este artículo fue escrito con la asistencia de IA.
News Factory SEO te ayuda a automatizar contenido de noticias para tu sitio.