أطلقت شركة الصوت بالذكاء الاصطناعي ElevenLabs الإصدار Music v2، وهو تحديث لنموذجها لتوليد الموسيقى يمكنه تغيير الأنواع الموسيقية في منتصف المقطع. تدعي الشركة أن النموذج يتعامل مع التعقيد في الغناء والتأليف، مما يسمح له بالانتقال من الأوبرا إلى الهيفي ميتال والعودة، وأداء الراب السريع دون فقدان التماسك، وحتى إضافة مؤثرات صوتية غير موسيقية إلى المقطع. هذا صحيح - سيمفونيتك المولدة بالذكاء الاصطناعي يمكنها الآن أن تتحول فجأة إلى ريف الموت، فقط لأنها تستطيع.
يأتي الإصدار الجديد بعد ما يقرب من 10 أشهر من أول نموذج لتوليد الموسيقى من الشركة الناشئة. الآن، يمكن للفنانين تحديد جزء من أغنية وإعادة إنشائه باستخدام مطالبات دون لمس الأجزاء الأخرى. بدلاً من المقاطع القصيرة، يمكنهم بناء الأغاني حسب الأقسام - المقدمة، المقطع، الكورس - وربطها معًا. تضيف ElevenLabs أن النموذج يعمل بشكل أكثر موثوقية عبر اللغات وكلمات الأغاني والغناء والترتيبات، وهو أمر مفيد عندما يقرر مغني الأوبرا بالذكاء الاصطناعي فجأة أن يغني راب بلغة كلينجون.
ينضم هذا الإطلاق إلى سباق بين مختبرات الذكاء الاصطناعي - بما في ذلك Google وStability AI وSuno - لإصدار نماذج توليد موسيقى احترافية. في Google I/O، أضافت Google إنشاء الكوفر والتحرير حسب الأقسام والفيديوهات الموسيقية إلى أداة Flow Music. لكن ElevenLabs تراهن على بياناتها المرخصة: النموذج مبني على بيانات مرخصة ومصرح به للاستخدام التجاري، لذا يمكن للمستخدمين استخدام المقاطع بحرية. هذا أمر حاسم بالنظر إلى أن المنافسين Suno وUdio يواجهان دعاوى قضائية بشأن حقوق النشر. عقد صفقات مع شركات التسجيل هو المفتاح، لأنه لا شيء يقول "الحرية الإبداعية" مثل تجنب دعوى قضائية.
النموذج الجديد متاح على أداة ElevenCreative من ElevenLabs لفرق التسويق والعلامات التجارية، وعلى منصة ElevenMusic المطلقة حديثًا للأغاني المولدة بالذكاء الاصطناعي، مع وصول API قريبًا. لأن ما يحتاجه العالم هو ذكاء اصطناعي يمكنه كتابة نغمة إعلانية لعلامة طعام قططك، ثم يتحول إلى أغنية باور بلالاد عن إقرارك الضريبي.