كشفت شركة إنفيديا عن نموذج ذكاء اصطناعي جديد تجريبي أطلقت عليه اسم “1 Foundational Generative Audio Transformer Opus”، ويعرف اختصارا بـ (Fugatto)، وهو نموذج مخصص للصوت بنحو أساسي. ويتميز هذا النموذج بقدرته على إنشاء أصوات أو تعديل الموسيقى والصوتيات والملفات الصوتية بناء على الأوامر النصية، وقد طور (Fugatto) فريق من الباحثين في مجال الذكاء الاصطناعي من مختلف أنحاء العالم، ما عزز قدراته المتعددة اللهجات واللغات.
وقال رافاييل فالي أحد الباحثين وراء المشروع ومدير أبحاث الصوت التطبيقية في إنفيديا: “أردنا تصميم نموذج يفهم الصوت وينتجه كما يفعل البشر”. وأشارت الشركة في بيانها إلى عدد من الاستخدامات العملية للنموذج، مثل تمكين منتجي الصوت من إنشاء نماذج أولية للأفكار الموسيقية بسرعة، مع إمكانية تعديلها بسهولة لتجربة أنماط وأصوات وآلات موسيقية مختلفة.
ويمكن للنموذج أن يستخدم في تطوير أدوات تعليمية للغات بصوت مخصص حسب الطلب، ويمكن لمطوري ألعاب الفيديو إنشاء نسخ متعددة من الأصول الصوتية المسجلة سابقا، لتتوافق مع تغييرات اللعبة التي تحدث بناء على اختيارات اللاعبين وأفعالهم.
وعلاوة على ذلك، اكتشف الباحثون أن النموذج قادر على تنفيذ مهام غير مدرجة ضمن تدريبه الأولي بعد إجراء تعديلات بسيطة. وعلى سبيل المثال، يمكنه توليد كلام غاضب بلكنة معينة أو إنشاء صوت عصافير تغرد وسط عاصفة رعدية، ويمتاز Fugatto أيضا بقدرته على توليد أصوات تتغير مع مرور الوقت، مثل صوت القطار أثناء تحركه عبر منطقة ما.
الجدير بالذكر أن نموذج (Fugatto) لا يعد الأول من نوعه؛ إذ أطلقت شركة ميتا سابقا مجموعة أدوات ذكاء اصطناعي مفتوحة المصدر لإنشاء الأصوات من أوصاف نصية، كما توفر جوجل نموذجها الخاص لتحويل النص إلى أصوات، MusicLM.