سونو وليريا 3 يتنافسان على غناء كلماتك بالعربية.. أيهما أفضل؟

شهد العامان الأخيران قفزة هائلة في نماذج الذكاء الاصطناعي التوليدي الصوتي (Generative Audio)، وانحصرت المنافسة الكبرى بين مدرستين، هما مدرسة “سونو إيه آي” (Suno AI) التي تركز على المحاكاة الهيكلية الكاملة، ومدرسة “غوغل ديب مايند” (Google DeepMind – Lyria) التي تركز على النمذجة الموجية الدقيقة.

ولمعرفة الفروق بينهما أجرينا في الجزيرة نت تجارب ومقارنة خلصنا فيها للتالي:

البنية التحتية ونمذجة الصوت (Architecture)

  • “سونو”.. نمذجة التوكنات والأنماط

    للاستخدام الداخلي فقط - لقطة شاشة من موقع سانو suno
    سونو تعتبر المصنع المتكامل للأغاني، حيث يحول مجرد كلمات بسيطة إلى أغنية كاملة (الجزيرة)

    يعتمد سونو (Suno) في جوهره على هندسة مشابهة للنماذج اللغوية الكبيرة (LLMs)، فهو لا “يؤلف” الموسيقى كنوتات، بل يتنبأ بـ “التوكنات” (Tokens) الصوتية التالية بناء على سياق ضخم من البيانات التدريبية.

    حيث يبرع “سونو” في فهم “تراتبية الأغنية”، وهو يدرك تقنيا الفرق بين المقطع (Verse) واللازمة (Chorus) والجسر (Bridge)، مما يجعله قادرا على توليد مقاطع طويلة تصل لـ 4 دقائق متواصلة بانسجام لحني مذهل.

    لكن التحدي التقني لسونو يتلخص أنه يعاني أحيانا مما يسمى بـ “الضجيج الرقمي” (Artifacts)، حيث تندمج الترددات الصوتية للآلات مع الترددات البشرية، مما يصعب عملية “الهندسة العكسية” أو فصل الآلات لاحقا.

  • “ليريا 3” النمذجة الموجية والنقاء

    Lyria 3 للاستخدام الداخلي فقط
    ليريا يعتبر النموذج الأكثر تطورا من غوغل لإنتاج الموسيقى ويمتاز بقدرته الفائقة على ضبط الإيقاع (ليريا)

    “ليريا” (Lyria)، المطور من قبل غوغل ديب مايند، يستخدم تقنيات متطورة في معالجة الإشارات الرقمية (DSP) والشبكات العصبية العميقة التي تتعامل مع الموجة الصوتية (Waveform) مباشرة بجودة احترافية.

    ويتفوق ليريا في “معدل العينة” (Sample Rate) وعمق البت (Bit Depth)، مما ينتج صوتا كريستاليا يضاهي جودة الاستوديو (44.1 كيلوهرتز أو أعلى).

    إضافة لذلك، ينفرد بتقنية “سينث آي دي” (SynthID)، وهي علامة مائية غير مسموعة تدمج في الموجة الصوتية لحماية الحقوق وتحديد المصدر، مما يجعله النموذج الأكثر أمانا للمحترفين.

معالجة الموسيقى العربية.. المقامات والإيقاع

عند الانتقال للموسيقى العربية، تظهر الفجوة التقنية في كيفية معالجة “الربع تون” والإيقاعات المركبة، فسونو يمتلك قاعدة بيانات ضخمة من الأغاني العربية المعاصرة، لذا فهو ينجح في محاكاة الروح والأداء والتعبير الصوتي (Vocal Expression) ببراعة، خاصة في الأنماط الشعبية والبوب.

إعلان

أما ليريا فهو يركز على “فيزيائية الآلة”، فعند طلب “عود” أو “قانون”، يقوم ليريا بمحاكاة رنين الأوتار (Resonance) بدقة مذهلة، مما يجعله يتفوق في المقطوعات الآلية (Instrumentals) والموسيقى التصويرية التي تتطلب نقاء فائقا.

وهنا نجد أن هذه التطبيقات تحاول محاكاة المقامات الشرقية عبر موازنة الترددات الرقمية لتلائم ذائقة المستمع العربي، لكن ورغم نجاحها في تقديم ألحان متماسكة لغويا ونغميا، إلا أن تنفيذها يظل معتمدا على الأنماط الإحصائية، مما يجعلها بارعة في المحاكاة، لكنها لا تزال تطارد ذلك “السر” الخفي الذي يربط مخارج حروف الضاد بروح الارتجال الشرقي الأصيل.

Lyria 3
ليريا يضمن حماية حقوق الملكية الفكرية للموسيقى المولدة بالذكاء الاصطناعي (ليريا)

نموذج تطبيقي

لتحقيق أقصى استفادة من هذه التقنيات في مشروع عربي، اتبع النماذج التالية:

للحصول على أفضل نتيجة من سونو، السر يكمن في “الوصف الذكي” أو ما يسمى بالأوامر أو التعليمات (Prompt)، إليك الطريقة المثالية لطلب أغنية وكأنك “مخرج موسيقي”:

استخدم الوضع المخصص (Custom Mode)، هذا الوضع هو الأقوى لأنه يمنحك تحكما كاملا. بمجرد تفعيله، ستجد الخانات التالية:

  • الكلمات (Lyrics): يمكنك كتابة كلماتك الخاصة، والأفضل أن تستخدم “وسوم المقاطع” لتوجيه الذكاء الاصطناعي، مثل:

[Intro] للبداية

[Verse 1] للمقطع الأول

[Chorus] للازمة (المقطع المتكرر القوي)

[Bridge] لمقطع مختلف في المنتصف يكسر الرتابة

[Outro] للنهاية

  • نمط الموسيقى (Style of Music): لا تكتف بكلمة واحدة، بل صف الشعور والآلات.

فأكتب بالتفاصيل كالتالي: بوب عربي أكوستيك، عود، عاطفي، إيقاع بطيء، غناء نسائي، جودة عالية.

ونصيحة مهمة، تجنب كتابة أسماء الفنانين المشهورين فسونو يرفضها أحيانا، وبدلا من ذلك صف في خامة الصوت (خشن، ناعم، أثيري، قوي).

وإذا أعجبتك بداية الأغنية ولكنها انتهت بسرعة، اضغط على (Extend)، سيسمح لك بإضافة مقاطع جديدة بنفس اللحن والروح لتكمل الأغنية.

أما للحصول على الأغنية كاملة، فبعد الانتهاء من التمديد، يمكنك دمج كل المقاطع في ملف واحد طويل.

أما إن أردت أن تنتج أغنية في ليريا، فالتركيز هنا يكون على “النسيج الصوتي”، ويجب عليك أن تتبع التالي:

الوصف التقني: تخت عربي أصيل، ناي منفرد بصدى عميق، مكبر ميكروفون أولي عتيق من سبعينيات القرن الماضي، دفء تناظري، جودة صوت 4 كيه.

أما طريقة التنفيذ، فابدأ بتوليد 30 ثانية من التقاسيم (Intro)، ثم استخدم خاصية (Add Section) لإدخال الكلمات تدريجيا، مما يضمن الحفاظ على جودة الآلات دون تداخل.

وبعد التجربة، ستجد أن الاختلالف كله يكمن بين دقة النغمة في ليريا وطول الأغنية في سونو، وهو أمر قد ينتج عنه اندماج مع التطور المستمر لهما. فالعالم يقترب من عصر سيوفر فيه ليريا واجهات برمجية (APIs) تسمح بتوليد أغان كاملة، بينما يحسن سونو من جودة ضغطه الصوتي، أما للمستخدم العربي، فالخيار يعتمد على الهدف، فسونو مخصص للانتشار والعاطفة، وليريا للاحترافية والإبداع الصوتي.

 

المصدر: الجزيرة