يتعاون Pocket FM مع ElevenLabs لتحويل البرامج النصية إلى محتوى صوتي بسرعة
أعلنت منصة الصوت المدعومة من Lightspeed Ventures، Pocket FM، أنها دخلت في شراكة مع شركة ElevenLabs لاستنساخ الصوت لتحويل المحتوى النصي بسرعة، مثل البرنامج النصي، إلى سلسلة صوتية باستخدام الذكاء الاصطناعي.
أخبرت Pocket FM، التي جمعت 103 مليون دولار من تمويل السلسلة D في مارس، موقع TechCrunch في ذلك الوقت أنها كانت تجرب بالفعل القدرة على تحويل محتوى النص إلى صوت باستخدام تقنية ElevenLabs. والآن، قامت الشركة التي يقع مقرها في الهند بتوسيع الشراكة لجعل أداة التحويل متاحة لجميع منشئي المحتوى خلال الأسابيع القليلة المقبلة.
في مرحلة الاختبار، أنتج Pocket FM بالفعل 30 ألف ساعة من السلسلة الصوتية باستخدام تقنية الذكاء الاصطناعي الخاصة بـ ElevenLab. ومع الإصدار الجديد، تتوقع الشركة الناشئة مضاعفة مكتبة المحتوى الخاصة بها ثلاث مرات والتي تزيد عن 100000 ساعة من المحتوى الصوتي هذا العام. قال Pocket FM أيضًا أنه خلال المرحلة التجريبية، ساعدته الأدوات المدعومة بالذكاء الاصطناعي على خفض تكلفة إنتاج الصوت بنسبة 90٪.
أخبر المؤسس المشارك لـ Pocket FM و CTO Prateek Dixit موقع TechCrunch عبر مكالمة هاتفية أنه من خلال هذه الشراكة، تريد الشركة أن تسهل على الكتاب تحويل كتاباتهم إلى سلسلة صوتية.
وقال: “لدينا أكثر من 250 ألف كاتب (بما في ذلك هؤلاء الموجودون في منصة كتابة روايات الجيب الخاصة بالشركة) وهذه الشراكة تقلل من تكلفة إعداد وتسجيل الصوت لهم”.
“حتى مع وجود مجموعة جيدة من أدوات ومعدات التسجيل، يمكن للكتاب إنتاج ما يقرب من 30 دقيقة من المحتوى الصوتي عالي الجودة يوميًا. وباستخدام أدوات الذكاء الاصطناعي، يمكن أن يكون هذا الناتج أكثر بعشر مرات.
قامت شركة Pocket FM ببناء أداة تدمج تقنية ElevenLabs، والتي من خلالها تقدم 50 صوتًا للكتاب الذين يرغبون في تحويل المحتوى الخاص بهم. قال ماتي ستانيشفسكي، المؤسس المشارك لشركة ElevenLabs، إن أداة شركته تفهم سياق الكتابة وتستنتج المشاعر من خلال الصوت تلقائيًا.
وقال ستانيزيفسكي: “من خلال العمل مع Pocket FM، نقوم بنشر نماذجنا الأحدث التي تفهم نوع الكتابة وتكون عاطفية بشكل أفضل”.
وأشار ديكسيت إلى أنه بناءً على البيانات المستمدة من تفاعل المستخدمين مع هذا النوع من المحتوى، تخطط المنصة أيضًا لاقتراح الأصوات التي تعمل بشكل جيد للكتاب في نوع معين.
لا يعد Pocket FM النظام الأساسي الوحيد لسلسلة الصوت الذي يقوم بتجربة الأدوات التي تعمل بالذكاء الاصطناعي. تستخدم Kuku FM المدعومة من Google GPT-4 وClaude وBandLab وحتى ElevenLabs لمساعدة كتابها في مراحل مختلفة من الإنشاء، بما في ذلك تحسين النص وإنشاء الصور المصغرة وإضافة المؤثرات الصوتية وتحويل النص إلى صوت.
أخبرت Kuku FM موقع TechCrunch أنها تقوم أيضًا بتجربة استخدام أدوات الإنشاء المرئي مثل Midjourney وRunway لإنشاء إعلانات ذات صلة بالمحتوى.
جودة المحتوى وتأثيره على الفنانين
إن الوعد الذي توفره الأدوات التي تعمل بالذكاء الاصطناعي هو إنشاء المزيد من المحتوى بشكل أسرع، ولكن هذا لا يعني أن المحتوى جيد. إن إجابة Pocket FM للمساعدة في اكتشاف المحتوى عالي الجودة وإبرازه هو جعل خوارزمية الاكتشاف الخاصة به متطورة وتجريب مشاركة المستخدم.
“إذا نشر الكاتب سلسلة صوتية، فإننا نعرض هذا المحتوى على عدد محدد من المستخدمين ونراقب مقاييس التفاعل. وقال ديكسيت: “إذا كانت هذه المقاييس إيجابية، فإننا ننشر ذلك بشكل أكبر”.
قالت Kuku FM إنها تعمل مع فريق مراقبة الجودة الخاص بها لضمان الترويج للمحتوى عالي الجودة فقط على تطبيقها، حتى لو استخدم المبدعون الذكاء الاصطناعي في هذه العملية.
“لقد أدركنا أهمية وجود فريق بشري لمراقبة الجودة في قلب عملية صنع القرار لدينا عندما يتعلق الأمر بإنتاج المحتوى الصوتي. قال لال تشاند بيسو، المؤسس المشارك والرئيس التنفيذي للشركة: “لقد قمنا بتطوير فريق أساسي من منتجي المحتوى الذين يتمتعون بملكية وسلطة عالية فيما يتعلق بالمعايير الفنية”.
يمكن أن يؤدي استخدام الذكاء الاصطناعي إلى نتائج أسرع ومكتبة محتوى أكبر لهذه المنصات، ولكنه سيقلل أيضًا من أدوار فناني التعليق الصوتي الذين يعملون معهم. أعربت رابطة فناني التعليق الصوتي في الهند (AVA) عن مخاوفها بشأن تولي الذكاء الاصطناعي المسؤولية.
“إذا تولى الذكاء الاصطناعي المسؤولية، فسننتهي. وقال أماريندر سينغ سودهي، الأمين العام للجمعية، لصحيفة سكرول الهندية: “كفنانين صوتيين، نحتاج إلى وضع بعض القواعد التنظيمية حتى نحمي سبل عيشنا”.
أخبر Sodi أيضًا Scroll عن الحوادث التي تم فيها استدعاء فناني التعليق الصوتي إلى الاستوديو لتسجيل عينات لتدريب الذكاء الاصطناعي دون الحصول على موافقتهم أو إبلاغهم.
“على المستوى العاطفي، هذا يخيفني. باستخدام الذكاء الاصطناعي، فإنك تضعف بشكل أساسي التجربة الإنسانية في رواية القصص. قال أديتيا ماتو، فنان التعليق الصوتي المقيم في دلهي، لـ TechCrunch: “إنك تخسر الاتصال العاطفي”.
وأضاف أن إتاحة الوصول إلى الأصوات المتميزة للأشخاص الذين ليس لديهم الذوق والمهارة لإنتاج محتوى عالي الجودة سيؤدي إلى إغراق السوق بالمحتوى السيئ.
كما أثار فنانو الصوت في أجزاء أخرى من العالم مخاوف بشأن تأثير الذكاء الاصطناعي على وظائفهم. وعلى الرغم من العمل مع بعض شركات الذكاء الاصطناعي، فإنهم يشعرون بعدم الارتياح إزاء تغيير أصواتهم.
عندما سألنا عن تأثير توليد الصوت المدعوم بالذكاء الاصطناعي على Pocket FM، لم تجب الشركة مباشرة على السؤال. ومع ذلك، أشار ديكسيت إلى أن التفاعل مع المحتوى الناتج عن الذكاء الاصطناعي في تجاربه “يعد جيدًا مثل إنتاج التعليق الصوتي البشري”. والجدير بالذكر أن الشركة تعمل أيضًا على تقنية لدمج أصوات متعددة في مخرج صوتي واحد.
لا يقوم كل من Pocket FM وKuku FM حاليًا بتصنيف المحتوى الخاص بهما للإشارة إلى ما إذا كان الذكاء الاصطناعي قد تم استخدامه في عملية الإنشاء.
اكتشاف المزيد من مجلة كوكان
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.