تكنلوجيا الويب

شركة ElevenLabs الناشئة لاستنساخ الصوت تحصل على 80 مليون دولار، وتحقق مكانة اليونيكورن


هناك الكثير من المال في استنساخ الصوت.

مثال على ذلك: أعلنت شركة ElevenLabs، وهي شركة ناشئة تعمل على تطوير أدوات مدعومة بالذكاء الاصطناعي لإنشاء وتحرير الأصوات الاصطناعية، اليوم أنها أغلقت جولة بقيمة 80 مليون دولار من السلسلة B بقيادة مستثمرين بارزين بما في ذلك أندريسن هورويتز، والرئيس التنفيذي السابق لـ GitHub نات فريدمان ورجل الأعمال دانييل جروس. .

الجولة، التي شاركت فيها أيضًا Sequoia Capital، وSmash Capital، وSV Angel، وBroadLight Capital، وCredo Ventures، رفعت إجمالي ElevenLabs إلى 101 مليون دولار وتقدر قيمة الشركة بأكثر من مليار دولار (ارتفاعًا من 100 مليون دولار في يونيو الماضي). يقول الرئيس التنفيذي ماتي ستانيزويسكي إن الأموال الجديدة سيتم تخصيصها لتطوير المنتجات، وتوسيع البنية التحتية وفريق ElevenLabs، وأبحاث الذكاء الاصطناعي و”تعزيز تدابير السلامة لضمان التطوير المسؤول والأخلاقي لتكنولوجيا الذكاء الاصطناعي”.

قال ستانيزيفسكي لـ TechCrunch في مقابلة عبر البريد الإلكتروني: “لقد جمعنا الأموال الجديدة لتعزيز مكانة ElevenLabs كشركة رائدة عالميًا في أبحاث الذكاء الاصطناعي الصوتي ونشر المنتجات”.

تم تأسيس ElevenLabs في عام 2022 بواسطة Piotr Dabkowski، وهو مهندس سابق لتعلم الآلة في Google، وStaniszewski، وهو استراتيجي نشر سابق في Palantir، وتم إطلاق ElevenLabs في مرحلة تجريبية منذ حوالي عام. يقول ستانيزيفسكي إنه ودابكوفسكي، الذي نشأ في بولندا، استوحيا ابتكار أدوات استنساخ الصوت من الأفلام الأمريكية التي لم تُدبلج بشكل جيد. لقد اعتقدوا أن الذكاء الاصطناعي يمكن أن يفعل ما هو أفضل.

اليوم، ربما تشتهر ElevenLabs بتطبيقها لإنشاء الكلام القائم على المتصفح والذي يمكنه إنشاء أصوات نابضة بالحياة مع مفاتيح قابلة للتعديل للتنغيم والعاطفة والإيقاع وغيرها من الخصائص الصوتية الرئيسية. مجانًا، يمكن للمستخدمين إدخال نص والحصول على تسجيل لهذا النص يقرأ بصوت عالٍ بواسطة أحد الأصوات الافتراضية العديدة. يمكن للعملاء الذين يقومون بالدفع تحميل عينات صوتية لصياغة أنماط جديدة باستخدام الاستنساخ الصوتي من ElevenLabs.

تستثمر شركة ElevenLabs بشكل متزايد في إصدارات من تقنيتها لتوليد الكلام التي تهدف إلى إنشاء كتب صوتية ودبلجة الأفلام والبرامج التلفزيونية، بالإضافة إلى توليد أصوات الشخصيات للألعاب والأنشطة التسويقية.

في العام الماضي، أصدرت الشركة أداة “تحويل الكلام إلى كلام” التي تحاول الحفاظ على صوت المتحدث ونبرته ونغمة صوته مع إزالة ضوضاء الخلفية تلقائيًا، وفي حالة الأفلام والبرامج التلفزيونية – تترجم الكلام ومزامنته مع المادة المصدر. تتضمن خريطة الطريق للأسابيع القادمة سير عمل جديد لاستوديو الدبلجة مع أدوات لإنشاء وتحرير النصوص والترجمات وتطبيق جوال قائم على الاشتراك يروي صفحات الويب والنصوص باستخدام أصوات ElevenLabs.

فازت ابتكارات ElevenLabs بالعملاء المبتدئين في Paradox Interactive، مطور الألعاب الذي تشمل مشاريعه الأخيرة Cities: Skylines 2 وStellaris، وThe Washington Post – من بين شركات النشر والإعلام والترفيه الأخرى. يدعي Staniszewski أن مستخدمي ElevenLab أنتجوا ما يعادل أكثر من 100 عام من الصوت وأن النظام الأساسي يستخدمه موظفون في 41% من شركات Fortune 500.

لكن الدعاية لم تكن إيجابية تماما.

استخدمت لوحة الرسائل سيئة السمعة 4chan، والمعروفة بمحتواها التآمري، أدوات ElevenLabs لمشاركة رسائل الكراهية التي تحاكي المشاهير مثل الممثلة إيما واتسون. تمكن جيمس فنسنت من The Verge من الاستفادة من ElevenLabs لاستنساخ الأصوات بشكل ضار في غضون ثوانٍ، وإنشاء عينات تحتوي على كل شيء بدءًا من التهديدات بالعنف إلى الملاحظات العنصرية والمعادية للمتحولين جنسيًا. وفي موقع Vox، وثق المراسل جوزيف كوكس إنشاء نسخة مقنعة بما يكفي لخداع نظام المصادقة الخاص بالبنك.

ردًا على ذلك، حاولت شركة ElevenLabs استئصال المستخدمين الذين ينتهكون بشكل متكرر شروط الخدمة الخاصة بها، والتي تحظر إساءة الاستخدام، وطرحت أداة للكشف عن الكلام الناتج عن نظامها الأساسي. هذا العام، تخطط ElevenLabs لتحسين أداة الكشف لتمييز الصوت من نماذج الذكاء الاصطناعي الأخرى المولدة للصوت والشراكة مع “مشغلات توزيع” غير مسماة لإتاحة الأداة على منصات الطرف الثالث، كما يقول Staniszewski.

تقدم ElevenLabs مجموعة من الأصوات المختلفة، بعضها اصطناعي وبعضها مستنسخ من الممثلين الصوتيين.

واجهت ElevenLabs أيضًا انتقادات من الممثلين الصوتيين الذين يزعمون أن الشركة تستخدم عينات من أصواتهم دون موافقتهم – وهي عينات يمكن الاستفادة منها للترويج لمحتوى لا يؤيدونه أو نشر معلومات خاطئة ومضللة. في مقال نشرته مجلة Vice مؤخرًا، روى الضحايا كيف تم استخدام ElevenLabs في حملات التحرش ضدهم، في أحد الأمثلة لمشاركة المعلومات الخاصة للممثل – عنوان منزلهم – باستخدام صوت مستنسخ.

ثم هناك الفيل الموجود في الغرفة: تمثل منصات التهديد الوجودي مثل ElevenLabs صناعة التمثيل الصوتي.

تكتب موقع Motherboard عن كيفية مطالبة الممثلين الصوتيين بشكل متزايد بالتنازل عن حقوق أصواتهم حتى يتمكن العملاء من استخدام الذكاء الاصطناعي لإنشاء نسخ اصطناعية يمكن أن تحل محلهم في النهاية – وأحيانًا دون تعويض متناسب. الخوف هو أن العمل الصوتي – وخاصة العمل الرخيص المبتدئ – سيتم استبداله في نهاية المطاف بغناء ينتجه الذكاء الاصطناعي، ولن يكون لدى الممثلين أي ملاذ.

تحاول بعض المنصات تحقيق التوازن. في وقت سابق من هذا الشهر، وقعت Replica Studios، وهي منافسة لشركة ElevenLabs، صفقة مع SAG-AFTRA لإنشاء وترخيص نسخ رقمية متماثلة لأصوات أعضاء اتحاد الفنانين الإعلاميين. وفي بيان صحفي، قالت المنظمات إن الترتيب وضع شروطًا وأحكامًا “عادلة” و”أخلاقية” لضمان موافقة فنان الأداء – وتضاعف شروط التفاوض بشأن استخدامات الصوت الرقمي في الأعمال الجديدة.

حتى هذا لم يرضي بعض الممثلين الصوتيين، بما في ذلك أعضاء SAG-AFTRA.

الحل الذي تقدمه ElevenLabs هو سوق للأصوات. حاليًا في مرحلة ألفا ومن المقرر أن يصبح متاحًا على نطاق أوسع في الأسابيع القليلة المقبلة، يتيح السوق للمستخدمين إنشاء صوت والتحقق منه ومشاركته. عندما يستخدم الآخرون صوتًا، يحصل المبدعون الأصليون على تعويض، كما يقول ستانيشفسكي.

وأضاف: “يحتفظ المستخدمون دائمًا بالتحكم في توفر أصواتهم وشروط التعويض”. “تم تصميم السوق كخطوة نحو مواءمة تطورات الذكاء الاصطناعي مع ممارسات الصناعة الراسخة، مع جلب مجموعة متنوعة من الأصوات إلى منصة ElevenLabs أيضًا.”

قد يعترض الممثلون الصوتيون على حقيقة أن ElevenLabs لا تدفع نقدًا، على الأقل ليس في الوقت الحاضر. يحتوي الإعداد الحالي على منشئين يتلقون رصيدًا مقابل خدمات ElevenLabs المتميزة (والتي يجدها البعض مثيرة للسخرية، أراهن).

ربما سيتغير ذلك في المستقبل حيث تحاول شركة ElevenLabs – التي تعد الآن من بين أفضل الشركات الناشئة في مجال الصوت الاصطناعي تمويلًا – التغلب على المنافسة الناشئة مثل Papercup وDeepdub وElevenLabs وAcapela وRespeecher وVoice.ai بالإضافة إلى شركات التكنولوجيا الكبرى مثل مثل أمازون ومايكروسوفت وجوجل. على أي حال، تعتزم شركة ElevenLabs، التي تخطط لزيادة عدد موظفيها من 40 شخصًا إلى 100 بحلول نهاية العام، البقاء – وإحداث موجات – في سوق الصوت الاصطناعي سريع النمو.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى