لاول مرة في Google نموذجًا جديدًا لإضفاء الطابع على الجوزاء

أضافت Google يوم الجمعة نموذجًا جديدًا “تضمينًا” تجريبيًا للنص ، وتضمين الجوزاء ، إلى واجهة برمجة تطبيقات مطور الجوزاء.
يترجم نماذج التضمين مدخلات نصية مثل الكلمات والعبارات إلى تمثيلات عددية ، والمعروفة باسم التضمينات ، التي تلتقط المعنى الدلالي للنص. يتم استخدام التضمينات في مجموعة من التطبيقات ، مثل استرجاع المستندات وتصنيفها ، ويرجع ذلك جزئيًا إلى أنها يمكن أن تقلل من التكاليف مع تحسين الكمون.
تقدم الشركات بما في ذلك Amazon و Cohere و Openai نماذج التضمين من خلال واجهات برمجة التطبيقات الخاصة بها. قدمت Google نماذج تضمين من قبل ، ولكن تضمين الجوزاء هو أول تدريب على عائلة الجوزاء في نماذج الذكاء الاصطناعي.
وقال Google في منشور المدونة: “تم تدريبه على نموذج الجوزاء نفسه ، ورث نموذج التضمين هذا فهم الجوزاء للغة والسياق الدقيق ، مما يجعله قابلاً للتطبيق على مجموعة واسعة من الاستخدامات”. “لقد قمنا بتدريب نموذجنا على أن نكون عامة بشكل ملحوظ ، حيث قدمت أداءً استثنائياً عبر المجالات المتنوعة ، بما في ذلك التمويل والعلوم والقانونية والبحث والمزيد.”
تدعي Google أن تضمين الجوزاء يتجاوز أداء نموذج التضمين المتدرج السابق ، ويحقق النصوص-ويحقق الأداء التنافسي على معايير التضمين الشعبية. بالمقارنة مع Embedding-004 ، يمكن أن يقبل تضمين الجوزاء أيضًا قطعًا أكبر من النص والرمز في وقت واحد ، ويدعم ضعف عدد اللغات (أكثر من 100).
تشير Google إلى أن تضمين الجوزاء في “مرحلة تجريبية” ذات قدرة محدودة ويخضع للتغيير. “[W]وكتبت الشركة في منشور مدونتها:
اكتشاف المزيد من مجلة كوكان
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.