يدعم الطراز الكبير ByteDance Beanbao المكالمات الصوتية في الوقت الفعلي: يمكن مقاطعتها في أي وقت والرد عليها في الوقت الفعلي.

أعلنت اليوم Volcano Engine، وهي منصة خدمات سحابية مملوكة لشركة ByteDance، أن نموذج beanbao يدعم الميزة الجديدة للمكالمات الصوتية في الوقت الفعلي.

يُذكر أن حل التفاعل في الوقت الفعلي للذكاء الاصطناعي للمحادثة الذي توفره Volcano Engine يجمع بين منصة خدمة النموذج الكبير Volcano Ark ونموذج التعرف على الكلام وتوليفه من Doubao لتبسيط عملية تحويل الكلام إلى نص وتحويل النص إلى كلام. يحقق هذا الحل كفاءة في جمع البيانات الصوتية ومعالجتها ونقلها، مما يوفر حوارًا ذكيًا ممتازًا وقدرات معالجة اللغة الطبيعية.

يعتمد Volcano Engine RTC على تقنية معالجة الصوت 3A، والتي تحل بشكل فعال ظاهرة "التحدث المزدوج" وتضمن الدقة والأداء في الوقت الفعلي للتعرف على الكلام. وفي الوقت نفسه، يتم استخدام شبكة نقل WebRTC لتحقيق زمن انتقال منخفض للغاية وخدمات نقل صوت وفيديو مستقرة وموثوقة في الوقت الفعلي في جميع أنحاء العالم.

يوفر Volcano Engine أيضًا حلول وصول مرنة ومتنوعة، بما في ذلك حلول التكامل الذاتي وحلول شبكات النقل استنادًا إلى بروتوكول WebRTC القياسي، لتلبية الاحتياجات المحددة للمؤسسات المختلفة.

بالإضافة إلى ذلك، قدمت الخدمة التفاعلية الكبيرة متعددة الوسائط في الوقت الفعلي لـ Volcano Engine إمكانات صوتية في الوقت الفعلي تعمل بالذكاء الاصطناعي لبعض تطبيقات الدردشة الافتراضية للشخصيات الافتراضية التي تعمل بالذكاء الاصطناعي على مستوى الرأس، مما يوفر تجربة تفاعلية جديدة. سيستمر Volcano Engine في توفير إمكانات صوت وفيديو عالية الجودة وقدرات الذكاء الاصطناعي لمساعدة المؤسسات على تحقيق الابتكار في مجال الصوت والفيديو في الوقت الفعلي بالذكاء الاصطناعي.