本日、ByteDance が所有するクラウド サービス プラットフォームである Volcano Engine は、beanbao モデルがリアルタイム音声通話の新機能をサポートしたと発表しました。
Volcano Engine が提供する会話型 AI リアルタイム インタラクション ソリューションは、Volcano Ark 大型モデル サービス プラットフォームと Doubao の音声認識および合成モデルを組み合わせて、音声からテキストへの変換およびテキストから音声への変換プロセスを簡素化すると報告されています。このソリューションは効率的な音声データの収集、処理、送信を実現し、優れたインテリジェントな対話と自然言語処理機能を提供します。
Volcano Engine RTC はオーディオ 3A 処理テクノロジーに基づいており、「二重スピーキング」現象を効果的に解決し、音声認識の精度とリアルタイム パフォーマンスを保証します。同時に、WebRTC 伝送ネットワークは、超低遅延、安定性と信頼性の高いリアルタイムのオーディオおよびビデオ伝送サービスを世界中で実現するために使用されます。
Volcano Engine は、さまざまな企業の特定のニーズを満たすために、自己統合ソリューションや WebRTC 標準プロトコルに基づく伝送ネットワーク ソリューションなど、柔軟で多様なアクセス ソリューションも提供します。
さらに、Volcano Engine の大規模モデル マルチモーダル リアルタイム インタラクティブ サービスは、国内の一部のヘッドレベル AI 仮想キャラクター チャット アプリケーションに AI リアルタイム音声機能を提供し、新しいインタラクティブ エクスペリエンスをもたらしました。 Volcano Engine は今後も高品質のオーディオおよびビデオ機能と AI 機能を提供し、企業が AI リアルタイム オーディオおよびビデオの分野でイノベーションを達成できるよう支援します。