Model besar ByteDance Beanbao mendukung panggilan suara waktu nyata: dapat diinterupsi kapan saja dan ditanggapi secara waktu nyata.

Hari ini, Volcano Engine, platform layanan cloud milik ByteDance, mengumumkan bahwa model beanbao telah mendukung fitur baru panggilan suara real-time.

Dilaporkan bahwa solusi interaksi real-time AI percakapan yang disediakan oleh Volcano Engine menggabungkan platform layanan model besar Volcano Ark dan pengenalan suara serta model sintesis Doubao untuk menyederhanakan proses konversi ucapan-ke-teks dan teks-ke-ucapan. Solusi ini mencapai pengumpulan, pemrosesan, dan transmisi data suara yang efisien, memberikan dialog cerdas yang sangat baik dan kemampuan pemrosesan bahasa alami.

Volcano Engine RTC didasarkan pada teknologi pemrosesan audio 3A, yang secara efektif memecahkan fenomena "berbicara ganda" dan memastikan keakuratan dan kinerja pengenalan suara secara real-time. Pada saat yang sama, jaringan transmisi WebRTC digunakan untuk mencapai layanan transmisi audio dan video real-time dengan latensi sangat rendah, stabil dan andal di seluruh dunia.

Volcano Engine juga menyediakan solusi akses yang fleksibel dan beragam, termasuk solusi integrasi mandiri dan solusi jaringan transmisi berdasarkan protokol standar WebRTC, untuk memenuhi kebutuhan spesifik berbagai perusahaan.

Selain itu, layanan interaktif real-time multi-modal model besar dari Volcano Engine telah menyediakan kemampuan suara real-time AI untuk beberapa aplikasi obrolan karakter virtual AI tingkat kepala domestik, sehingga menghadirkan pengalaman interaktif baru. Volcano Engine akan terus menghadirkan kemampuan audio dan video berkualitas tinggi serta kemampuan AI untuk membantu perusahaan mencapai inovasi di bidang AI audio dan video real-time.