วันนี้ Volcano Engine ซึ่งเป็นแพลตฟอร์มบริการคลาวด์ที่ ByteDance เป็นเจ้าของ ประกาศว่ารุ่น beanbao รองรับฟีเจอร์ใหม่ของการโทรด้วยเสียงแบบเรียลไทม์
มีรายงานว่าโซลูชันโต้ตอบสนทนา AI แบบเรียลไทม์ที่ให้บริการโดย Volcano Engine ผสมผสานแพลตฟอร์มบริการโมเดลขนาดใหญ่ Volcano Ark เข้ากับโมเดลการรู้จำและสังเคราะห์เสียงพูดของ Doubao เพื่อลดความซับซ้อนของกระบวนการแปลงคำพูดเป็นข้อความและข้อความเป็นคำพูด โซลูชันนี้ช่วยให้สามารถรวบรวม ประมวลผล และส่งข้อมูลเสียงได้อย่างมีประสิทธิภาพ โดยให้บทสนทนาอัจฉริยะที่ยอดเยี่ยมและความสามารถในการประมวลผลภาษาธรรมชาติ
Volcano Engine RTC ใช้เทคโนโลยีการประมวลผลเสียง 3A ซึ่งแก้ไขปรากฏการณ์ "การพูดสองครั้ง" ได้อย่างมีประสิทธิภาพ และรับประกันความแม่นยำและประสิทธิภาพการรู้จำเสียงแบบเรียลไทม์ ในเวลาเดียวกัน เครือข่ายการส่งผ่าน WebRTC ถูกนำมาใช้เพื่อให้ได้รับบริการส่งเสียงและวิดีโอแบบเรียลไทม์ที่มีความหน่วงต่ำเป็นพิเศษ มีเสถียรภาพและเชื่อถือได้ทั่วโลก
Volcano Engine ยังนำเสนอโซลูชันการเข้าถึงที่ยืดหยุ่นและหลากหลาย รวมถึงโซลูชันการบูรณาการตนเองและโซลูชันเครือข่ายการส่งข้อมูลที่ใช้โปรโตคอลมาตรฐาน WebRTC เพื่อตอบสนองความต้องการเฉพาะขององค์กรต่างๆ
นอกจากนี้ บริการโต้ตอบแบบเรียลไทม์หลายรูปแบบขนาดใหญ่ของ Volcano Engine ยังมอบความสามารถด้านเสียงแบบเรียลไทม์ของ AI สำหรับแอปพลิเคชันแชทด้วยตัวละครเสมือน AI ระดับหัวหน้าในประเทศบางรายการ ซึ่งนำมาซึ่งประสบการณ์เชิงโต้ตอบแบบใหม่ Volcano Engine จะยังคงมอบความสามารถด้านเสียงและวิดีโอคุณภาพสูง รวมถึงความสามารถด้าน AI ต่อไป เพื่อช่วยให้องค์กรต่างๆ บรรลุนวัตกรรมในด้านเสียงและวิดีโอแบบเรียลไทม์ของ AI