ByteDance Beanbao 대형 모델은 실시간 음성 통화를 지원합니다. 언제든지 중단하고 실시간으로 응답할 수 있습니다.

오늘 ByteDance가 소유한 클라우드 서비스 플랫폼인 Volcano Engine은 beanbao 모델이 실시간 음성 통화의 새로운 기능을 지원했다고 발표했습니다.

볼케이노엔진이 제공하는 대화형 AI 실시간 상호작용 솔루션은 볼케이노방주 대형모델 서비스 플랫폼과 두바오(Doubao)의 음성인식 및 합성 모델을 결합해 음성-텍스트, 텍스트-음성 변환 과정을 단순화한 것으로 알려졌다. 이 솔루션은 효율적인 음성 데이터 수집, 처리 및 전송을 달성하여 탁월한 지능형 대화 및 자연어 처리 기능을 제공합니다.

Volcano Engine RTC는 오디오 3A 처리 기술을 기반으로 하여 "이중 말하기" 현상을 효과적으로 해결하고 음성 인식의 정확성과 실시간 성능을 보장합니다. 동시에 WebRTC 전송 네트워크는 전 세계적으로 초저지연, 안정적이고 신뢰할 수 있는 실시간 오디오 및 비디오 전송 서비스를 달성하는 데 사용됩니다.

Volcano Engine은 또한 WebRTC 표준 프로토콜을 기반으로 하는 자체 통합 솔루션 및 전송 네트워크 솔루션을 포함하여 유연하고 다양한 액세스 솔루션을 제공하여 다양한 기업의 특정 요구 사항을 충족합니다.

또한 Volcano Engine의 대형 모델 다중 모드 실시간 대화형 서비스는 국내 일부 수석 AI 가상 캐릭터 채팅 애플리케이션에 AI 실시간 음성 기능을 제공하여 새로운 대화형 경험을 선사합니다. Volcano Engine은 기업이 AI 실시간 오디오 및 비디오 분야에서 혁신을 이룰 수 있도록 고품질 오디오 및 비디오 기능과 AI 기능을 지속적으로 제공할 것입니다.