Hoy, Volcano Engine, una plataforma de servicios en la nube propiedad de ByteDance, anunció que el modelo Beanbao admite la nueva función de llamadas de voz en tiempo real.
Se informa que la solución de interacción conversacional en tiempo real de IA proporcionada por Volcano Engine combina la plataforma de servicio de modelo grande Volcano Ark y el modelo de síntesis y reconocimiento de voz de Doubao para simplificar el proceso de conversión de voz a texto y de texto a voz. Esta solución logra una recopilación, procesamiento y transmisión eficiente de datos de voz, proporcionando excelentes capacidades de diálogo inteligente y procesamiento del lenguaje natural.
Volcano Engine RTC se basa en la tecnología de procesamiento de audio 3A, que resuelve eficazmente el fenómeno del "doble habla" y garantiza la precisión y el rendimiento en tiempo real del reconocimiento de voz. Al mismo tiempo, la red de transmisión WebRTC se utiliza para lograr servicios de transmisión de audio y video en tiempo real estables, confiables y de latencia ultrabaja en todo el mundo.
Volcano Engine también proporciona soluciones de acceso flexibles y diversas, incluidas soluciones de autointegración y soluciones de red de transmisión basadas en el protocolo estándar WebRTC, para satisfacer las necesidades específicas de diferentes empresas.
Además, el servicio interactivo multimodal en tiempo real de modelo grande de Volcano Engine ha proporcionado capacidades de voz de IA en tiempo real para algunas aplicaciones nacionales de chat de personajes virtuales de IA a nivel de cabeza, brindando una nueva experiencia interactiva. Volcano Engine continuará brindando capacidades de audio y video de alta calidad y capacidades de IA para ayudar a las empresas a lograr la innovación en el campo del audio y video de IA en tiempo real.