Сегодня Volcano Engine, платформа облачных сервисов, принадлежащая ByteDance, объявила, что модель beanbao поддерживает новую функцию голосовых вызовов в реальном времени.
Сообщается, что решение для диалогового взаимодействия в реальном времени с искусственным интеллектом, предоставляемое Volcano Engine, сочетает в себе сервисную платформу больших моделей Volcano Ark и модель распознавания и синтеза речи Doubao для упрощения процесса преобразования речи в текст и текста в речь. Это решение обеспечивает эффективный сбор, обработку и передачу речевых данных, обеспечивая превосходные возможности интеллектуального диалога и обработки естественного языка.
Volcano Engine RTC основан на технологии обработки звука 3A, которая эффективно решает проблему «двойной речи» и обеспечивает точность и производительность распознавания речи в реальном времени. В то же время сеть передачи WebRTC используется для обеспечения сверхнизкой задержки, стабильных и надежных услуг передачи аудио и видео в реальном времени по всему миру.
Volcano Engine также предоставляет гибкие и разнообразные решения доступа, включая решения для самоинтеграции и решения для сетей передачи данных на основе стандартного протокола WebRTC, для удовлетворения конкретных потребностей различных предприятий.
Кроме того, крупномасштабная мультимодальная интерактивная служба реального времени Volcano Engine предоставила голосовые возможности искусственного интеллекта в реальном времени для некоторых отечественных приложений чата с виртуальными персонажами искусственного интеллекта на уровне головы, предоставляя новый интерактивный опыт. Volcano Engine продолжит предоставлять высококачественные аудио и видео возможности, а также возможности искусственного интеллекта, чтобы помочь предприятиям достичь инноваций в области аудио и видео искусственного интеллекта в реальном времени.