Вернуться к списку номинантов
VK Звонки
За первую в мире платформу видеоконференцсвязи без ограничений на число участников
В VK Звонках пользователи могут включить автоматические субтитры и в реальном времени следить за ходом встречи в текстовом формате. С функцией расшифровки речь спикеров на встрече автоматически преобразуется в текст и сохраняется в чате звонка после его окончания. Новые возможности доступны всем пользователям VK Звонков бесплатно.
Функции увеличивает доступность сервиса и расширяет его возможности для рабочих задач. Пользователям не нужно тратить ресурсы и время на ручную транскрибацию и написания саммари встреч. А с помощью субтитров можно быть активным участником звонка и следить за происходящим даже без звука.
Технология текстовой расшифровки встреч и генерации автоматических субтитров в реальном времени в VK Звонках работает на нескольких нейросетевых моделях, адаптирована под высокие нагрузки и минимальные задержки. Модель умеет с минимальной задержкой определять, какие лексические единицы есть в аудиопотоке и переводить их в текст для пользователя — latency отображения транскрипта в среднем составляет 200 мс.
Архитектура нейросетей оптимизирована для того, чтобы позволять одновременно обрабатывать десятки тысяч звонков, в обучении использовался кастомный датасет, который позволяет модели давать лучшие результаты для обычной речи пользователей VK Звонков. Для работы функций нет ограничений на число участников звонка и длительности встречи.
Ссылка на проект >>