14.06.2021

«ВКонтакте» прокачала технологию распознавания голосовых сообщений

Разработчики приложения «ВКонтакте» заявили об усовершенствовании своей технологии распознавания голосовых сообщений. По заявлению представителей социальной сети, на преобразование двухминутных аудиосообщений в текст теперь уходит менее секунды.

ВКонтакте

Аналитики «ВКонтакте» отметили, что голосовые сообщения по-прежнему остаются одним из самых популярных вложений в одноимённом мессенджере. При этом технология распознавания была запущена лишь в июне 2020 года. По статистике, преобразованием голоса в текст пользуются 33 миллиона человек ежемесячно.

В среднем каждый пользователь ежедневно читает 8 расшифровок. При этом продолжительность 99% аудио не превышает двух минут. Для ускорения распознавания разработчики предусмотрели интересное технологическое решение: запись делится на несколько коротких блоков, которые распознаются синхронно. Из получившихся фрагментов компилируется единое сообщение.

Распознавание голосовых сообщений полностью автоматизировано. Для тренировки нейросетей «ВКонтакте» регулярно использует записи, предоставленные участниками программы VK Testers. С обновлением алгоритма распознавания разработчики добавили возможность записи голосового сообщения с максимальной длительностью 60 минут. 

Источник: vk.com

Поделиться ссылкой: