Речевой движок усовершенствован — Журнал Мобильные Телекоммуникации

Компания 3iTech усовершенствовала акустическую модель движка распознавания речи 3i ASR.

Это позволило на 20% снизить вероятность возникновения ошибки при распознавании речи, и за счет этого повысить качество решения бизнес-задач.

Акустическая модель используется в системах распознавания речи для преобразования речевого сигнала в гипотезы букв, которые затем выстраиваются в связный текст при помощи языковой модели. От качества получаемых текстов зависит точность и корректность решения бизнес-задач. Обновление акустической модели речевого движка 3i ASR, позволило на 20% снизить вероятность ошибки (WER, Word Error Rate) на тестовых выборках, охватывающих широкий круг акустических условий, в том числе сложных. Для этого была проведена модификация архитектуры нейронной сети, которая позволила не только повысить точность, но и существенно сократить число обучаемых параметров. Кроме того, был запущен процесс перехода к непрерывному циклу самообучения моделей.

Речевой движок 3i ASR применяется в системе речевой аналитики 3i TouchPoint Analytics и в платформе 3i VOX, которые используются для решения различных бизнес-задач: от построения enterprise систем речевой аналитики до интеллектуальных разговорных ботов. Разработки компании 3iTech применяются для контроля качества обслуживания и выявления лучших практик продаж в банках, ритейле, и контакт-центрах крупных девелоперов.

«По качеству распознавания речи наши продукты входят в число лучших на российском рынке. В своих разработках мы используем передовые технологии машинного обучения. Наши специалисты регулярно обучают акустическую и языковую модели. Изменение структуры акустической модели не только заметно повысило точность обработки голосовых данных, но и открыло возможности для перехода к ее самообучению. То есть в будущем наши системы смогут совершенствоваться автоматически», – говорит Алексей Любимов, основатель и генеральный директор компании 3iTech.

О компании

3iTech – бренд российской компании «ДСС Лаб», разработчика речевых технологий, голосовой биометрии, а также специализированных продуктов и сервисов для интеллектуальной обработки неструктурированных данных. Компания обладает уникальными технологическими компетенциями в сфере разработки и построения сложных информационно-аналитических систем и платформенных решений для анализа текстовой и аудио-информации с применением собственных разработок и технологий на базе AI/ML/NLP.

Пн	Вт	Ср	Чт	Пт	Сб	Вс
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30

Похожие записи

Премия вручена

Совместимость для высокой доступности данных

Совместимость для высокой доступности данных

Компания в рейтинге

Компания в рейтинге