Эксперты 3i Technologies разработали новый движок распознавания речи 3i ASR 2.0.
Он позволит заметно улучшить качество работы продуктов и сервисов компании.
Благодаря 3i ASR 2.0 системы смогут точнее понимать живую человеческую речь. Движок будет использоваться как в новых продуктах и сервисах компании, так и в тех, которые уже представлены на рынке.
Новый движок построен на базе end-to-end архитектуры с использованием нейросетей и машинного обучения (machine learning). Он обучен на выборке в несколько тысяч часов с аугментацией данных (внесением разных типов искажений). Это позволило значительно снизить уровень относительной ошибки и повысить качество распознавания живой речи.
Вычислительная инфраструктура реализована с ускорением на GPU, что позволяет получать многократный прирост производительности относительно CPU. Новый движок дает возможность распознавать массивы речевой информации в более чем сто раз быстрее их реального звучания.
«Технологии распознавания речи и системы, созданные с их использованием, меняют привычные сервисы. Все уже сталкивались с тем, что речевую систему можно встретить в контакт-центре, позвонив в техподдержку. Нас прекрасно понимают электронные устройства, когда мы голосом диктуем, например, поисковый запрос. Продукты 3i Technologies контролируют диалоги сотрудников транспортных компаний с клиентами или общение работников ритейла. По «голосу» мы выявляем телефонных мошенников. B c каждым днем сфера применения речевых технологии расширяется, при этом компании становятся все более требовательными к качеству распознавания и скорости обработки речевой информации. И новый движок – это ощутимый шаг вперед», — говорит Алексей Любимов, председатель совета директоров 3i Technologies.
Движок 3i ASR 2.0 будет интегрирован в облачный сервис для профессиональной обработки речевых данных 3i Speech Recognition, в облачную платформу речевой аналитики 3i Touchpoint Analytics и другие продукты и сервисы компании. Миграция на новый движок произойдет бесшовно.
О компании
3i Technologies основана группой российских разработчиков в 2014 году. Специализируется на создании технологий, продуктов и сервисов интеллектуальной обработки больших массивов данных различной природы и, прежде всего, текстовых и аудиовизуальных. 3i Technologies обладает уникальными технологиями поиска, обработки и анализа текстовой, аудио- и видеоинформации, которые защищены патентами и авторскими свидетельствами. Программные решения 3i Technologies внедрены у клиентов, работающих в РФ и странах СНГ.