Российская научно-исследовательская компания Smart Engines, лидер на рынке распознавания документов, отчиталась о научных результатах за 2023 год.
В прошлом году исследователи компании опубликовали 41 научную работу в международных и российских изданиях, получили 25 патентов, зарегистрировали 10 программных компонентов, представили больше 20 докладов на конференциях и сделали ряд научных открытий.
Из 34 научных статей 4 были опубликованы в журналах первого квартиля (Q1) Web of Science (WoS), 11 статей – в журналах уровня Q1 по базе Scopus.
Двое сотрудников компании защитили диссертации на соискание степени доктора технических наук, а еще двое – на соискание степени кандидата технических наук. Четырем специалистам Smart Engines, преподающим на кафедре когнитивных технологий МФТИ (базой которой является компания Smart Engines), было присвоено звание доцентов.
В 2023 году ученые Smart Engines выступили на четырех российских и международных конференциях. Одна из них – 17-я Международная конференция по анализу и распознаванию документов (ICDAR 2023), ведущая (CORE A) конференция в области распознавания документов в мире. Специалисты компании выступали также на Лондонской встрече по визуализации (LIM 2023), 16-й Международной конференции по машинному зрению (ICMV 2023) и 65-й Всероссийской научной конференции МФТИ. В общей сложности ученые Smart Engines представили больше 20 докладов на этих конференциях.
В августе 2023 года исследователи Smart Engines представили первый в мире публичный аннотированный корпус (датасет) изображений документов с голограммами MIDV-Holo. С помощью MIDV-Holo разработчики со всего мира могут обучать свои ИИ алгоритмы лучше бороться с атаками на предъявления (presentation attack) и атаками ретрансляции (rebroadcast attack), которые совершают мошенники, когда фотошопят паспорта.
Один из важнейших научных результатов Smart Engines был представлен в статье, опубликованной в журнале Expert Systems with Applications (Q1 WoS). В ней был представлен уникальный протокол автоматизированного нейросетевого детектированием коронавируса методом КТ, в котором уменьшена доза рентгеновского облучения пациента без значимого влияния на качество диагностики.
В апреле 2023 журнал Mathematics (Q1 WoS) опубликовал новое исследование сотрудников компании, в котором они представили новый, понейронный подход к обучению квантованных нейронных сетей малых разрядностей. Такие нейронные сети работают в разы быстрее классических аналогов, а предложенный подход прост в реализации и позволяет добиться такого же качества, как и более сложные методы.
Также наши специалисты разработали новую универсальную архитектуру для робастной оценки гипотез PESAC (Parallel Efficient Sample Consensus), позволяющую реализовать широкий класс современных алгоритмов и обеспечить ускорение локализации и прослеживания документов в 2-3 раза (относительно других архитектур RANSAC) на центральных процессорах за счет эффективной организации данных и параллельной обработки. Этот результат был опубликован в междисциплинарном журнале IEEE Access (Q1 Scopus).
Ученые компании также представили работу, посвященную быстрой детекции машиночитаемой зоны (MRZ) для распознавания документов на мобильных устройствах. В основе представленного исследователями алгоритма детекции лежит авторская архитектура нейросети, которая находит MRZ всего за 16 миллисекунд на iPhone SE 2020. Иначе говоря, на мобильном процессоре 2019 года выпуска частота детекции составляет 62 кадра в секунду. Описанная в статье технология уже применяется для распознавания MRZ в системе Smart ID Engine, которая позволяет вводить паспортные данные в 20 раз быстрее и в 2 раза точнее квалифицированного оператора.
В 2023 году российская научно-исследовательская компания Smart Engines получила 25 патентов – этот показатель стал рекордным в истории разработчика. В основу патентов легли изобретения 70 сотрудников, занимающихся разработкой уникальных технологических решений для распознавания и проверки подлинности документов, банковских карт, штрихкодов.
Сразу на шесть изобретений ученые Smart Engines в 2023 году получили патенты в США. Компания защитила патентами ряд своих ключевых технологий: метод идентификации документов, метод интеграции кадров в видеопотоке, метод остановки распознавания текста в видеопотоке и метод использования преобразования Хафа в сетях. Еще один патент компания получила на ключевое изобретение в сфере компьютерной томографии. Это абсолютный рекорд для российского разработчика, поскольку до этого на счету компании был только один американский патент, полученный в 2019 году. Запатентованные решения уже используются в программных продуктах компании Smart Engines для автономного распознавания паспортов, ID-карт и других документов.
Проекты компании были реализованы при финансовой поддержке Российского фонда развития информационных технологий (РФРИТ входит в группу ВЭБ.РФ) в рамках нацпроекта “Цифровая экономика” и Фонда содействия инновациям.
“Развитие фундаментальной науки и технологического потенциала – важнейшие составляющие стратегии успеха нашей компании. Мы считаем, что развитие технологий невозможно без развития научной базы, без развития собственной научной школы. Нужно сказать, что 2023 год удался как с точки зрения бизнеса компании, — мы получили рекордную выручку и прибыль—, так и научной точки зрения. Наши сотрудники показали себя отличными исследователями и изобретателями и опять превзошли наши ожидания!”, – прокомментировал генеральный директор Smart Engines, доктор технических наук Владимир Арлазаров.