Генеральный директор компании Smart Engines, д.т.н. Владимир Арлазаров выступил на международной конференции AI Journey.
Он рассказал, как научные достижения в области компьютерного зрения помогают компании создавать новые программные продукты, необходимые бизнесу. Компания Smart Engines является лидером на рынке распознавания документов, а ее системы используют ведущие российские банки, сотовые операторы, страховые компании и финтех.
В своём выступлении Владимир Арлазаров объяснил, какие именно научные разработки используются при создании систем распознавания паспорта, документов с печатным и рукописным заполнением, корпоративных документов с таблицами, банковских карт и баркодов, решений для проверки подлинности и биометрической сверки лиц. Всего в докладе были представлены свыше двух десятков технологий.
Так, с повсеместным распространением переводов по СБП, крайне актуальна стала задача распознавания номеров телефонов. Ее ключевой особенностью является написание людьми различных комбинаций цифр, тире, скобочек, точек и других сепараторов. Для решения этой задачи в Smart Engines был разработан оригинальный способ комбинирования метода Виолы и Джонса и древовидной архитектуры детектирования объекта.
Для решения задачи распознавания рукописного текста в документах используются рекуррентные нейронные сети.
Генеральный директор Smart Engines Владимир Арлазаров рассказал не только о технологиях сегодняшнего, но и о технологиях “завтрашнего дня” и, в частности, про 4,6-битные нейросети: “Задача эффективного исполнения нейронных сетей на конечных устройствах стала не просто актуальной, а приобрела первостепенную важность. Прямо сейчас большая часть пользовательских устройств оснащены центральными процессорами. Мировым стандартом для них является использование 8-битных нейронных сетей. Однако глубокие нейронные сети на сегодняшний день усложняются, содержат сотни миллионов коэффициентов и требуют большей вычислительной мощности. Поэтому мы предложили качественное улучшение 8-битной модели, эффективно использующее архитектурные особенности центральных процессоров мобильных устройств: 4.6-битные сети”.
Представленные на AI Journey разработки внедрены во все программные продукты компании. С их помощью сегодня в России ежемесячно считывается более 50 млн QR-кодов и банковских карт для совершения платежей, миллионы паспортов и других документов в процессах дистанционного и выездного обслуживания.