Компания Smart Engines получила американский патент на фирменную разработку.
С ее помощью ИИ может восстанавливать параметры трехмерного пространства по двумерному снимку. Ученые предложили использовать преобразования Хафа в качестве слоев нейронной сети, благодаря чему нейросети – при снижении числа обучающих параметров в 100 раз – значительно лучше справляются с базовыми задачами компьютерного зрения.
В частности, теперь ИИ может легко обнаруживать частично заслоненные объекты и достраивать их форму. Это шестой патент США, который получили ученые Smart Engines в 2023 году.
Новая технология может применяться для решения широкого класса задач – начиная от систем распознавания документов и заканчивая беспилотными транспортными системами.
Запатентованная учеными Smart Engines нейросетевая архитектура объединяет блоки, используемые в нейросетях, с классическим инструментом анализа изображений реального мира – преобразованием Хафа. Эти два механизма дополняют друг друга. Хаф-анализ часто используется для поиска и выделения прямых, таких как строки текста или границы объектов — дорог, домов, документов. А сверточные слои нейросети в свою очередь помогают решить задачу классификации обнаруженных отрезков.
“Механизм работы выглядит так. Первый блок сверточных слоев нейросети строит локальные признаки точек изображения. Затем преобразование Хафа интегрирует значения локальных признаков вдоль прямых, в результате чего появляется возможность посчитать сложные нелинейные статистики – например, дисперсию. Сверточные слои после преобразования Хафа работают с этими статистиками вдоль прямых. Следующий этап – транспонирование, после чего происходит переход карт признаков в исходные координаты. На последнем этапе полученный результат обрабатывается еще одним блоком сверхточных слоев, в результате чего мы получаем изображение в исходных координатах, но в каждой его точке накоплена информация со всего изображения, – комментирует руководитель отдела машинного обучения Smart Engines, к.т.н. Александр Шешкус.
Хафовские нейросети могут гораздо лучше справляться с задачей поиска точек схода, определения форм и выделения контуров объектов, а также лучше детектируют протяженные или частично заслоненные объекты.
Важным аспектом данного изобретения является то, что полученные нейросетевые архитектуры более устойчивы к широкому спектру атак на ИИ. Так, даже замещение части изображения не станет препятствием для обнаружения объекта. Например, если на изображении с дорогой точка схода случайно или намеренно заслонена каким-то объектом — Хафовская нейронная сеть все равно ее найдет.
Нередко точка схода может быть перекрыта посторонними объектами – рекламными щитами, другими автомобилями, грузовиками и т.д.
Если край документа на входящем изображении перекрыт пальцем – искусственный интеллект, зная форму документа, сможет легко ее восстановить.
Это изобретение Smart Engines запатентовала в США, получив таким образом уже шестой американский патент на свои разработки в 2023 году. Ранее она получила патенты США на ряд своих ключевых изобретений – метод идентификации документов, метод интеграции кадров в видеопотоке, метод остановки распознавания текста в видеопотоке и метод использования преобразования Хафа в сетях. Еще один патент компания получила на ключевое изобретение в сфере компьютерной томографии. Запатентованные решения уже используются в программных продуктах компании Smart Engines для автономного распознавания паспортов, ID-карт и других документов.