Большие данные и машинное обучение

В Екатеринбурге при поддержке Уральского центра систем безопасности прошел Датазавтрак сообщества «ML EKB»

Работа с большими данными и машинное обучение находят все большее применение в решении различных промышленных задач. Основы работы с данными и создание интеллектуальных систем сейчас преподаются в учебных программах многих вузов, компании создают подразделения для решения этих задач. Быстро развивающаяся отрасль требует от data-специалистов широких знаний, которые эффективнее всего можно получить, общаясь в сообществе коллег-единомышленников. Одним из таких сообществ является «ML EKB», участники которого устраивают мероприятия по обмену опытом, в том числе – в формате Датазавтраков. Раз в полгода Датазавтрак проходит на площадке компании УЦСБ.

Темы встреч могут быть самыми разными: от преподавания ML до прикладных задач и проектов. Тематика Датазавтраков УЦСБ традиционно касается применения больших данных и ML в задачах безопасности. В этот раз вниманию участников были представлены доклады о создании цифровых двойников, разработке надежных и безопасных моделей машинного обучения и применении ML в электроэнергетике.

Дмитрий Колодезев, директор компании «Промсофт» (Новосибирск), выступил с докладом «Устойчивость ML-моделей. Как надо дообучать модель и как делать это правильно». Дмитрий является экспертом в вопросах создания эффективных и безопасных ML решений. Он рассказал, на что необходимо обращать внимание при реализации проекта ML, с какими сложностями обычно сталкиваются разработчики, какие подходы и какое программное обеспечение можно применять, чтобы избежать этих сложностей.

Михаил Гущин, научный сотрудник лаборатории методов анализа больших данных ФКН НИУ ВШЭ представил доклад «Не DALL-E: Генеративные модели в науке и индустрии». Он рассказал, как с помощью генеративных нейронных сетей создать новые искусственные объекты, которые помогут решать задачи в науке и производстве. Например, такие подходы позволяют численно обнаружить новые физические свойства («новую физику») или заранее предсказать выход системы из строя.

«Несмотря на то, что генеративная модель прежде всего известна нам как отличный генератор картинок и текстов, мы можем использовать ее практически везде. Генеративными моделями можно получать не только точечную оценку, но и в целом распределение тех значений, которые мы хотим предсказывать. Затем уже по этим распределениям мы можем оценивать доверительные интервалы, тем самым определяя, насколько модель точна в своем прогнозе. С использованием таких прогнозов можно принимать решения гораздо точнее и безопаснее», – подвел итог Михаил.

Заведующий научной лабораторией цифровых двойников в электроэнергетике Уральского федерального университета Александра Хальясмаа и ведущий научный сотрудник лаборатории Павел Матренин рассказали про особенности использования машинного обучения в электроэнергетике на примерах своих реальных отраслевых проектов. Представили разработки лаборатории в области безопасного и объяснимого искусственного интеллекта, которые позволяют снизить риски ошибок при использовании машинного обучения на объектах электроэнергетики. Доклад вызвал множество вопросов и горячее обсуждение.

Итоги мероприятия подвел Юрий Чернышов, к.ф.-м.н., доцент УрФУ и руководитель исследовательского центра УЦСБ. Он отметил увеличивающуюся важность автоматизации задач в информационной безопасности и растущую роль больших данных, поблагодарил докладчиков и участников мероприятия, а также пригласил присоединяться к сообществу ML разработчиков.

Полное видео с Датазавтрака можно посмотреть на YouTube-канале компании УЦСБ.

 

 

Похожие записи