Мировой лидер в сфере систем хранения данных корпорация EMC представляет решение Data lake 2.0 на базе платформы EMC ISILON, которое является ключевым фактором перехода от классического ИТ к цифровой экономике.
EMC Ision Data Lake 2.0 объединяет все данные компании в единый репозиторий, оптимизирует работу с неструктурированными данными и служит фундаментом для решений по аналитике данных.
Согласно исследованию, корпорации EMC, 99% мировых данных не проанализированы и являются «сырыми» данными. В большинстве случаев этот огромный пласт информации становится «теневым»: данные складируются, архивируются или просто уничтожаются. Без нового подхода к сбору, хранению и обработке этих данных они не станут топливом для цифровой экономики.
Цифровая экономика, драйвер развития современного общества, полностью основана на данных. По разным оценкам, цифровая экономика составляет от 3 до 16% ВВП стран большой двадцатки. При этом ее вес в росте ВВП может доходить до 21%. По оценке РАЭК, объем цифровой экономики в РФ составляет 1 трлн. рублей — около 1,5% от ВВП. У РФ есть огромный потенциал роста цифровой экономики, даже при достижении среднего показателя G20 в 3.4% — это более, чем двукратный рост.
Цифровая экономика уже сейчас генерирует новые идеи в бизнесе. Достаточно посмотреть на верхнюю десятку всем известных компаний- eдинорогов — Airbnb, Uber и.т.д. Их фантастический рост заключается в умении трансформировать накопленные данные в прибыль. Постепенно цифровая экономика охватывает все новые отрасли: промышленность, транспорт, науку, что существенно увеличивает эффект роста ВВП.
Цифровая экономика позволяет существенно поднять производительность труда за счет новых подходов в работе персонала и мобильных приложений и уменьшить расходы благодаря сбору и анализу информации, в том числе анализа с предсказанием.
Большая часть генерируемых мировым сообществом данных является неструктурированными. Их рост составит 133 Экзабайта к 2017 году, то есть почти вдвое превысит объем данных 2015 года. Это происходит за счет стремительного расширения источников данных: все возрастающего проникновения Интернета вещей, мобильных устройств, социальных сетей, датчиков, систем видеонаблюдения, а также ресурсоемких научных исследований.
Рост данных, множественность подходов к их обработке требуют новой архитектуры хранения, которая позволит аккумулировать разрозненные данные в едином репозитории и предоставлять доступ к различным способам обработки данных прозрачно и без дополнительных затрат. Такая концепция получила название Озера данных 2.0 (Data Lake 2.0). Идея Озера данных заключается в том, что у компаний появляется единое информационное пространство (озеро), в котором хранятся все данные компании, которые используются для различных бизнес-приложений. Data Lake 2.0 призвана стать универсальным инструментом для хранения и последующей аналитики собранной информации.
Озеро данных является органичным средством перехода от классического ИТ к цифровому бизнесу, полностью вовлеченному в цифровую экономику будущего. Озеро данных позволяет компаниям и государственным органам прозрачно использовать как текущие приложения, так и новейшие платформы обработки данных.
Концепция Озера данных 2.0 позволяет решить основные сложности при переходе к цифровому бизнесу: безопасность, защита и управление данными (48%), возможность сбора данных из разных источников (47%), интеграция платформы хранения и обработки данных в существующую инфраструктуру (37%), нехватка знаний и умений обслуживающего персонала (31%), сама инфраструктура и архитектура для аналитики данных (22%) (исследование Gartner).
В ноябре 2015 года корпорация EMC представила новое поколение своей флагманской платформы EMC Isilon, являющейся фундаментом Озера Данных 2.0. Основными отличием новой платформы стало расширение Озера Данных за пределы ЦОД заказчиков: теперь Озеро данных включает в себя и данные филиалов (удаленных офисов), и данные, находящиеся в облаке.
Платформа EMC ISILON является лидирующим решением на рынке горизонтально-масштабируемых систем и имеет более 7 000 заказчиков по всему миру. EMC ISILON — это первая платформа, сочетающая в себе весь функционал Озера данных с функционалом корпоративных СХД и имеющая интегрированную поддержку HDFS — интегрированный в операционную систему уровень хранения HADOOP.