В чем разница между искусственным интеллектом, машинным обучением и глубоким обучением?
Искусственный интеллект (ИИ), машинное обучение и глубокое обучение… Чем отличаются? В этих терминах легко запутаться, поэтому начнем с кратких определений.
ИИ (AI, Artificial Intelligence) означает, что компьютер тем или иным образом имитирует поведение человека.
Машинное обучение (ML, Machine Learning) — это подмножество ИИ, состоящее из методов, которые позволяют компьютерам делать выводы на основе данных и предоставлять их ИИ-приложениям.
Глубокое обучение (DL, Deep Learning) является подмножеством машинного обучения, и оно дает компьютерам возможность решать более сложные задачи.
Все эти описания корректны, но довольно лаконичны. Поэтому стоит рассказать о каждой из областей подробнее.
Что такое ИИ?
Искусственный интеллект как академическая дисциплина появился в 1956 году. Цель, как и сейчас, тогда заключалась в том, чтобы заставить компьютеры решать задачи, которые считались подвластными исключительно людям: те, что требовали интеллекта. Первоначально исследователи работали над такими задачами, как игра в шашки и решение логических головоломок.
Взглянув на результаты одной из таких программ игры в шашки, можно было увидеть за их ходами какую-то форму «искусственного интеллекта», особенно когда компьютер вас побеждал. Первые успехи вызвали у исследователей почти безграничный энтузиазм по поводу потенциала ИИ, который однако не соответствовал тому, насколько сложными могли оказаться решения отдельных задач.
Искусственный интеллект: этапы развития
Искусственный интеллект, следовательно, относится к выводам компьютера. Компьютер делает что-то «умное», поэтому он демонстрирует интеллект, интеллект искусственный.
Сам термин «ИИ» ничего не говорит о том, как именно эти задачи решаются. Между тем существует множество различных методов, в том числе основанных на правилах или экспертных системах. И одну категорию методов стали особенно широко использовать в 1980-х годах — машинное обучение.
Что такое машинное обучение?
Причина, по которой первые исследователи столкнулись с тем, что некоторые задачи на самом деле оказались намного сложнее, чем представлялось ранее, состоит в следующем: эти задачи просто не поддаются решению ранними методами, использовавшимися в ИИ. Жестко закодированные алгоритмы или фиксированные, основанные на правилах системы не очень хорошо работают с такими вещами, как распознавание изображений или понимание текста.
Решением оказалось не просто подражание человеческому поведению, а имитация того, как люди учатся.
Подумайте о том, как вы освоили чтение. Вы ведь не садились изучать орфографию и грамматику, прежде чем прочесть свою первую книгу. Вы сначала читаете простые книги, которые со временем становятся все более сложными. Вы действительно изучили правила (и исключения) орфографии и грамматики – но в процессе чтения. Иными словами, вы обработали много данных и научились на них.
Именно в этом и состоит идея машинного обучения. Дать алгоритму (в отличие от мозга) огромное множество данных и позволить ему сделать заключения. Снабдите алгоритм большим количеством данных о финансовых транзакциях, укажите, какие из них являются мошенническими, и дайте ему понять, что именно говорит о мошенничестве, чтобы он мог прогнозировать такие злоупотребления. Или дайте информацию о своей клиентской базе и позвольте ему сделать вывод, как лучше ее сегментировать.
По мере совершенствования этих алгоритмов они могли бы решить многие задачи. Но некоторые вещи, которые людям казались довольно легкими (например, распознавание речи или рукописного ввода), все еще были трудными для машин. Однако, если машинное обучение — это подражание тому, как люди учатся, почему бы не пройти весь путь и не попытаться имитировать человеческий мозг? Эта идея – в основе нейронных сетей.
Идея использования искусственных нейронов (а нейроны, связанные посредством синапсов, являются основными элементами нашего мозга) была известна довольно давно, и нейронные сети, смоделированные в программном обеспечении, стали использовать для решения определенных задач. Подход оказался многообещающим и позволил решить некоторые сложные задачи, с которыми не справлялись другие алгоритмы.
Но машинное обучение все еще ограничивалось тем, с чем легко справлялись младшие школьники: сколько собак на этой картине или не волки ли это на самом деле? Идите туда и принесите мне спелый банан. Что заставило героя этой книги так много плакать?
Оказалось, что проблема – вовсе не в самой концепции машинного обучения. И даже не в идее подражать работе человеческого мозга. Простые нейронные сети с сотнями или даже тысячами нейронов, связанные относительно простым способом, не могли дублировать то, на что способен человеческий мозг. Если подумать, то это вовсе не удивительно: в человеческом мозгу насчитывается около 86 миллиардов нейронов и имеют место очень сложные взаимосвязи.
Что такое глубокое обучение?
Попросту говоря, глубокое обучение — это использование нейронных сетей с большим количеством нейронов, слоев и взаимосвязей. Мы все еще далеки от имитации человеческого мозга во всей его сложности, но движемся именно в этом направлении.
И когда вы читаете о достижениях в области вычислений — от автономных автомобилей до суперкомпьютеров, играющих в Go, и систем распознавания речи, то знайте, что в основе всего этого лежит глубокое обучение. Вы имеете дело с некоей формой искусственного интеллекта. И этот ИИ использует определенную форму глубокого обучения.
Давайте рассмотрим пару задач, чтобы понять, чем глубокое обучение отличается от более простых нейронных сетей или иных видов машинного обучения.
Как работает глубокое обучение
Если вам покажут изображение лошадей, вы узнаете в них лошадей, даже если вы никогда этой картинки раньше не видели. И не важно, лежит ли лошадь на диване или наряжается на Хэллоуин в бегемота. Вы сможете узнать лошадь, потому что вы знаете о различных элементах, которые определяют лошадь: форму ее головы, количество и расположение ног и т.д.
Глубокое обучение как раз и способно это сделать, что очень важно для многих областей, включая автономные транспортные средства. Прежде чем автомобиль без водителя сможет определить свое следующее действие, ему нужно знать, что его окружает. Он должен уметь распознавать людей, велосипеды, другие транспортные средства, дорожные знаки и многое другое. И делать это в сложных для визуальных задач условиях. Стандартные методы машинного обучения не могут этого сделать.
Возьмите обработку речи на естественном языке, которая используется сегодня в чат-ботах и голосовых помощниках смартфонов (это лишь пара примеров). Рассмотрим данное предложение и посмотрим, какова должна быть последняя часть:
Я родился в Италии и, хотя жил в Португалии и Бразилии большую часть своей жизни, все еще свободно говорю ________.
Надеюсь, вы видите, что наиболее вероятным ответом является итальянский (хотя вы также получите баллы за французский, греческий, немецкий, сардинский, албанский, хорватский, русский, словенский, латинский, фриульский, каталонский, сардинский, сицилийский, цыганский и франко -провансальский и, возможно, еще несколько вариантов. Но подумайте о том, что требуется, чтобы прийти к такому заключению.
Для начала нужно знать, что недостающее слово — это язык. Это можно сделать, если понимать фразу «я свободно говорю … ». Чтобы получить «итальянский», вы должны вернуться к этому предложению и проигнорировать слова о Португалии и Бразилии. «Я родился в Италии» подразумевает изучение итальянского языка, пока ребенок растет (с вероятностью 93%, согласно Википедии). Предполагается, что вы понимаете то, что следует за рождением, а это выходит далеко за рамки того дня, когда вы появились на свет. Сочетание слов «хотя» и «все еще» дает понять, что речь идет не о португальском и возвращает вас в Италию. Поэтому «итальянский» – самый вероятный ответ.
Представьте, что происходит в нейронной сети вашего мозга. Когда вы обдумываете какие-то вещи, такие факты, как «рождение в Италии» и «хотя … все еще» являются исходными данными для других областей вашего мозга. И этот принцип переносится на глубокие нейронные сети через сложные обратные связи.
Заключение
Теперь определения в начале статьи обрели больший смысл. ИИ относится к устройствам, проявляющим в той или иной форме человекоподобный интеллект. Существует множество разных методов ИИ, но одно из подмножеств этого большого списка — машинное обучение — позволяет алгоритмам учиться на наборах данных. Наконец, глубокое обучение — это подмножество машинного обучения, использующее многослойные нейронные сети для решения самых сложных (для компьютеров) задач.
Источник: блог Oracle