Машинное обучение уже не только для экспертов

Если вы еще не используете глубокое обучение, то вам стоит это сделать. Именно так сказал легендарный инженер Google Джефф Дин в конце своего выступления на конференции по веб-поиску и добыче данных в начале этого года. Дин имел в виду стремительный рост точности алгоритмов машинного обучения, вызванный недавним прогрессом в области глубокого обучения, и все еще неиспользованный потенциал этих улучшенных алгоритмов, способный изменить мир, в котором мы живем, и продукты, которые мы создаем.

Но прорыв в области глубокого обучения - не единственная причина, по которой это важный момент для машинного обучения. Не менее важно и то, что за последние пять лет машинное обучение стало гораздо более доступным для неспециалистов, открыв доступ для огромной группы людей.

Для большинства разработчиков программного обеспечения исторически существовало множество барьеров на пути к машинному обучению, в первую очередь библиотеки программного обеспечения, предназначенные скорее для академических исследователей, чем для разработчиков программного обеспечения, а также отсутствие достаточного количества данных. Однако с массовым увеличением объема данных, генерируемых и хранимых многими приложениями, набор компаний с наборами данных, на которых можно применять алгоритмы машинного обучения, значительно расширился.

Вместе с этим за последние несколько лет появилось множество передовых, пригодных для коммерческого использования фреймворков машинного обучения, включая весьма успешную библиотеку scikit-learn Python и широко разрекламированные релизы таких библиотек, как Tensorflow от Google и CNTK от Microsoft Research. За последние два года крупные облачные провайдеры Amazon Web Services и Google Cloud Services также выпустили сервисы, ориентированные на машинное обучение - как платформы Machine Learning as a Service, так и машины с графическими процессорами, оптимизированные для работы с машинным обучением.

Чистый эффект этих новых технологий заключается в том, что человеку, заинтересованному в использовании машинного обучения, не обязательно понимать науку алгоритмов глубокого обучения, чтобы экспериментировать с передовыми методами. Существуют учебники и общедоступный код для таких разных приложений, как создание искусства на основе ИИ, перевод языков и автоматическое создание подписей к изображениям.

Доступность этого кода создает добродетельный цикл. Использование кода неспециалистами создает еще больший спрос на более простые в использовании системы и открывает новые области применения машинного обучения, что вдохновляет экспертов на дальнейшие исследования и разработки.

Кроме того, новые технологии влияют и на тех, кто работает в сфере машинного обучения. При приеме на работу на должности, связанные с прикладным машинным обучением, исключительные количественные навыки имеют решающее значение, но непосредственное образование в области машинного обучения стало менее важным.

Во многом это изменение в доступности имитирует прогресс, который мы наблюдаем в разработке программного обеспечения в целом. За последние 50 лет разработка программного обеспечения постепенно переходила от языков "низкого уровня" - высокотехничных языков, тесно связанных с архитектурой компьютера, - к языкам высокого уровня со значительно более низкими барьерами для входа. Аналогичным образом, развертывание программного обеспечения перешло от размещенных машин и центров обработки данных к облачным сервисам, что привело к значительному сокращению времени и капитала, необходимых для развертывания новой системы.

Эти изменения не просто сделали разработчиков программного обеспечения более эффективными; они позволили гораздо более широкому кругу людей разрабатывать программное обеспечение и создавать компании по разработке программного обеспечения. Буткемпы для программистов теперь готовят инженеров за несколько месяцев, а стартапы могут превращать идеи в продукты за несколько циклов разработки.

Конечно, все это не означает, что для экспертов нет места - как и в программной инженерии, в машинном обучении еще предстоит достичь несметного научного прогресса. Но впервые в истории появилась возможность, например, человеку со знанием программирования, но без опыта машинного обучения создать за один день нейронную сеть, способную читать рукописные цифры.

Попробуйте сами.

Об авторе

Джош Шварц - руководитель отдела инжиниринга и науки о данных в компании Chartbeat.

Рубрика: 
Ключевые слова: 
Автор: 
Источник: 
  • Hbr.org
Перевод: 
  • Дмитрий Л

Поделиться