Как обнаружить возможность машинного обучения, даже если вы не специалист по данным

Иметь интуицию в отношении работы алгоритмов машинного обучения - даже в самом общем смысле - становится важным деловым навыком. Как написал Эндрю Нг: "Почти весь прогресс ИИ в последнее время происходит по одному типу, в котором некоторые входные данные (А) используются для быстрой генерации некоторого простого ответа (В)". Но как это работает? Как вы можете себе представить, многие интересные проблемы машинного обучения нельзя свести к простому уравнению типа y = mx + b. Но по своей сути алгоритмы машинного обучения с наблюдением решают сложные варианты m, основываясь на помеченных значениях x и y, чтобы они могли предсказывать будущие y по будущим x. Если вы когда-нибудь проходили курс статистики или работали с предиктивной аналитикой, все это должно звучать знакомо: это идея, лежащая в основе линейной регрессии, одной из самых простых форм контролируемого обучения.

Искусственный интеллект больше не является просто нишевой подотраслью компьютерных наук. Технологические гиганты используют ИИ уже много лет: Алгоритмы машинного обучения обеспечивают работу рекомендаций товаров Amazon, карт Google и контента, который Facebook, Instagram и Twitter отображают в лентах социальных сетей. Но поговорка Уильяма Гибсона вполне применима к внедрению ИИ: Будущее уже здесь, просто оно неравномерно распределено.

Средняя компания сталкивается со многими проблемами при начале работы с машинным обучением, включая нехватку специалистов по анализу данных. Но не менее важной является нехватка руководителей и нетехнических сотрудников, способных заметить возможности ИИ. И для того, чтобы заметить эти возможности, не требуется докторская степень по статистике или даже умение писать код. (Для этого, предупреждаем спойлером, придется ненадолго вернуться к алгебре в средней школе).

Интуиция в отношении работы алгоритмов машинного обучения - даже в самом общем смысле - становится важным бизнес-навыком. Специалисты по машинному обучению не могут работать в вакууме; бизнес-заинтересованные лица должны помочь им определить проблемы, которые стоит решить, и выделить экспертов в предметной области, чтобы они перевели их знания в метки для наборов данных, обеспечили обратную связь с результатами и определили цели для успеха алгоритмов.

Как написал Эндрю Нг: "Почти весь прогресс ИИ в последнее время происходит по одному типу, в котором некоторые входные данные (A) используются для быстрого создания некоторого простого ответа (B)".

Но как это работает? Вспомните школьную математику - обещаю, это будет кратко - когда вы впервые выучили уравнение прямой линии: y = mx + b. Алгебраические уравнения, подобные этому, представляют собой взаимосвязь между двумя переменными, x и y. В средней школе по алгебре вам говорили, что такое m и b, давали входное значение x, а затем просили подставить их в уравнение, чтобы решить y. В этом случае вы начинаете с уравнения, а затем вычисляете конкретные значения.

При контролируемом обучении этот процесс обратный: вы решаете m и b, учитывая набор x и y. При контролируемом обучении вы начинаете с множества конкретных значений - данных - и выводите общее уравнение. А часть обучения означает, что вы можете обновлять уравнение по мере увеличения числа x и y, изменяя наклон линии, чтобы она лучше соответствовала данным. Уравнение почти никогда не определяет связь между каждым x и y со 100% точностью, но обобщение очень важно, потому что позже вы сможете использовать его для алгебры на новых данных. После того как вы нашли наклон, который надежно отражает связь между x и y, если вам дано новое значение x, вы можете сделать обоснованное предположение о соответствующем значении y.

Как вы понимаете, многие интересные проблемы машинного обучения нельзя свести к простому уравнению y = mx + b. Но по своей сути алгоритмы машинного обучения с наблюдением также решают сложные варианты m на основе помеченных значений x и y, поэтому они могут предсказывать будущие значения y по будущим значениям x. Если вы когда-нибудь проходили курс статистики или работали с предиктивной аналитикой, все это должно звучать знакомо: это идея линейной регрессии, одной из самых простых форм контролируемого обучения.

Если вернуться к формулировке Нг, контролируемое обучение требует наличия примеров как входных данных, так и ответа, как x, так и y. Если у вас есть и то, и другое, контролируемое обучение позволяет составить уравнение, которое аппроксимирует эту взаимосвязь, так что в будущем вы сможете угадать значения y для любого нового значения x.

Так что вопрос о том, как определить возможности ИИ, начинается с вопроса: Какие результаты стоит угадать? И есть ли у нас данные, необходимые для проведения контролируемого обучения?

Например, скажем, специалисту по исследованию данных поручено предсказать цены на недвижимость в определенном районе. Проанализировав данные, она обнаруживает, что цена на жилье (y) тесно коррелирует с размером дома (x). Поэтому она использует множество точек данных, содержащих размер и цену домов, использует статистику для оценки наклона (m), а затем использует уравнение y = mx + b для прогнозирования цены для данного дома на основе его размера. Это линейная регрессия, и она остается невероятно мощной.

Организации используют подобные методы для прогнозирования будущих продаж продукции, риска инвестиционного портфеля или оттока клиентов. Опять же, статистика, лежащая в основе различных алгоритмов, отличается по сложности. Некоторые методы выдают простые точечные прогнозы (Мы думаем, что y произойдет!), а другие выдают диапазон возможных прогнозов с аффилированными коэффициентами уверенности (Вероятность того, что y произойдет, составляет 70%, но если мы изменим одно предположение, наша уверенность упадет до 60%).

Все это примеры задач прогнозирования, но контролируемое обучение также используется для классификации.

Задачи классификации объединяют данные в группы. В этом случае специалист по исследованию данных ищет в данных признаки, которые являются надежными прокси для категорий, которые он хочет разделить: Если в данных есть признак x, они попадают в ведро один, если нет - в ведро два. Это все еще можно представить как использование признаков x для прогнозирования признаков y, но в данном случае y - это не число, а тип.

< <

Различные инструменты


  • Новейшие исследования: AI и машинное обучение

    Technology & Operations Book

  • АВТОР
  • перед последним

для каждого дополнительного автора. Без пробелов и запятых. --> 49,95 Добавить в корзину

Организации используют алгоритмы классификации для фильтрации спама, диагностики отклонений на рентгеновских снимках, определения релевантных документов для судебного процесса, сортировки резюме при приеме на работу или сегментации клиентов. Но классификация обретает свою истинную силу, когда количество классов увеличивается. Классификация может быть расширена за пределы двоичного выбора типа "Это спам или нет?" и включать в себя множество различных категорий. Задачи восприятия, такие как обучение компьютера распознаванию объектов на изображениях, также являются задачами классификации, просто они имеют много выходных классов (например, названия различных видов животных), а не только ведро 1 и ведро 2. Это заставляет системы контролируемого обучения выглядеть умнее, чем они есть на самом деле, поскольку мы предполагаем, что их способность к изучению концепций зеркально отражает нашу собственную. На самом деле они просто распределяют данные по ведрам 1, 2, 3...n в соответствии с "m", выученными для функции.

До сих пор все это кажется довольно абстрактным. Как можно спустить это на землю и научиться определять эти математические структуры в своей повседневной работе?

Есть несколько способов определить, представляет ли задача хорошую возможность для контролируемого обучения.

Во-первых, запишите, что вы делаете на своей работе. Разделите свои действия на: то, что вы делаете ежедневно или регулярно, и то, что делаете от случая к случаю; то, что стало второй натурой, и то, что требует терпеливого обдумывания или долгих размышлений; то, что является частью процесса, и то, что вы делаете самостоятельно.

Для тех задач, которые вы выполняете регулярно, самостоятельно, и которые кажутся вам автоматическими, определите, сколько людей в вашей организации выполняют подобные задачи и сколько людей делали это исторически.

Изучите характер задачи. Включает ли она прогнозирование чего-либо или распределение чего-либо по категориям?

Спросите себя: Если бы 10 коллег в вашей организации выполняли эту задачу, все ли они согласились бы с ответом? Если люди не могут согласиться с тем, что что-то является истинным или ложным, компьютеры не могут надежно преобразовать суждения в статистические модели.

Как давно люди в организации занимаются чем-то похожим на эту задачу? Если прошло много времени, вела ли организация учет успешно выполненных задач? Если да, то это можно использовать в качестве обучающего набора данных для алгоритма контролируемого обучения. Если нет, возможно, вам нужно начать собирать эти данные уже сегодня, а затем вы сможете держать человека в курсе дела, чтобы со временем обучить алгоритм.

Следующий шаг - сесть с командой специалистов по анализу данных и рассказать им о задаче. Проведите их через свой мыслительный процесс и расскажите, на какие аспекты информации вы обращаете внимание при выполнении задачи. Это поможет им определить, возможна ли автоматизация, и выявить те аспекты данных, которые будут наиболее предсказуемы для получения желаемого результата.

Спросите себя: если бы это было автоматизировано, как это могло бы изменить продукты, которые мы предлагаем нашим клиентам? Спросите, что самое плохое может случиться с бизнесом, если это будет автоматизировано? И, наконец, спросите, что самое страшное может произойти с бизнесом, если алгоритм выдаст неправильный ответ или ответ с точностью 65% или 70%? Какой порог точности необходим предприятию, чтобы автоматизировать эту задачу?

Успех в контролируемом обучении предполагает изменение взгляда на то, как выполняется работа. Он подразумевает использование прошлой работы - всех этих человеческих суждений и знаний в предметной области - для создания алгоритма, который применяет эти знания для будущей работы. При правильном использовании это делает сотрудников более продуктивными и создает новую ценность. Но все начинается с определения проблем, которые стоит решить, и осмысления их с точки зрения входов и выходов, "х" и "у".

Об авторе

Кэтрин Хьюм - временный руководитель Borealis AI, исследовательской лаборатории машинного обучения Королевского банка Канады. До прихода в Borealis доктор Хьюм занимала руководящие должности в Integrate.ai и Fast Forward Labs, где она помогла более 50 организациям из списка Fortune 500 разработать и внедрить программы по ИИ. Она читала курсы по цифровой трансформации и юридической этике в бизнес- и юридических школах Гарварда, Массачусетского технологического института, Университета Торонто и Университета Калгари.

Рубрика: 
Ключевые слова: 
Автор: 
Источник: 
  • Hbr.org
Перевод: 
  • Дмитрий Л

Поделиться