ИИ внедряется в продукты и процессы практически во всех отраслях. Но внедрение ИИ в масштабах остается нерешенной проблемой, вызывающей разочарование у большинства организаций. Предприятия могут обеспечить успех своих усилий по внедрению ИИ путем интегрированного и согласованного масштабирования команд, процессов и инструментов. Все это является частью развивающейся дисциплины под названием MLOps.
АИ больше не является исключительной прерогативой таких "цифровых" компаний, как Amazon, Netflix или Uber. Недавно компания Dow Chemical Company использовала машинное обучение для ускорения процесса исследований и разработок рецептур полиуретанов в 200 000 раз - с 2-3 месяцев до всего 30 секунд. И Dow не одинока. Недавний индекс от Deloitte показывает, как компании из разных отраслей применяют ИИ для повышения ценности бизнеса. Неудивительно, что, по прогнозам Gartner, к концу 2024 года более 75% организаций перейдут от экспериментального применения технологий ИИ к их практическому использованию - именно тогда начнутся настоящие проблемы.
АИ наиболее ценен, когда он применяется в масштабах компании. Для руководителей компаний, желающих добиться максимальной ценности бизнеса с помощью ИИ, масштаб означает, насколько глубоко и широко ИИ интегрирован в основной продукт или услугу организации и в ее бизнес-процессы.
К сожалению, масштабировать ИИ в этом смысле непросто. Внедрение одной-двух моделей ИИ в производство - это совсем другое, чем управление целым предприятием или продуктом на основе ИИ. И по мере масштабирования ИИ проблемы тоже могут (и часто так и происходит) увеличиваться. Например, одна финансовая компания потеряла 20 000 долларов за 10 минут из-за того, что одна из ее моделей машинного обучения начала вести себя неправильно. Не имея возможности увидеть суть проблемы - и даже определить, какая из моделей дала сбой - у компании не оставалось другого выбора, кроме как отключить ее. Все модели были откачены до гораздо более ранних итераций, что серьезно ухудшило производительность и свело на нет недели усилий.
Организации, серьезно относящиеся к ИИ, начали внедрять новую дисциплину, которую в свободной форме называют "MLOps" или Machine Learning Operations. MLOps стремится установить лучшие практики и инструменты для содействия быстрой, безопасной и эффективной разработке и внедрению ИИ. При правильной реализации MLOps может значительно ускорить выход на рынок. Внедрение MLOps требует инвестирования времени и ресурсов в три ключевые области: процессы, люди и инструменты.
Процессы: Стандартизируйте процесс создания и эксплуатации моделей.
Создание моделей и алгоритмов, на которых основан ИИ, - это творческий процесс, требующий постоянных итераций и доработок. Специалисты по анализу данных готовят данные, создают функции, обучают модель, настраивают ее параметры и проверяют ее работоспособность. Когда модель готова к развертыванию, инженеры-программисты и ИТ-специалисты вводят ее в эксплуатацию, постоянно контролируя результаты и производительность, чтобы обеспечить надежную работу модели в производстве. И наконец, команда управления должна контролировать весь процесс, чтобы убедиться, что создаваемая модель ИИ безопасна с точки зрения этики и соответствия нормативным требованиям.
Учитывая всю сложность этого процесса, первым шагом к масштабированию ИИ является стандартизация: способ создания повторяемых моделей и четко определенный процесс их эксплуатации. В этом смысле создание ИИ очень похоже на производство: Первый виджет, который делает компания, всегда делается на заказ; масштабирование производства для выпуска большого количества виджетов и последующая постоянная оптимизация их дизайна - вот где повторяющийся процесс разработки и производства становится необходимым. Но с ИИ многие компании испытывают трудности с этим процессом.
Легко понять, почему. Индивидуальные процессы (по своей природе) чреваты неэффективностью. Тем не менее, многие организации попадают в ловушку, изобретая колесо каждый раз, когда они вводят в действие какую-либо модель. В случае с финансовой компанией, о котором шла речь выше, отсутствие повторяемого способа мониторинга работы модели привело к дорогостоящим и медленно устраняемым сбоям. Подобные разовые процессы могут обернуться большими неприятностями после запуска исследовательских моделей в производство.
Стандартизация процессов в рамках MLOps помогает упорядочить разработку, внедрение и доработку моделей, позволяя командам быстро, но ответственно наращивать возможности ИИ.
Для стандартизации организации должны совместно определить "рекомендуемый" процесс разработки и внедрения ИИ и предоставить инструменты для поддержки внедрения этого процесса. Например, организация может разработать стандартный набор библиотек для проверки моделей ИИ, поощряя тем самым последовательное тестирование и проверку. Стандартизация в точках передачи данных в жизненном цикле ИИ (например, от науки о данных к ИТ) особенно важна, поскольку она позволяет различным командам работать независимо и сосредоточиться на своих ключевых компетенциях, не беспокоясь о неожиданных, разрушительных изменениях.
Инструменты MLOps, такие как каталоги моделей и хранилища функций, могут поддерживать эту стандартизацию.
Персонал: Пусть команды сосредоточатся на том, что у них лучше всего получается.
Раньше разработка ИИ входила в обязанности команды, занимающейся "наукой о данных", но создание масштабного ИИ не под силу одной команде - для этого требуется целый ряд уникальных навыков, и очень немногие люди обладают всеми ими. Например, специалист по анализу данных создает алгоритмические модели, которые могут точно и последовательно предсказывать поведение, в то время как инженер ML оптимизирует, упаковывает и интегрирует исследовательские модели в продукты и постоянно контролирует их качество. Один человек редко может хорошо выполнять обе роли. Соблюдение нормативно-правового соответствия, управление и риск требуют еще более четкого набора навыков. Для успешного масштабирования ИИ бизнес-лидеры должны создавать и наделять полномочиями специализированные, преданные своему делу команды, которые могут сосредоточиться на высокозначимых стратегических приоритетах, которые под силу только их команде. Пусть data scientist занимается data science; пусть инженеры занимаются проектированием; пусть IT сосредоточится на инфраструктуре.
По мере того как организации расширяют свое присутствие в сфере ИИ, возникли две структуры команд. Первая - это модель "сошки", когда разработкой продуктов ИИ занимается небольшая команда, состоящая из специалиста по анализу данных, инженера по данным и инженера по ML или программному обеспечению. Вторая, модель "центра передового опыта" или COE, заключается в том, что организация "объединяет" всех экспертов по науке о данных, которые затем назначаются в различные команды по разработке продуктов в зависимости от требований и наличия ресурсов. Оба подхода были успешно реализованы и имеют свои плюсы и минусы. Модель "стручка" лучше всего подходит для быстрого выполнения, но может привести к образованию "силоса знаний", в то время как модель COE имеет противоположный компромисс. В отличие от data science и IT, команды управления наиболее эффективны, когда они находятся вне "стручков" и COE.
Инструменты: Выбирайте инструменты, которые поддерживают креативность, скорость и безопасность.
И наконец, мы переходим к инструментам. Поскольку попытка стандартизировать производство ИИ и ОД является относительно новым проектом, экосистема инструментов науки о данных и машинного обучения сильно фрагментирована - чтобы построить одну модель, специалист по исследованию данных работает примерно с десятком различных узкоспециализированных инструментов и сшивает их вместе. С другой стороны, ИТ-отдел или служба управления используют совершенно другой набор инструментов, и эти разные цепочки инструментов нелегко взаимодействуют друг с другом. В результате легко выполнить разовую работу, но построить надежный, повторяющийся рабочий процесс сложно.
В конечном итоге это ограничивает скорость масштабирования ИИ в организации. Разрозненный набор инструментов может привести к длительному выводу на рынок и созданию продуктов ИИ без надлежащего надзора.
Но по мере расширения масштабов ИИ в организации сотрудничество становится все более важным условием успеха. Более быстрые итерации требуют постоянного участия заинтересованных сторон на протяжении всего жизненного цикла модели, и поиск правильного инструмента или платформы является важным шагом. Инструменты и платформы для поддержки ИИ в масштабах организации должны поддерживать творческий подход, скорость и безопасность. Без правильных инструментов предприятию будет сложно поддерживать их одновременно.
Выбирая инструменты MLOps для своей организации, руководитель должен учитывать:
Взаимозаменяемость.
Чаще всего уже существует какая-то инфраструктура ИИ. Чтобы уменьшить трудности при внедрении нового инструмента, выбирайте тот, который будет взаимодействовать с существующей экосистемой. На стороне производства модельные сервисы должны работать с инструментами DevOps, уже одобренными ИТ-отделом (например, инструменты для протоколирования, мониторинга, управления). Убедитесь, что новые инструменты будут работать с существующей экосистемой ИТ или могут быть легко расширены для обеспечения такой поддержки. Для организаций, переходящих от локальной инфраструктуры к облачной, найдите инструменты, которые будут работать в гибридной среде, поскольку миграция в облако часто занимает несколько лет.
Удобно ли оно как для специалистов по анализу данных, так и для ИТ.
У инструментов для масштабирования ИИ есть три основные группы пользователей: специалисты по анализу данных, которые строят модели, ИТ-команды, которые поддерживают инфраструктуру ИИ и запускают модели ИИ в производство, и команды управления, которые следят за использованием моделей в регулируемых сценариях.
У специалистов по анализу данных и ИТ, как правило, противоположные потребности. Чтобы специалисты по анализу данных могли выполнять свою лучшую работу, платформа не должна мешать им, предлагая гибкость в использовании библиотек по своему выбору и самостоятельную работу без необходимости постоянной поддержки со стороны ИТ-отдела или инженеров. С другой стороны, ИТ-отделу нужна платформа, которая накладывает ограничения и обеспечивает, чтобы производственные развертывания шли по заранее определенным и одобренным ИТ-отделом путям. Идеальная платформа MLOps может делать и то, и другое. Зачастую эта задача решается путем выбора одной платформы для построения моделей и другой - для их операционализации.
Сотрудничество.
Как было описано выше, ИИ - это инициатива с участием многих заинтересованных сторон. Поэтому инструмент MLOps должен облегчать работу специалистов по анализу данных с инженерами и наоборот, а также обеспечивать работу обеих этих персон с органами управления и контроля. В год великого увольнения обмен знаниями и обеспечение непрерывности бизнеса в условиях оттока сотрудников имеют решающее значение. В разработке продуктов ИИ скорость сотрудничества между data science и ИТ определяет скорость выхода на рынок, а сотрудничество в области управления гарантирует, что создаваемый продукт стоит создавать.
Управление.
В случае ИИ и ML управление становится гораздо более важным, чем в других приложениях. Управление ИИ не ограничивается только безопасностью или контролем доступа в приложении. Оно отвечает за то, чтобы приложение соответствовало этическому кодексу организации, чтобы приложение не было предвзятым по отношению к защищенной группе и чтобы решениям, принимаемым приложением ИИ, можно было доверять. Таким образом, для любого инструмента MLOps становится важным встроить практику ответственного и этичного ИИ, включая такие возможности, как "предпусковые" контрольные списки ответственного использования ИИ, документация модели и рабочие процессы управления.
. ...
В гонке за масштабированием ИИ и повышением ценности бизнеса с помощью предиктивных технологий руководители всегда ищут способы опередить конкурентов. Краткие возможности ИИ, такие как предварительно обученные модели и лицензированные API, могут быть ценны сами по себе, но масштабирование ИИ для достижения максимальной рентабельности инвестиций требует, чтобы организации сосредоточились на том, как они применяют ИИ. Компании с лучшими моделями или самыми умными специалистами по обработке данных не обязательно окажутся в выигрыше; успех достанется тем компаниям, которые смогут грамотно внедрить и масштабировать ИИ, чтобы раскрыть весь его потенциал.
Об авторе
Манаси Вартак, доктор философии, является основателем и генеральным директором Verta, платформы MLOps, которая позволяет ученым, изучающим данные, и инженерам ML управлять и эксплуатировать модели AI-ML в масштабе. Ранее Манаси разработал систему управления моделями ModelDB с открытым исходным кодом в Массачусетском технологическом институте и работал над оптимизацией алгоритмов новостной ленты в Twitter и рекламного таргетинга в Google.
- Hbr.org
Поделиться