Этический разговор, который мы не ведем о данных

В области науки о данных возникла целая череда скандалов. В июле генеральный директор компании Whole Foods Markets заявил mea culpa после того, как выяснилось, что супермаркет манипулировал данными о продуктах, завышая вес предварительно упакованных продуктов и мяса. Летом споры охватили Ashley Madison, социальную сеть для женатых людей, ищущих других партнеров, поскольку хакерам удалось извлечь огромное количество частных данных с серверов компании. Компания General Motors также была уличена в сокрытии информации о неисправном замке зажигания, который был связан с более чем сотней смертей.

Хотя ответственность за эти скандалы лежит на топ-менеджерах, ни одно из этих сомнительных действий не могло бы произойти без активного участия технических специалистов. Помимо инженеров, разработчиков программного обеспечения и менеджеров по продуктам, растущее сообщество специалистов по изучению данных также причастно к разработке концепций, алгоритмов и программного обеспечения, позволяющих обманывать.

Эта история постоянно возвращается, потому что индустрия относится к ней как к технологической проблеме, требующей технологического решения. Бизнес-менеджеры упускают реальную проблему: люди, которые собирают, хранят, управляют и обрабатывают наши данные, не придерживаются никаких этических стандартов. Зарождающаяся дисциплина "наука о данных" развивается так быстро, что мало кто из работников задумывается об этических последствиях своих повседневных действий.

С точки зрения данных, новость об Ashley Madison является наиболее убедительной. Этот скандал может показаться несущественным тем, кто презирает теневую бизнес-модель сайта, но вам действительно стоит обратить на него внимание. Вот пять причин, почему:

  1. Клиенты сайта предположительно верят, что владелец сайта имеет сильное желание сохранить их данные в тайне. При этом сайт по-прежнему не может защититься от хакеров.
  2. Пользователи, полагающие, что они анонимны, поскольку используют псевдонимы в своих профилях, узнают, что аналитики данных раскрыли их личности по кредитным картам и даже сохранили информацию в базах данных.
  3. Когда клиенты просят удалить данные, даже после того, как эти пользователи платят сайту за удаление своих данных, они продолжают оставаться на серверах.
  4. Технологи обнаруживают, что программисты допустили определенные ошибки, которые позволяют расшифровать более 10 миллионов зашифрованных паролей.
  5. После того, как хакеры обнародуют украденные данные, орда следователей немедленно получает их, намереваясь обнаружить постыдные личные данные. Эти аналитики видят в этом редкую возможность получить в свои руки массивные, реальные данные, которые обычно тщательно охраняются компаниями.

В таких скандалах причина проблемы скорее человеческая, чем техническая. Например, данные кредитных карт не появляются в хранилище данных предприятия без приглашения. После хранения данных пишется программное обеспечение для установления связи между псевдонимом пользователя и его именем и адресом. Технический персонал участвует как в проектировании алгоритмов связи, так и в разработке кода для реализации. Ресурсы на разработку выделяются на основе технического или делового обоснования.

В различных компаниях я был участником таких бесед. Бизнес- и технические руководители обсуждают такие темы, как инновационность продукта, пользовательский опыт, требования к ресурсам, конкурентные стратегии и возврат инвестиций. За исключением редких случаев, этика этих решений никогда не затрагивается. Такое пренебрежение обычно связано с недостатком внимания, осведомленности или чувствительности. Иногда от этических проблем отмахиваются так же широко, как многие компании отмахиваются от своих пользователей-клиентов: если им не нравится то, что мы делаем, они не обязаны пользоваться нашими услугами!

Недавние скандалы должны вызвать серьезный разговор в деловом сообществе об этике данных. Люди могут придерживаться разных этических стандартов, но полностью игнорировать этот вопрос больше нельзя.

Что же можно сделать? Для начала каждая команда технических специалистов и специалистов по работе с данными должна пройти вводный инструктаж по этике использования данных. Ознакомление инженеров и специалистов по работе с данными с юридическими обязательствами, изложенными в различных положениях и условиях, - это хорошее начало, но этические нормы не должны ограничиваться этим. Необходимо сформировать культуру, в которой члены команды будут чувствовать себя комфортно, обсуждая этические вопросы.

В прошлом году, когда я изучал учебные планы программ по науке о данных и аналитике для разрабатываемого мной курса, я обнаружил только одно учебное заведение, в котором требуется курс по этике. Это должно измениться, иначе возникнет еще больше скандалов, связанных с данными.

Об авторе

Кайзер Фунг является основателем и генеральным директором Principal Analytics Prep, буткемпа нового поколения по науке о данных на базе стартап-студии HBS. Он руководил программой MS in Applied Analytics в Колумбийском университете и является создателем блога Junk Charts, посвященного критическому анализу визуализации данных в средствах массовой информации. Его последняя книга - NumberSense: How to Use Big Data to Your Advantage. Он имеет степень MBA Гарвардской школы бизнеса, дипломы Принстонского и Кембриджского университетов, а также занимался аналитикой в компаниях Vimeo, SiriusXM Radio и American Express.

Рубрика: 
Ключевые слова: 
Автор: 
Источник: 
  • Hbr.org
Перевод: 
  • Дмитрий Л

Поделиться