В области науки о данных возникла целая череда скандалов. В июле генеральный директор компании Whole Foods Markets заявил mea culpa после того, как выяснилось, что супермаркет манипулировал данными о продуктах, завышая вес предварительно упакованных продуктов и мяса. Летом споры охватили Ashley Madison, социальную сеть для женатых людей, ищущих других партнеров, поскольку хакерам удалось извлечь огромное количество частных данных с серверов компании. Компания General Motors также была уличена в сокрытии информации о неисправном замке зажигания, который был связан с более чем сотней смертей.
Хотя ответственность за эти скандалы лежит на топ-менеджерах, ни одно из этих сомнительных действий не могло бы произойти без активного участия технических специалистов. Помимо инженеров, разработчиков программного обеспечения и менеджеров по продуктам, растущее сообщество специалистов по изучению данных также причастно к разработке концепций, алгоритмов и программного обеспечения, позволяющих обманывать.
Эта история постоянно возвращается, потому что индустрия относится к ней как к технологической проблеме, требующей технологического решения. Бизнес-менеджеры упускают реальную проблему: люди, которые собирают, хранят, управляют и обрабатывают наши данные, не придерживаются никаких этических стандартов. Зарождающаяся дисциплина "наука о данных" развивается так быстро, что мало кто из работников задумывается об этических последствиях своих повседневных действий.
С точки зрения данных, новость об Ashley Madison является наиболее убедительной. Этот скандал может показаться несущественным тем, кто презирает теневую бизнес-модель сайта, но вам действительно стоит обратить на него внимание. Вот пять причин, почему:
- Клиенты сайта предположительно верят, что владелец сайта имеет сильное желание сохранить их данные в тайне. При этом сайт по-прежнему не может защититься от хакеров.
- Пользователи, полагающие, что они анонимны, поскольку используют псевдонимы в своих профилях, узнают, что аналитики данных раскрыли их личности по кредитным картам и даже сохранили информацию в базах данных.
- Когда клиенты просят удалить данные, даже после того, как эти пользователи платят сайту за удаление своих данных, они продолжают оставаться на серверах.
- Технологи обнаруживают, что программисты допустили определенные ошибки, которые позволяют расшифровать более 10 миллионов зашифрованных паролей.
- После того, как хакеры обнародуют украденные данные, орда следователей немедленно получает их, намереваясь обнаружить постыдные личные данные. Эти аналитики видят в этом редкую возможность получить в свои руки массивные, реальные данные, которые обычно тщательно охраняются компаниями.
В таких скандалах причина проблемы скорее человеческая, чем техническая. Например, данные кредитных карт не появляются в хранилище данных предприятия без приглашения. После хранения данных пишется программное обеспечение для установления связи между псевдонимом пользователя и его именем и адресом. Технический персонал участвует как в проектировании алгоритмов связи, так и в разработке кода для реализации. Ресурсы на разработку выделяются на основе технического или делового обоснования.
В различных компаниях я был участником таких бесед. Бизнес- и технические руководители обсуждают такие темы, как инновационность продукта, пользовательский опыт, требования к ресурсам, конкурентные стратегии и возврат инвестиций. За исключением редких случаев, этика этих решений никогда не затрагивается. Такое пренебрежение обычно связано с недостатком внимания, осведомленности или чувствительности. Иногда от этических проблем отмахиваются так же широко, как многие компании отмахиваются от своих пользователей-клиентов: если им не нравится то, что мы делаем, они не обязаны пользоваться нашими услугами!
Недавние скандалы должны вызвать серьезный разговор в деловом сообществе об этике данных. Люди могут придерживаться разных этических стандартов, но полностью игнорировать этот вопрос больше нельзя.
Что же можно сделать? Для начала каждая команда технических специалистов и специалистов по работе с данными должна пройти вводный инструктаж по этике использования данных. Ознакомление инженеров и специалистов по работе с данными с юридическими обязательствами, изложенными в различных положениях и условиях, - это хорошее начало, но этические нормы не должны ограничиваться этим. Необходимо сформировать культуру, в которой члены команды будут чувствовать себя комфортно, обсуждая этические вопросы.
В прошлом году, когда я изучал учебные планы программ по науке о данных и аналитике для разрабатываемого мной курса, я обнаружил только одно учебное заведение, в котором требуется курс по этике. Это должно измениться, иначе возникнет еще больше скандалов, связанных с данными.
Об авторе
Кайзер Фунг является основателем и генеральным директором Principal Analytics Prep, буткемпа нового поколения по науке о данных на базе стартап-студии HBS. Он руководил программой MS in Applied Analytics в Колумбийском университете и является создателем блога Junk Charts, посвященного критическому анализу визуализации данных в средствах массовой информации. Его последняя книга - NumberSense: How to Use Big Data to Your Advantage. Он имеет степень MBA Гарвардской школы бизнеса, дипломы Принстонского и Кембриджского университетов, а также занимался аналитикой в компаниях Vimeo, SiriusXM Radio и American Express.
- Hbr.org
Поделиться