В течение как минимум двух недель база данных, содержащая информацию о 198 миллионах потенциальных избирателей США, что составляет более половины американского населения, была выставлена в Интернете, доступная всем желающим.
Чьи это данные и кто их выложил в интернет?
В целом, с 1 по 14 июня было обнародовано около 25 терабайт данных, из них 1,1 терабайт был доступен для скачивания.
База данных принадлежит Deep Root Analytics — компании, которая работает на Республиканский Национальный Комитет и специализируется на анализе данных. В базе содержится имя и адрес избирателя, дата рождения, а также смоделированные на компьютере данные относительно возможной позиции избирателя по 48 различным политическим вопросам.
Согласно заявлению компании The Hill , данные о вероятной позиции избирателя по разным вопросам являются результатом анализа, проведенного компанией, и используются для принятия решений при покупке рекламы на местном телевидении. «Доступ к данным не был открыт или использован каким-либо конкретным клиентом», — сказали представители компании.
«Мы принимаем на себя полную ответственность за сложившуюся ситуацию», — добавили представители компании, и сказали, что заключили контракт с компанией Stroz Friedberg, чтобы выяснить, как произошла утечка данных.
Обнаружение
Исследователь вопросов безопасности из компании UpGuard, Крис Викери, был тем, кто обнаружил эту базу данных в незащищенном, общедоступном хранилище Amazon Web Services S3 и сообщил об этом соответствующим регулирующим органам.
Его коллега Дэн О’Салливан также просмотрел обнаруженные файлы, пытаясь найти там свое имя. Найдя его, он сказал, что компания довольно хорошо догадалась о его предпочтениях по многим политическим вопросам.
«Это свидетельствует не только о талантах аналитиков, но и о реальной опасности утечки подобной информации, поскольку результаты проведенного анализа были поразительно точными», — отметил он.
В настоящее время нет информации о том, были ли эти файлы доступны кому-либо еще.
«Компании Deep Root Analytics, TargetPoint и Data Trust были среди нанятых республиканцами для анализа данных во время предвыборной компании Трампа в 2016 году с целью повлиять на потенциальных избирателей и точно спрогнозировать их поведение. Репозиторий данных RNC в конечном итоге будет содержать около 9,5 миллиардов значений данных в отношении трех из пяти американцев, ранжируя 198 миллионов потенциальных избирателей в соответствии с их вероятными политическими предпочтениями, используя передовое алгоритмическое моделирование по сорока восьми различным категориям», — отметил UpGuard .
Последствия
Ранее Викери уже обнаруживал незащищенную конфиденциальную информацию – данные о 93 миллионах мексиканских избирателей , а год назад он же нашел в сети еще одну базу данных, которая содержала информацию о 154 миллионах избирателей США .
«Утечка данных поднимает серьезный вопрос о том, какого уровня конфиденциальности и безопасности могут ожидать американцы в отношении своих самых важных данных. То, что такая огромная национальная база данных может быть создана и размещена в Интернете, не имея самой простейшей защиты, вызывает тревогу», — отметил О’Салливан.
«Способность собирать такую информацию и хранить ее незащищенной, еще больше ставит под сомнение обязанности частных корпораций и политических кампаний перед теми гражданами, на которых нацелены мощные аналитические операции с данными».