73% сайта используют маленькую хитрость, чтобы заработать большие деньги на пользователях.
Добавление параметров в URL-адреса, техника добавления данных в конец веб-ссылок, стала серьезной проблемой для конфиденциальности данных пользователей. Такой метод используется для передачи данных, включая адреса электронной почты, рекламным компаниям для отслеживания пользовательской активности.
Несмотря на планы ограничения использования сторонних cookie-файлов в Chrome в следующем году, специалисты в сфере данных продолжают находить новые способы отслеживания пользователей. Согласно исследованию Шаур Мунира, аспиранта Университета Калифорнии в Дэвисе, около 73% из 20 000 анализируемых сайтов добавляют данные в URL для отслеживания активности посетителей.
Мунир представил инструмент на базе машинного обучения под названием PURL , который помогает выявлять и обезвреживать изменения ссылок, используемые для отслеживания. По утверждению Мунира, PURL работает эффективнее, чем другие средства противодействия отслеживанию.
Добавленные параметры в ссылке включают путь к ресурсу, параметры запроса и фрагменты. Именно они используются для хранения и передачи данных, что ставит под угрозу конфиденциальность пользователей.
Мунир привёл пример URL-адреса с оформлением ссылки, в котором присутствуют параметры отслеживания:
http://go[.]artinstitutes[.]edu/search/brand/local/PSGLC?source=BGNAG&ven=search&amp.... =Exact&gclid=KjwKEAjwq6m3BRsdfdfsdfCP7IfMq6Oo9gsdfACRc0bN3J-fcQ1t1DdfO5AyuTfKIyFbg TFPfCmPXyGdrKRBoCmv3w_wcB
В этом URL-адресе та часть, которая начинается с ключа «gclid», содержит идентификатор отслеживания.
Другой пример:
https://example[.]com/page?utm_source=newsletter&utm_medium=email
Здесь utm_source и utm_medium — это добавленные параметры для отслеживания источника трафика.
По данным Мунира, 69,4% проверенных сайтов передают информацию, хранимую в cookie-файлах, через добавление параметров в URL. Проблема заключается в том, что параметры могут иметь как функциональное, так и отслеживающее назначение. И, хотя использование дополнительных данных для отслеживания не является новой проблемой, в последние годы это стало особенно актуальным.
Учитывая ограничения по использованию сторонних cookie-файлов, специалисты по рекламе стали использовать другие техники – первичные cookie-файлы и цифровые отпечатки (fingerprint). Мунир отметил, что такие платформы, как Google Analytics, активно используют первичные cookie-файлы, а отслеживание по адресам электронной почты и номерам телефонов становится все более распространенным.
Согласно исследованию на основе выборки 20% из миллиона лучших сайтов, было обнаружено около 45 миллионов изменений ссылок. Причем около 45% из них были определены как рекламные и отслеживающие.
Однако простое удаление параметров может нарушить работоспособность сайта. Так, PURL обнаружил, что почтовые адреса, введенные на веб-страницах, часто передаются третьим лицам, иногда даже в незашифрованном виде. Кроме того, некоторые платформы полагаются на email-адреса для идентификации пользователей.
Мунир заявил, что автоматизированный подход PURL, использующий машинное обучение, необходим для борьбы с масштабной проблемой отслеживания в сети. PURL показал точность в 98,74%, что делает его одним из наиболее эффективных инструментов в этой области. Мунир также подчеркнул необходимость внедрения автоматизированных решений для противостояния сложности и масштабу современных методов отслеживания.
Первое — находим постоянно, второе — ждем вас