Один неожиданный ход обещает очистить веб от лишнего шума.
Компания Brave представила новый инструмент под названием Cookiecrumbler, направленный на борьбу с навязчивыми уведомлениями о согласии на использование файлов cookie. Его особенностью стало применение больших языковых моделей (LLM) для автоматического поиска таких баннеров и организация процесса их блокировки через открытое сообщество.
Браузер Brave с 2022 года блокирует баннеры согласия на cookies на всех сайтах по умолчанию. Однако со временем выяснилось, что массовая блокировка может приводить к серьёзным сбоям в работе сайтов — от поломки процесса оформления заказа до проблем с отображением страниц. В Brave подчёркивают, что неправильное удаление баннеров иногда вызывает пустые страницы и неработающий скроллинг, что портит опыт взаимодействия с сайтом.
Cookiecrumbler решает эту проблему более аккуратно. Инструмент работает следующим образом: он сканирует популярные сайты через прокси-серверы в разных регионах, загружает их страницы с помощью Puppeteer и определяет потенциальные баннеры согласия. Далее эти элементы передаются языковой модели для классификации и выработки предложений по их блокировке. Результаты анализа публикуются на GitHub в виде открытых задач, которые затем проверяются сообществом вручную для минимизации риска нарушить функциональность сайтов.
Такой подход позволяет Cookiecrumbler автоматически и с учётом региональных особенностей выявлять и блокировать баннеры без существенного роста числа ложных срабатываний. Важно, что весь процесс полностью отделён от пользовательских данных: инструмент работает исключительно на серверах Brave и не затрагивает реальные пользовательские сессии. Для анализа применяются публичные списки сайтов вроде Tranco, а доступ к ним осуществляется через прокси.
Именно стремление сохранить приватность стало причиной, по которой Cookiecrumbler пока не интегрирован непосредственно в браузер Brave. Компания заявляет, что инструмент будет встроен в продукт только после проведения полноценной проверки на соответствие внутренним стандартам безопасности и конфиденциальности.
Поскольку Cookiecrumbler опубликован в открытом доступе на GitHub, воспользоваться им смогут не только разработчики Brave, но и все желающие — от создателей других средств защиты приватности до администраторов сайтов и специалистов по аудиту безопасности. Это открывает возможность для более точной настройки фильтров блокировки и улучшения пользовательского опыта без ущерба для работы сайтов.