Современные поисковые системы стараются понимать естественный язык вопрошающего. В идеале поисковик должен найти адекватный результат даже в том случае, если ни одно слово из поискового запроса не встречается в найденной странице, но их смысл соответствует.
Именно такая задача стоит перед DLP-системой: найти то, не знаю чтодокумент с конфиденциальной информацией, изложенной любыми словамиили даже без слов. Семантические, лингвистические и всякие онтологические методы анализа тут расцветают.
Неудивительно, что в составе DLP-систем современного поколения появляется краулер, он же паук-сборщик, он же поисковый робот – в точности как у "больших" поисковиков. Он ходит по всем закоулкам корпоративной сети с пропуском-"вездеходом", понимает все языки, протоколы и форматы и ищет, где чего плохо лежит. Но, разумеется, не тащит всё найденное в собственную базу, как это делают жадный Гугл и любопытный Яндекс, иначе он сам мог бы стать источником утечек.
Краулер появился в последней версии нашего продукта – InfoWatch Traffic Monitor Enterprise 4.0. Чем ответят конкуренты?
Обращаем внимание, что все материалы в этом блоге представляют личное мнение их авторов. Редакция SecurityLab.ru не несет ответственности за точность, полноту и достоверность опубликованных данных. Вся информация предоставлена «как есть» и может не соответствовать официальной позиции компании.
Твой код — безопасный?
Расскажи, что знаешь о DevSecOps.
Пройди опрос и получи свежий отчет State of DevOps Russia 2025.