Порнография: Вы знаете, когда можете увидеть ее, а знает ли Ваш ПК?

Порнография: Вы знаете, когда можете увидеть ее, а знает ли Ваш ПК?
Вне зависимости от вашей личной точки зрения на порнографию бывают случаи, когда просмотр откровенных изображений и видео всегда будет неприемлем. Например, просмотр порнографии на работе, как правило, запрещен, а в некоторых странах даже является преступлением, или, допустим, просмотр и показ порнографии несовершеннолетним также запрещены законом.

Чтобы соответствовать этим правилам, компании и родители регулярно используют контент-фильтры, которые позволяют блокировать доступ к «взрослым» веб-сайтам . Соцсети также делают свое дело, автоматически обнаруживая и удаляя порнографические материалы.

Но все же проблема существует. Автоматизированные системы обнаружения порнографии не так точны, как вы можете надеяться.

Машинное обучение и неприличные картинки
Машинное обучение (Machine Learning) – это относительно новая технология, которая позволяет копаниям автоматизировать ключевые задачи. Показав на специальном компьютерном алгоритме достаточное количество примеров определенных типов файлов или картинок, система может научиться самостоятельно определять отличительные характеристики каждого из них.

Возьмем к примеру антивирус Panda Dome . Антивредоносная система обучена блокировать и удалять вирусы автоматически, даже если никогда ранее не видели этот конкретный образец угрозы. Как она работает? Наша система была обучена с использованием десятков тысяч примеров различных вредоносных программ, после чего она научилась с высокой степенью точности распознавать те же характерные признаки на других файлах и приложениях, ссылках или почтовых вложениях.

Блокировщики порнографии работают аналогичным образом. Показывая системе достаточное количество порнографических изображений, приложение способно научиться самостоятельно распознавать другие, потенциально порнографические картинки.
Но есть одна проблема…

Нюансы «обнаженки»
Проблема с автоматическим обнаружением порнографии связана с тем, что каждый человек имеет несколько иное определение того, что является приемлемым, а что – нет. Изображение женщины в бикини может быть прекрасно, но аналогичное изображение дамы в нижнем белье – не всегда. Согласно компьютерному алгоритму, женщина на обоих картинках носит примерно одинаковое «количество» одежды, но ведь еще необходимо определить «контекст» этой одежды.

Соцсети уже сталкиваются с этой проблемой. Facebook, например, лихо удаляет фотографии кормящих ребенка матерей, потому что его алгоритм не способен понять смысл изображения. У Tumblr были еще более серьезные проблемы после того, как в декабре они активировали свой порно-фильтр: система ошибочно отмечала и удаляла все виды не порнографических изображений, включая рыб, вазы или ведьм.

Разрешает ли интеллектуальный фильтр показывать изображения «на грани» или блокирует их, в любом случае всегда найдутся те, кто будет недоволен результатом его работы.

В конечном итоге, интеллектуальные системы, построенные с использованием машинного обучения, имеют свои недостатки, потому что люди, которые запрограммировали их, неспособны точно указать границу, где заканчивается приемлемое изображение и начинается порнография. Алгоритмы могут блокировать 99,9% сомнительного контента, но оставшиеся 0,1% всегда будут проблемой.

Эти нюансы не имеют отношения к системам обнаружения вредоносных программ, потому что файл может иметь только два состояния: «вирус» или «не вирус». А вот изображения могут иметь три состояния: «порно», «не порно» и «возможно, порно». «Возможно, порно» - это случай, когда машинное обучение может (и делает это) дать слабину. Поэтому именно в этом направлении в ближайшие годы будет вкладываться основная часть инвестиций для развития автоматизированных систем.

Машинное обучение – это мощно, полезно и гибко. Возможно, после обширного обучения такие системы реально смогут блокировать контент в соответствии с вашими собственными предпочтениями.

Чтобы узнать подробнее о проактивных возможностях машинного обучения и о том, как оно может защищать вас прямо сейчас, скачайте бесплатную триал-версию антивируса Panda Dome .


Panda Security в России и СНГ
+7(495)105 94 51, marketing@rus.pandasecurity.com
информационная безопасность машинное обучение Искусственный интеллект контент-фильтр
Alt text
Обращаем внимание, что все материалы в этом блоге представляют личное мнение их авторов. Редакция SecurityLab.ru не несет ответственности за точность, полноту и достоверность опубликованных данных. Вся информация предоставлена «как есть» и может не соответствовать официальной позиции компании.

Ваша цифровая безопасность — это пазл, и у нас есть недостающие детали

Подпишитесь, чтобы собрать полную картину

Облачные решения

Новости и события компании. Информационная безопасность IT-устройств дома, малого и среднего бизнеса, антивирусы.