Специалисты по биоинформатике из Исследовательского центра имени Томаса Ватсона в Нью-Йорке применили новую технологию борьбы со спамом.
Технология называется Chung-Kwei. Chung-Kwei уже использовалась для поиска одинаковых фрагментов в структуре ДНК. На этот раз исследователи проанализировали повторяющиеся участки 65 тыс. спамерских посланий.
Каждое электронное письмо обрабатывалось как длинная ДНК-подобная цепь. В ходе исследования было обнаружено 6 млн. повторяющихся фрагментов. Каждый из таких фрагментов представляет собой специфичную последовательность слов и чисел, которые появляются более чем в одном из посланий. Такой же обработке была подвергнута группа электронных посланий, не относящихся к категории спама. После этого из списка спамерских фрагментов были изъяты те из них, которые появлялись в обеих группах. Таким образом в списке остались лишь фрагменты, характерные для спама. Нахождение достаточно большого количества таких фрагментов в послании определяет его как спам.
Технология Chung-Kwei может идентифицировать до 97% спама. IBM планирует включить Chung-Kwei в противоспамовые программы SpamGuru, сообщил NiTnews. //Cnews
Гравитация научных фактов сильнее, чем вы думаете