Исследование Recaptcha третьей версии

Шарипов Марат Минхарисович; Sharipov M.M.

doi:10.25586/RNU.V9187.19.02.P.135

Научные статьи \ Общие вопросы науки и культуры \ Информационные технологии. Вычислительная техника. Обработка данных \ Связь компьютеров. Сети ЭВМ. Вычислительные сети

Исследование Recaptcha третьей версии

Автор: Шарипов Марат Минхарисович

Журнал: Вестник Российского нового университета. Серия: Сложные системы: модели, анализ и управление @vestnik-rosnou-complex-systems-models-analysis-management

Рубрика: Информатика и вычислительная техника

Статья в выпуске: 2, 2019 года.

Бесплатный доступ

В статье рассматривается использование технологии reCAPTCHA с целью фильтрации и ограничения доступа к веб-сайту автоматизированных программ - ботов. Проводится исследование новой версии reCAPTCHAv3. Проводится анализ принципов работы алгоритма, на котором основывается новая версия .

Фильтрация, бот, алгоритм, программа, интернет, решение

Короткий адрес: https://sciup.org/148309028

IDR: 148309028 | УДК: 004.738.5 | DOI: 10.25586/RNU.V9187.19.02.P.135

Research Recaptcha third version

The article discusses the use of reCAPTCHA technology in order to filter and restrict access to the website of automated programs - bots. A study of the new version of reCAPTCHA v3 is underway. The analysis of the principles of the algorithm on which the new version is base.

Текст научной статьи Исследование Recaptcha третьей версии

Развитие информационных технологий повлекло за собой появление в сети Интернет большого количества компьютерных программ, или так называемых ботов, которые выполняют заданные автоматически команды через пользовательский интерфейс, предназначенный для людей. Несмотря на то, что данные программы нашли широкое применение и используются для автоматического сбора и анализа данных о погоде, биржевых и валютных курсах, их использование нередко носит и вредоносный характер. Так, в настоящее время разработаны боты, которые способны скупить лучшие места на авиарейс, организовать DoS-атаки, зарегистрироваться на сайте, принимать непосредственное участие в онлайн-играх для фарминга игровой валюты, что приносит значительный материальный ущерб.

Для борьбы с цифровыми ботами в университете Карнеги – Меллон была разработана система, которая в сентябре 2009 г. была выкуплена компанией Google. Данная разработка получила название reCAPTCHA. Алгоритм системы строится на распознавании и вводе пользователем символов с картинки, так называемой «капчи». Применение данной технологии позволило не просто оградить веб-сайты от вредоносного влияния веб-ботов, но и отцифровывать книги, ранее находившиеся лишь на бумажных носителях (в 2011 г. reCAPTCHA выполняла оцифровку архивов газеты «The New York Times» и книг из Google Book Search). Google reCAPTCHA стала популярной системой для контроля отправки спам-контактных форм и злоупотребления трафиком на веб-сайтах.

С момента запуска системы защиты от ботов было представлено несколько версий программы.

1. reCAPTCHA v1 – ввод символов с картинки, чтение которых усложнено наложением дополнительных шумов, искажений, препятствующих автоматизации с помощью программных средств. При вводе символов важно учитывать раскладку клавиатуры

136 в ыпуск 2/2019
2. reCAPTCHA v2 – алгоритм основывается на проверке действий пользователя вебресурсом, при подозрении автоматизации действий предлагается решить «капчу». Как правило, в качестве задания предоставляется 9 изображений, среди которых необходимо выбрать только относящиеся к определенной тематике. Если же действия пользователя не вызывали сомнений, решение было доступно в один клик подтверждения «Я не робот» [1].
3. reCAPTCHA v3 – не требует взаимодействия с пользователем, т.е. проверка на основе анализа риска происходит в фоновом режиме. Система производит анализ cookie-файлов, ранее сохраненных в истории пользователя, отслеживает поведение и дает оценку действиям.

(русский/английский), а также символьный регистр. Данный вид проверки не всегда возможно пройти, так как часто исходные данные для ввода зашифрованы некорректно и вызывают проблемы у пользователей [1].

В настоящий момент представленная третья версия проходит бета-тестирование. Для разработчика доступен программный код, который необходимо прописать в своем сайте для использования и помощи в тестировании reCAPTCHA v3 [2].

Алгоритм проверки основывается на присвоении действиям пользователя численного значения в диапазоне от 1,0 до 0,0. Система проводит анализ каждого действия пользователя на веб-странице. На основе этого анализа проводится оценка. Для успешного распознавания в пользователе человека необходимо пройти порог в 0,3 балла. Если же это число ниже, то система определяет пользователя как автоматизированную программу, т.е. как бота. Так как система работает в фоновом режиме и при ее прохождении реальный пользователь может и не узнать о подключенной системе проверки, то целесообразно устанавливать код проверки сразу на несколько страниц для представления объективных данных и повышения качества распознавания. Структурного описания алгоритма, как происходит оценивание и дальнейшее действие, компания не разглашает.

Абнер Ли в 9to5Google считает, что основная цель разработчиков заключается в ранжировании оценок и выяснении, насколько подозрительно взаимодействие с пользовательским интерфейсом. При таком решении необходимость подключать пользователей к проблеме решения задач для дополнительной верификации сводится к минимуму [3].

Приподключениитехнологии reCAPTCHA v3 ксвоемусайту в консолиадминистратора появляется информация о подозрительных активностях, оценках и другой объективной информации. Для подключения необходимо зарегистрировать свой сайт на странице reCAPTCHA и войти в систему с учетной записью Google, а затем потребуется произвести интеграцию системы, т.е. добавить необходимый код на сайт. Дальнейшие действия по блокировке активностей, не прошедших систему оценивания, производятся администратором сайта. Также можно установить, что сообщения о подозрительном трафике, зафиксированном с помощью Google reCAPTCHA, будут приходить на e-mail. Таким образом, администраторы теперь сами смогут управлять поведением reCAPTCHA на их сайте, когда раньше этим занимался Google. TechSpot выделяют три способа по настройке параметров reCAPTCHA [3].

1. Установить порог, который определяет, когда пользователь пропускается или когда должна быть проведена дополнительная проверка. Например, с использованием двухфакторной аутентификации и проверки телефона, проверки через e-mail.
2. Объединить систему оценивания с дополнительными сигналами, историей пользователя и транзакциями.
3. Использовать систему для машинного обучения уже установленной системы блокирования подозрительного трафика на веб-ресурсе.

Шарипов М.М. Исследование reCAPTCHA третьей версии 137

Стоит отметить, что ранее взаимодействие и внесение дополнительных условий в алгоритм проверки были невозможны.

Для выявления всех возможностей новой версии reCAPTCHA проведем сравнительный анализ с предшествующими версиями.

Сравнительный анализ возможностей версий reCAPTCHA

	reCAPTCHA V1	reCAPTCHA V2	reCAPTCHA V3
Взаимодействие с пользователем	Происходит при вводе зашифрованного набора символов	Необходимое условие –выбрать набор изображений, относящихся к одной тематике	Происходит в фоновом режиме
Условие проверки	Безошибочный ввод символов с картинки	Подтверждение всех необходимых изображений	Проверка проходит на основе анализа рисков. Учитываются предыдущие сессии, блокируется подозрительный трафик
Установка на веб-сайт	Прописывается в место подтверждения формы	Установка в необходимое место на странице сайта	Скрипт устанавливается в любое место. Для точности проверки необходима установка на несколько страниц
Возможность интеграции с собственными методами проверки	Отсутствует	В зависимости от результата проверки предоставлять пользователю вариант решения задачи	После получения результатов анализа рисков администратор сам назначает дальнейшее действие для блокировки подозрительного трафика
Отчет о подозрительных активностях	Общая статистика	В консоли администратора	Структурированный отчет о каждом пользователе

После проведения сравнительного анализа было выявлено, что версия reCAPTCHA V3 включает в себя часть алгоритмов предшествующих версий, но при этом проверка происходит в фоновом режиме, что не отвлекает и не отпугивает пользователя. В новой версии reCAPTСHA появилось еще больше гибкости для настройки системы под свои нужды, что позволяет реализовать больше вариаций для использования на разных страницах сайта. При этом значительно улучшилось качество проверки, появилась возможность интеграции с собственными методами проверки. Вывод отчета в консоли администратора позволит строить график подозрительных активностей, применять дополнительные методы фильтрации.

Развитие современных информационных технологий не стоит на месте. С появлением новых разработок появляются методы их обхода. Несмотря на это, запуск версии reCAPTCHA V3 – это шаг к новому, инновационному методу фильтрации сети Интернет от вредоносных автоматизированных программ.

Выпуск 2/2019

Список литературы Исследование Recaptcha третьей версии

Абрасимов М.Б., Маторин А.А. Анализ надежности графических captcha-систем на примере проекта reCAPTCHA // Математические основы интернет-безопасности.
Habr [Электронный ресурс]. URL: https://habr.com/ru/company/globalsign/blog/415075/ (дата обращения: 26.02.2019).
Zhang T.Y., Suen C.Y. A fast parallel algorithm for thinning digital patterns // Comm. ACM. 1984. Vоl. 27. № 3. P. 236-239.