Автоматизация аналитической работы органов наркоконтроля с информацией, размещенной в социальных сетях

Автор: Галушин Павел Викторович, Смирнов Игорь Аркадьевич

Журнал: Вестник Сибирского юридического института МВД России @vestnik-sibui-mvd

Рубрика: Взгляд. Размышления. Точка зрения

Статья в выпуске: 3 (16), 2014 года.

Бесплатный доступ

В статье рассматриваются возможности автоматизации аналитической работы органов наркоконтроля с информацией, размешенной в социальных сетях, с использованием алгоритмов теории графов. Обсуждается постановка и формализация задачи поиска кратчайшей цепочки пользователей, соединяющей двух заданных лиц, методы ее решения, а также предполагаемая структура аппаратно-программной системы, которая может быть использована для решения данной задачи, и проблемы, связанные с ее разработкой и созданием.

Аналитическая работа, социальные сети, теория графов

Короткий адрес: https://sciup.org/140196285

IDR: 140196285

Текст научной статьи Автоматизация аналитической работы органов наркоконтроля с информацией, размещенной в социальных сетях

Н езаконный оборот наркотиков остается одной из острейших проблем, представляющих высокую общественную опасность для личности, общества и государства.

Ситуация осложнена все большим вовлечением в наркооборот несовершеннолетних и молодежи, а также неснижающимся уровнем смертности от отравления наркотиками, ВИЧ и иных сопутствующих нарко- мании заболеваний и суицидов наркозави-симых лиц.

Приходится констатировать, что действующие схемы наркотрафика, сбыта наркотиков не только на улицах, но и в школах, клубах, на предприятиях формируют крупномасштабный поток наркопотребления.

Незаконный оборот наркотиков построен на законе рынка: "спрос рождает пред- ложение". Чем больше изымается из незаконного оборота наркотиков при сохранении спроса на них, тем выше их стоимость и тем еще более привлекательным становится регион для очередных наркопоставок. Как правило, наркосиндикаты легко и быстро восстанавливают свои ряды через телекоммуникационную сеть Интернет, в первую очередь за счет наркозависимых, которые вовлекают в потребление новичков и становятся очередными наркодилерами. Одновременно на фоне увеличения стоимости "зелья" множится число преступлений, совершаемых в целях добычи средств на очередную дозу.

В этих условиях на первый план выходит задача: не ослабляя натиск на криминал и совершенствуя методы лечения нар-козависимых, организовать реально работающую систему информационно-аналитического обеспечения оперативно-розыскной деятельности органов наркоконтроля с использованием автоматизированных информационных систем анализа социальных сетей телекоммуникационной сети Интернет, направленную, в первую очередь, на уменьшение спроса на наркотики через Интернет.[6]

Информационно-аналитическая работа представляет собой деятельность специально выделенных субъектов для исследования, познания закономерностей каких-либо явлений, процессов, какого-либо рода, вида, направления деятельности государственных, общественных, частных организаций, учреждений (или их совокупности), сообществ людей, общества в целом.[7]

В настоящее время социальные сети развиваются стремительными темпами и охватывают все большее число людей. Так, в одной из самых известных социальных сетей – Facebook – зарегистрированы более 1,2 миллиарда пользователей, российские социальные сети Вконтакте и Одноклассники насчитывают более 200 миллионов пользователей каждая [10]. Таким образом, социальные сети содержат огромные массивы данных о лицах, представляющих оперативный интерес, и взаимоотношениях между ними.

Из-за огромного количества информации и все более ускоряющихся темпов ее накопления современная аналитическая деятельность немыслима без использования автоматизированных информационных систем, то есть совокупности содержащейся в базах данных информации и обеспечивающих ее обработку информационных технологий и технических средств.[8]

Так, например, решение задачи поиска кратчайшей цепочки фигурантов, соединяющих двух лиц, представляющих оперативный интерес, обуславливается тем, что длина цепочки знакомств между двумя фигурантами позволяет оценить, насколько вероятна связь между ними (в том числе вне социальных сетей), что может быть полезным для решения задач оперативнорозыскной деятельности.[3]

Большинство социальных сетей позволяют получить доступ к списку пользователей, которых данный пользователь считает друзьями. Однако этой информации недостаточно для решения рассматриваемой задачи. Размер списка друзей, как правило, исчисляется десятками и может достигать сотен. Поэтому уже ручное составление списка "друзья друзей" (не говоря уже о более длинных цепочках преступных связей) и ручной поиск в нем, как правило, не могут быть выполнены за разумное время.

Рассмотрим, как данная задача может быть формализована и решена с помощью средств вычислительной техники. В рамках данной задачи социальная сеть может быть представлена следующим образом. Пользователей социальной сети обозначим точками, а связи между пользователями (например, отношения дружбы) – линиями, соединяющими соответствующие точки. В информатике такое представление называется графом.[1] В рамках этой терминологии точки-пользователи называются вершинами, а связи – ребрами. Изображение графа условной социальной сети приведено на рисунке 1. На рисунке 2 представлен полный граф социальной сети Facebook [2].

Отметим, что отношение дружбы не является единственным, представляющим интерес. Можно также рассмотреть такие

Рис. 1. Пример графа социальной сети отношения, как "отмечены на одной фотографии", "входят в одну группу", "вместе учились" и т.д. Однако для определенности мы в дальнейшем будем рассматривать только одно отношение: "являются друзьями".

Задача поиска цепочки пользователей, соединяющих двух заданных лиц, эквивалентна задаче поиска кратчайшего пути (длина пути равна количеству ребер в этом пути) между вершинами графа социальной сети – это хорошо известная задача теории графов, для которой существует эффективный алгоритм решения – поиск в ширину [1, c.456].

По сути, данный алгоритм выполняет ту же самую работу, что и человек, который захотел бы найти цепочку людей вручную. Идея этого алгоритма заключается в последовательном посещении вершин графа по уровням: сначала непосредственно связанные с начальной вершиной, затем связанные с начальной вершиной через одну промежуточную и т.д. Уже посещенные вершины запоминаются и повторно не посещаются. В итоге будут посещены все вершины, связанные с начальной вершиной, причем один раз.

Затраты времени на выполнение алгоритма поиска в ширину пропорциональны сумме количеству вершин и ребер графа.

Еще одним достоинством алгоритма поиска в ширину является его способность работать с потенциально бесконечными графами: если в бесконечном графе содержится цепочка знакомств между людьми, она будет найдена.

Программная система, реализующая возможности поиска цепочек пользователей в социальных сетях, должна состоять из двух основных модулей: модуля построения

Рис. 2. Граф социальной сети Facebook. - 119 -

графа социальной сети и модуля поиска пути.

Модуль построения графа социальной сети собирает информацию о пользователях социальной сети и их списки друзей. Большинство социальных сетей предоставляет соответствующую информацию через специальный интерфейс (API социальной сети). Рассмотрим проблемы, которые возникнут при разработке этого модуля.

Во-первых, каждая социальная сеть имеет свой собственный интерфейс, поэтому для каждой социальной сети процедуру сбора информации необходимо разрабатывать фактически заново. Более того, интерфейс социальной сети может меняться со временем. Нельзя также исключать возможность противодействия владельцев и администрации социальных сетей (блокирование или ограничение доступа) как по техническим причинам, так и по идеологическим.

Во-вторых, чтобы ускорить поиск путей и исключить цепочки знакомств, которые с большой вероятностью не могут быть использованы, необходимо отсеивать неактивных пользователей, а также пользователей, не соответствующих реальным людям (это могут быть, например, поддельные учетные записи знаменитостей).

Кроме того, целесообразным представляется объединение графов разных социальных сетей в один общий граф. Однако для реализации этой возможности необходимо отождествлять учетные записи пользователя в разных социальных сетях, что является очень нетривиальной задачей и выходит за рамки данной статьи.

Так как в популярных социальных сетях зарегистрировано огромное количество пользователей, модуль построения графа социальной сети должен собирать информацию непрерывно и заблаговременно.

Модуль поиска пути работает с построенным графом социальной сети и ищет в нем по запросу пути между заданными пользователем учетными записями социальных сетей. Алгоритмы для работы с графами являются хорошо изученной областью информатики, существуют каче- ственные свободные реализации этих алгоритмов, например Boost.Graph [9]. С точки зрения сложности разработки этот модуль представляется самой простой частью системы.

Программная система поиска цепочек пользователей социальных сетей будет достаточно требовательной к вычислительным ресурсам. Потребуется высокоскоростное подключение к сети Интернет (для построения графа социальной сети), высокое быстродействие процессора и большой объем оперативной памяти (иначе граф не будет полностью помещаться в оперативной памяти, а чтение данных с жесткого диска происходит гораздо медленнее, чем из оперативной памяти).[4, 5]

Задача поиска пути между двумя пользователями может быть обобщена на случай поиска пути между одним пользователем и заданной группой пользователей.

В заключение кратко рассмотрим другие задачи исследования социальных сетей, которые могут быть решены с помощью теории графов.

  • 1.    Поиск сообществ, то есть групп пользователей, все члены которых связаны друг с другом (непосредственно или через других членов группы).

  • 2.    Выявление связей в группе, пресечение которых сильнее всего помешает распространению информации в данной группе. К данной задаче существует и обратная – выявление члена группы, через которого наиболее эффективно распространение информации в данной группе.

Отметим, что эти задачи целесообразно решать не только на полном графе социальной сети, но и на его фрагментах, а также любых схемах взаимодействия лиц, представляющих интерес для правоохранительных органов.

Таким образом, современная вычислительная техника в сочетании с алгоритмическим и программным обеспечением, позволяют автоматизировать решение задач, актуальных для оперативно-розыскных подразделений правоохранительных органов, которые являются слишком трудными для решения вручную.

Список литературы Автоматизация аналитической работы органов наркоконтроля с информацией, размещенной в социальных сетях

  • Алгоритмы: построение и анализ = Introduction to Algorithms/Томас Х. Кормен и др. -2-е изд. -М.: "Вильямс", 2006.
  • Все связи социальной сети Facebook на одной карте. URL: http://www.computerra.ru/4340/(дата обращения: 03.07.14).
  • Галушин, П.В. Возможности автоматизации аналитической работы с информацией, размещённой в социальных сетях/П.В. Галушин, С.Н. Ефимов//Современные системы безопасности -Антитеррор: материалы конгрессной части X специализированного форума (28-29 мая 2014 г.)/отв. ред. А.В. Букарин. -Красноярск: СибЮИ ФСКН России, 2014. -ISBN 978-5-7889-0218-0. -С. 169-171.
  • Ефимов, С.Н. Проектирование вычислительной сети эффективной архитектуры для распределенного решения сложных задач/С.Н. Ефимов, В.В. Тынченко, В.С. Тынчен-ко//Вестник СибГАУ: сборник научных трудов/под ред. проф. Г.П. Белякова; Сиб-ГАУ. -Вып. 3 (16). -Красноярск, 2007. -С. 15-19.
  • Ефимов, С.Н. Реконфигурируемые вычислительные системы обработки информации и управления/С.Н. Ефимов, В.А Терсков. -Красноярск: КрИЖТ ИрГУПС, 2013. -ISBN 978-5-903293-29-2.
  • Молоков, В.В. Интернет и наркотики/В.В. Молоков//Актуальные проблемы профилактики наркомании и противодействия правонарушениям в сфере легального и нелегального оборота наркотиков: материалы XV международной научно-практической конференции: в 3 ч. -Красноярск: СибЮИ ФСКН России, 2012. -Ч.1. -С. 72-75.
  • Молоков, В.В. Направления применения методов непараметрической статистики в решении задач профилактики и борьбы с преступностью/В.В. Молоков//Актуальные проблемы борьбы с преступностью в Сибирском регионе: сборник материалов 1 2 международной научно-практической конференции: в 3 ч. -Красноярск: СибЮИ МВД России, 2009. -Ч.2. -С. 115-118.
  • Об информации, информационных технологиях и о защите информации: Федеральный закон Российской Федерации от 27.07.2006 №149-ФЗ. Доступ из справочно-пра-вой системы КонсультатПлюс.
  • The Boost Graph Library (BGL), URL: http://www.boost.org/doc/libs/1_55_0/libs/graph/doc/index.html (дата обращения: 03.07.14).
  • Twitter и Facebook одержали победу над "ВКонтакте", URL: http://top.rbc.ru/spb_sz/13/01/2014/898903.shtml (дата обращения 03.07.14).
Еще
Статья научная