Создание системы обнаружения инсайда на бирже на основе теоретико-графового подхода
Автор: Лаврентьева М.А.
Журнал: Теория и практика современной науки @modern-j
Рубрика: Математика, информатика и инженерия
Статья в выпуске: 5 (59), 2020 года.
Бесплатный доступ
На сегодняшний день более 50% сделок, совершаемых на бирже, подозрительные. В статье приведено описание системы защиты от инсайда на бирже. Кроме того, приведены выборки и результаты тестирования, а также анализ ошибок первого и второго рода.
Информационная безопасность, биржа, инсайд, обнаружение подозрительных инсайдеров
Короткий адрес: https://sciup.org/140275497
IDR: 140275497
Текст научной статьи Создание системы обнаружения инсайда на бирже на основе теоретико-графового подхода
На сегодняшний день информация является исключительным ценным ресурсом, а ее защита – критически важным элементом коммерческой деятельности и функционирования государство [1]. Однако, несмотря на современные технологии, обеспечить полную информационную безопасность невозможно.
Биржа – площадка для проведения торгов между ее участниками, брокерами. При этом проблемами и угрозами информационной безопасности здесь являются внешние атаки и злоумышленники внутри компании: деструктивные действия хакерских групп, так и недобросовестные сотрудники, продающие конфиденциальную информацию, что приносит вред компании. Например, в следствие крупной утечки в американском в сентябре 2018 пострадало 147 млн человек [1].
По этой причине создается система, позволяющая обнаружить инсайд. Данная система работает на основе анализа совершенных участниками торгов сделок и поиска коэффициента сходства по формуле:
S(TH, ин) =
(iK^M.Ui))2
|TH| x |^H|
,i*j.
Здесь S - коэффициент схожести сделок пары участников TH, UH , работающих в одной компании H.
Участники торгов TH, UH совершают сделки t^Uj соответственно. При этом эти сделки могут быть одинаковы, тогда значение /(tj,Uj) = 1, или разными, т.е. /(tj,Uy)=0. Соответственно, чем больше рассматриваемая пара участников совершает одинаковых сделок, тем выше коэффициент 5 Е [0; 1].
Далее производится второй этап работы системы, то есть анализ подозрительной активности, а именно – отклонения числа, а также стоимости сделок от среднего показателя, рассчитанного на каждого подозрительного участника торгов. Данный этап при большом объеме выборки позволяет значительно снизить ошибки первого рода.
Следует также учесть, что при поиске коэффициента схожести сделок рассматриваются работники одной и той же компании, то есть та категория, которая имеет значительный шанс на использование внутренней информации в своих целях.
Кроме того, данная система должна работать с большим объемом информации, следовательно, может иметь в алгоритме работы параллельные процессы либо максимально упрощенную структуру с минимумом выполняемых операций на проверку каждого участника торгов. При реализации ее на языке С++ целесообразно использовать последний подход.
Упрощенный алгоритм работы в этом случае представлен на рисунке:

Рисунок 1 - Упрощенный алгоритм работы системы
Тестирование системы производится на тестовых наборах, исходные данные для которых расположены в [2]-[4] и генерируются по мере формирования отчета по торгам на бирже. При этом для проведения функционального тестирования системы была предложена выборка из совершенных на бирже сделок в период с 13 марта по 31 марта 2020 года (см. [2], [3], [4]).
Результаты тестирования приведены на рисунках 2-3.
ЧАС |
COPPOLA_EDWARD_C ANDERSON_DANA_K Mar |
31: |
0.50000 |
A |
ЧАС FIS FIS FIS FIS FIS FIS FIS FIS FIS FIS FIS FIS |
COPPOLA_EDKARD_C Healey_Doug_3 Mar Norcross_Gary Montana_Gregory_G Mar Norcross_Gary MayoJ4arcJ4 Mar 30: Norcross_Gary L0WTHERS_BRUCE_F_3R Mar Norcross_Gary HUNT_DAVID_K Mar 30: Norcross_Gary M0ZE_BARRY Mar 30: Norcross_Gary M0ZE_BARRY Mar 30: Norcross_Gary HUGHES_KEITH_W Mar 30: Norcross_Gary Boyd_Martin Mar 30: Norcross_Gary PARENT_L0UISEJ4 Mar 30: Norcross_Gary Alemany_Ellen_R Mar 30: Montana_Gregory_G MayoJ4arcJ4 Mar Montana_Gregory_G L0WIHERS_BRUCE_F_3R |
31: 30: 1.00000 30: 1.00000 1.00000 1.00000 1.00000 1.00000 1.00000 1.00000 30: Mar |
0.50000 1.00000 1.00000 1.00000 30: 1.00000 |
|
FIS FIS FIS FIS FIS FIS FIS ADI ADI |
Montana_Gregory_G HUNT_DAVID_K Mar Montana_Gregory_G M0ZE_BARRY Mar Montana_Gregory_G M0ZE_BARRY Mar Montana_Gregory_G HUGHES_KEITH_W Mar Montana_Gregory_G BoydJ4artin Mar Montana_Gregory_G PARENT_L0UISEJ4 Mar Montana_Gregory_G Aleinany_Ellen_R Mar Sondel J4ichael Hassett_Joseph Mar 29: Sondel J4ichael Mahendra-Rajah_Prashanth |
30: 30: 30: 30: 30: 30: 30: 1.00000 Mar |
1.00000 1.00000 1.00000 1.00000 1.00000 1.00000 1.00000 29: 1.00000 |
|
ADI 4G |
Sondel J4ichael R0CHE_VINCENT Mar 29: WELDON_WAYNE_CURTIS Bertolotti_Dennis |
1.00000 Mar |
30: 1.00000 |
|
FIS FIS FIS FIS FIS FIS FIS FIS WFC |
MayoJ4arc_M L0WTHERS_BRUCE_F_3R Mar MayoJ4arc_M HUNT_DAVID_K Mar 30: MayoJ4arc_M MOZE_BARRY Mar 30: MayoJ4arcJ4 M0ZE_BARRY Mar 30: MayoJ4arc_M HUGHES_KEITH_W Mar 30: MayoJ4arc_M Boyd_Martin Mar 30: MayoJ4arc_M PARENT_L0UISEJ4 Mar 30: MayoJ4arc_M Al einany_El 1 en_R Mar 30: Weiss_Jonathan_G. Shrewsberry_John_R. |
30: 1.00000 1.00000 1.00000 1.00000 1.00000 1.00000 1.00000 Mar |
1.00000 29: 1.00000 |
|
WFC WFC WFC |
Weiss_Jonathan_G. Pelos_Petros_G Mar 29: Weiss_Jonathan_G. Norton_Ainanda_G Mar 29: Weiss_Jonathan_G. Wi nder_Investment_Pte_Ltd |
1.00000 1.00000 Mar 29: 1.00000 |
||
KFC WFC WFC |
Weiss_3onathan_G. Mack_Mary_T Mar Weiss_Jonathan_G. LEVY_RICHARD Mar Weiss_Jonathan_G. Gal1 oreese_David |
29: 29: Mar |
1.00000 1.00000 29: 1.00000 |
|
WFC WFC WFC |
Weiss_Jonathan_G. SHAH_HASU_P Mar Weiss_Jonathan_G. Ross_Ronald_R Mar Weiss_Jonathan_G. Van_Ramshorst_David_J |
29: 29: Mar |
1.00000 1.00000 29: 1.00000 |
|
WFC |
Weiss_Jonathan_G. Van_Ramshorst_David_J |
Mar |
29: 1.00000 |
|
WFC |
Weiss_Jonathan_G. Van_Ramshorst_David_J |
Mar |
29: 1.00000 |
|
WFC |
Weiss_3onathan_G. Van_Ramshorst_David_J |
Mar |
29: 1.00000 |
|
WFC |
Weis s_3onathan_G. Lenti n el 1o_S_Davi d |
Mar |
29: 1.00000 |
|
KFC KFC KFC FIS FIS FIS FIS FIS FIS FIS |
Weis s_3onathan_G. Flowers_Derek_A. Weiss_3onathan_G. Connors_3ohn_G Mar Weiss_3onathan_G. Connors_3ohn_G Mar L0WTHERS_BRUCE_F_3R HUNT_DAVID_K Mar L0WTHERS_BRUCE_F_3R MOZE_BARRY Mar L0WTHERS_BRUCE_F_3R MOZE_BARRY Mar L0WTHERS_BRUCE_F_3R HUGHES_KEITH_W Mar L0WTHERS_BRUCE_F_3R BoydJ4artin Mar L0WTHERS_BRUCE_F_3R PARENT_L0UISEJ4 Mar L0WTHERS_BRUCE_F_3R Alemany_El1en_R Mar |
Mar 29: 29: 30: 30: 30: 30: 30: 30: 30: |
29: 1.00000 1.00000 1.00000 1.00000 1.00000 1.00000 1.00000 1.00000 1.00000 1.00000 |
V |
Рисунок 2 – Для каждой компании пары инсайдеров, выполняющие одинаковые операции в одну и ту же дату
Kilson_Steven_К. д
Ki lson_Steven_K.
Corak_David
ROBERTS—3OHN_3OSEPH
LANDY_SAMUEL_A
Gal1 oreese_David
SHAH_HASU_P
Ross_Ronald_R
Van_Ramshorst_David_3
Van_Ramshorst_David_3
Van_Ramshorst_David_3
Van_Ramshorst_Davi d_3
Lentinel1o_S_David
Flowers_Derek_A.
Connors_3ohn_G
Connors_3ohn_G
Papkoff_3acqueline_Sybi1
Colonno_Richard.3ames
3ohnson_Andrew_Marti n
Nagel—Scott
C as s an i _St eph en
KYOCERA_CORP
CITIGROUP—INC
CITIGROUP—INC
CITIGROUP—INC
CITIGROUP—INC
CITIGROUP—INC
CITIGROUP—INC
Hadiey_Harbor_Master—Investors
Kinder_Investment_Pte_Ltd
Kinder_Investment_Pte_Ltd
Hadiey_Harbor_Master_Investors
BAY_5TREET_FINANCIAL_S.A.
Kinder_Investment_Pte_Ltd
Spruce_House_Partnership_LLC
FPR_PARTNERS_LLC
TTWFGP_LLC
Kinder_Investment_Pte_Ltd
TTWFGP_LLC
Kinder_Investment_Pte_Ltd
TTWFGP_LLC
TTWFGP_LLC
Butterfield_Shelby_3
Butterfield_5helby_3
FPR_PARTNERS_LLC
FOSS_DONALD_A
5OSIN_CLIFFORD
5OSIN_CLIFFORD
Hudson_Bay_Capitai„Management
Blackstone_Group_Inc
GSO_Holdings_I_LLC
Blackstone_CQP_Comnon_Holdco_L
FPR-PARTNERS—LLC
FOSS-DO NALD_A
GLAZER-CAPITAL,_LLC
PRESCOTT_GROUP_CAPITAL_MANAGEM
Для продолжения нажмите любую клавишу . . . *
Рисунок 3 – Инсайдеры, чьи средние показатели стоимости и числа совершенных сделок существенно отличаются от текущего значения
Согласно результатам отладки и тестирования, представленным в разделах 3.3.6, 3.4, вероятность ошибки первого рода при работы системы не превышает 0,005. При этом вероятность ошибки второго рода при тестировании с использованием небольшого числа сделок составляет
0,023, а при тестировании с использованием сделок из таблицы 8 также не превышает 0,005.
Кроме того, проанализировав различные объемы выборок от 8 до 600 совершенных сделок, были получены следующие результаты. При совсем небольших выборках второй этап системы не рассматривает много подозрительных инсайдеров. Причиной является недостаток информации для анализа средних показателей.
В случае с большими выборками система работает значительно медленнее, но при этом на втором этапе остаются инсайдеры, которые имели подозрительную активность на бирже. При этом достоверность результатов становится значительно выше.
Список литературы Создание системы обнаружения инсайда на бирже на основе теоретико-графового подхода
- Электронная энциклопедия "Академик" // Дециль. Экономический словарь [Электронный документ] - URL: https://dic.academic.ru/dic.nsf/econ_dict/20852 (Дата обращения 01.03.2019).
- Financial visualisations // Top Insider Trading Resent Week [Электронный документ] - URL:https://finviz.com/insidertrading.ashx?or=-10&tv=100000&tc=7&o=-transactionValue (Дата обращения 01.04.2020).
- Financial visualisations // Latest Insider Traiding [Электронный документ] - URL: https://finviz.com/insidertrading.ashx?tc=7 (Дата обращения 01.04.2020).
- Financial visualisations // Top 10% Owner Trading Resent Week [Электронный документ] - URL: https://finviz.com/insidertrading.ashx?or=10&tv=1000000&tc=7&o=-transactionValue (Дата обращения 01.04.2020).