Об одной модели оценки рисков дефолта банка с использованием нейросетевых методов

Бесплатный доступ

Рассматривается задача оценки рисков банковского дефолта (отзыва лицензии вследствие неудовлетворительного финансового состояния и/или нарушения нормативов ЦБ) на основании сдаваемой им в ЦБ финансовой отчетности. Построение модели проводится с использованием нейросетевых методов. Обсуждаются методы подготовки данных, улучшающие точность моделирования, – кластеризация, очистка от «шумов» и противоречивых данных.

Устойчивость банковской системы, банковское регулирование, дефолт, нейросетевая модель, кластеризация

Короткий адрес: https://sciup.org/147201340

IDR: 147201340

Текст научной статьи Об одной модели оценки рисков дефолта банка с использованием нейросетевых методов

В настоящее время прогнозирование кризисов в банковской отрасли является важной темой в развитии экономических наук.

В условиях мирового финансового кризиса 2008-2009 гг. более отчетливо проявилась связь между государством, банковским и реальным секторами экономики. В это время государством были предприняты важные шаги по поддержке банковского сектора экономики (в т.ч. беспроцентные кредиты ЦБ РФ коммерческим банкам), при этом считалось, что такая поддержка незамедлительно приведет к положительному результату. Но из-за ряда причин – экономических и законодательных – фактический рост объемов кредитования реального сектора экономики был значительно ниже ожидаемого уровня, и, как следствие, реальный сектор экономики оказался не в состоянии обеспечивать рост валового внутреннего продукта, что в целом означает стагнацию экономики и кризисные явления в ней [4].

Применительно к банковскому сектору термин «устойчивость» можно рассматривать на двух уровнях – микроэкономическом и макроэкономическом.

Принято считать [см., напр.: 1], что устойчивость на микроуровне – это способность конкретного банка функционировать, реализовывать свои цели и задачи в отношении клиентов, даже в условиях крайне неблагоприятных воздействий. На макроуровне устойчивость – это способность банковской системы в целом преодолевать кризисные явления в различных сферах и продолжать функционировать, не вызывая при этом необходимости у экономических агентов радикально менять свои цели в отношении сбережений, инвестиций и т.п. [2]. В таком контексте существенно то, что банки под воздействием определенных причин могут утратить способность выполнять свои функции, что чревато серьезными негативными последствиями не только для банковской системы, но и для экономики в целом. Причем такая угроза существует постоянно. Таким образом, под стабильностью банковской системы целесообразно понимать способность банков бесперебойно выполнять свои функции в течение сравнительно продолжительного периода.

Важной задачей органов банковского надзора страны является обеспечение устойчивого развития банковского сектора в стране [3]. Для прогнозирования и предотвращения возможных кризисов в банковском секторе органами банковского надзора разработан комплекс мер, в частности дистанционный мониторинг банковской системы [5].

Дистанционный мониторинг банковской системы используется органами банковского надзора (Центральный банк в РФ, далее -ЦБ) большинства стран мира и позволяет на основании ежедневной, ежемесячной, ежеквартальной и/или ежегодной финансовой отчетности банков выделять «группы риска», заслуживающие в дальнейшем более пристального внимания.

На сегодняшний день к основным методам прогнозирования дефолтов банков и банковских кризисов относятся [1 1]:

Анализ с использованием Logit и Probit моделей.

  • •    Дискриминантый анализ, коэффициентный анализ и рейтинговые системы.

  • •    Системы раннего предупреждения как комбинация методов.

  • •    Стресс-тестирование [7].

  • •    Методы нейросетевого моделирования [см., напр.: 8, 12].

Первые три группы методов являются «классическими» и на сегодняшний день наиболее исследованы.

Стресс-тестирование – это отдельное направление анализа, нацеленное на анализ банковского сектора в критических условиях, в данной работе оно не будет рассматриваться.

В рамках данной статьи будут рассматриваться методы нейросетевого моделирования. Такие методы могут извлекать знания из данных, обнаруживать в них скрытые динамические закономерности. Важным достоинством этих методов является то, что предположение о структуре зависимости между входными и выходными данными не делается, она может быть произвольной .

Кроме того, достоинством нейросетевых методов с учетом рассматриваемой задачи является возможность моделирования не только отзыва лицензии у банков вследствие их неустойчивого финансового состояния, но и таких сложномоделируемых явлений, как

  • -    предоставление недостоверной финансовой отчетности в ЦБ;

  • -    нарушение федеральных законов, регулирующих банковскую деятельность (напр., Федеральный закон от 7 августа 2001 г. № 115-ФЗ «О противодействии легализации (отмыванию) доходов, полученных преступным путем, и финансированию терроризма»);

  • -    создание неадекватных резервов на возможные потери и др.

Отметим, что методы нейросетевого моделирования не лишены недостатков. Перечислим основные из них:

  • 1.    Наличие проблемы, связанной с выбором типа сети, количества нейронов и слоев сети. При практической работе с нейронными сетями исследователь вынужден экспериментировать с большим количеством видов сети, их характеристик, обучая каждую из них не по разу, сравнивая полученные результаты.

  • 2.    Для нейронных сетей характерным является свойство «паралич сети при обучении», возникающее при присвоении одному из весов слишком большого значения. В этом случае выход соответствующего нейрона окажется в насыщении, т.е. будет близок к предельному значению функции активации, и процесс обучения будет происходить крайне медленно.

  • 3.    Важной проблемой нейросетей является выбор момента остановки обучения. При коротком обучении эффективность обучения будет низка, а при длительном – наоборот, сеть будет полностью объяснять «обучающую выборку», в т.ч. «шумы», тем самым будет понижена ее способность обобщать входную информацию.

  • 4.    Сложность интерпретации полученных результатов, например в части значимости объясняющих переменных.

Целью работы является создание модели, позволяющей на основании заданных форм финансовой отчетности банка моделировать и оценивать риски его дефолта.

Новизна содержательной части работы состоит в применении методов нейросетевого моделирования к предметной области. Насколько известно автору этой работы, нейросетевые методы до сих пор не использовались в полной мере как инструмент оценки рисков дефолта банков.

Построение модели

Первичная подготовка данных

Учитывая тот факт, что российские банки значительно отличаются друг от друга по величине финансовых показателей, перед непосредственным построением модели имеет смысл произвести кластеризацию [см., напр.: 6].

Кластеризация может производиться различными методами, основными из них являются:

  • 1.    Вероятностный подход. Предполагается, что каждый рассматриваемый объект относится к одному из k классов:

  • •    K-средних (K-means).

  • •    EM-алгоритм.

  • •    Алгоритмы семейства FOREL.

  • •    Дискриминантный анализ.

  • 2.    Подходы на основе систем искусственного интеллекта:

  • •    Метод нечеткой кластеризации C-средних (C-means).

  • •    Нейронная сеть Кохонена.

  • 3.    Методы, использующие теоретикографовый подход.

Отметим, что кластеризация может производиться как по одному, так и по нескольким критериям. В целом, кластеризация позволяет улучшить прогнозные качества модели.

На основании критерия величины «Активы» на отчетную дату в размере 10 млрд. руб. все наблюдения были разбиты на 2 кластера: 1) с банками, размер активов которых больше 10 млрд. руб., и 2) банками с активами менее 10 млрд. руб.

В первый кластер попало 74% банков, а во второй – 26%; при этом распределение банков с отозванной лицензией по кластерам иное:

в первый кластер попало 7.3% банков, а во второй – 92.7%.

Кластеризация позволила представить неоднородные данные в более наглядном виде и, далее, в процессе анализа данных находить функциональные зависимости между наборами данных с учетом выделения однородных групп – кластеров.

Важным этапом в построении модели является подготовка данных, в т.ч. очистка от «шумов» и противоречивых данных, присутствие которых значительно снижает качество модели – в процессе обучения модель начинает объяснять (аппроксимировать) эти некорректные данные, что сбивает ее «настройку». Такую очистку имеет смысл проводить по каждому кластеру в отдельности.

Подготовка данных производилась следующим образом:

  • 1.    Были выделены формально «здоровые» банки, у которых лицензии не отозваны, финансовое состояние которых при этом было признано экспертами неудовлетворительным. Ярким примером этого, например, является Банк Москвы.

  • 2.    Из рассматриваемой выборки в ручном режиме были удалены наблюдения (банки), в которых часть значений объясняющих переменных была не определена из-за отсутствия некоторых форм их финансовой отчетности на сайте ЦБ.

Отметим также, что вследствие специфики рассматриваемой отрасли и подготовки данных в ручном режиме противоречивые данные отсутствуют.

Обучение модели и ее контрольная проверка

Обучение происходит следующим образом: на вход модели подаются последовательно обучающие наблюдения, рассчитываются выходные значения сети, которые сравниваются с целевыми, после чего рассчитываются ошибки. С учетом значения ошибки, а также направления поверхности градиента ошибки производится корректировка весов модели, после чего итерационный шаг обучения повторяется.

При оптимизации целевой функции могут использоваться алгоритмы локальной и глобальной оптимизации, а также стохастические методы оптимизации.

Этот процесс повторяется до тех пор, пока не будет достигнута необходимая точность работы модели либо последующие итерации не будут улучшать качество действия модели.

В качестве приложения, в котором реализовывалось практическое построение модели, выступала программа Neuro Solutions 6.0.

В качестве модели использовался многослойный персептрон [см., напр.: 8] со следующими характеристиками:

  • -    количество скрытых слоев: 2;

  • -    количество нейронов на первом скрытом слое: от 7 до 10, вид аксона – «сигмоида»;

  • -    количество нейронов на втором скрытом слое: от 7 до 10, вид аксона – «сигмоида».

Данные характеристики были подобра- ны автором эмпирически, в процессе анализа результатов работы модели. При этом использовались следующие виды активационных функций:

  • 1)      жесткая             ступенька

(классическая активационная функция);

  • 2)     логистическая        функция

(сигмоида) (применяется для многослойных персептронов,  характерен быстрый расчет значений сети);

  • 3)     гиперболический      тангенс

(используется  для сетей с непрерывными сигналами);

  • 4)      пологая ступенька (сеть легко

рассчитывается, но усложнен процесс обучения);

  • 5)     SoftMAX-функция

(обеспечивает сумму выходов слоя, равную единице при любых значениях входа; часто используется при задачах классификации, распознавания образов);

  • 6)      гауссова кривая (применяется,

когда реакция нейрона должна быть максимальной для определенного значения на входе);

  • 7)     линейная            функция

(применяется для однослойных сетей).

Непосредственное обучение модели производилось следующим образом: в качестве обучающей выборки использовалась выборка из 225 банков РФ по финансовой отчетности за 2008-2011гг. Заметим, вследствие дефолтов некоторых из указанных банков в рассматриваемый период количество наблюдений составило менее 1 000. По каждому из них была использована информация о его финансовой отчетности (основные формы) на отчетный год (на даты 01.01.2009, 01.01.2010, 01.01.2011, 01.01.2012), формы 101 и 102 отчетности на эти же даты.

Автору пришлось ограничиться периодом 2008-2011гг. по следующим причинам: несмотря на то, что данные о финансовой отчетности банков доступны с 1997г., часть используемых для расчетов форм доступна лишь частично с 2007-2008 гг., например:

  • -    форма 101 в расширенном виде – с 2007г.;

  • -    отчет об уровне достаточности капитала, величине резервов на покрытие сомнительных ссуд и иных активов – с 2008г.

Вся указанная информация является общедоступной, была взята с сайта ЦБ РФ.

По каждому из этих банков был известен факт о наличии/отсутствии его дефолта (от- зыва лицензии) в течение рассматриваемого периода.

В качестве объясняющих переменных было отобрано 18 переменных, характеризующих активы, рентабельность, ликвидность, степень обеспеченности собственными средствами, объемы вложений в акции/облигации; величина маржи между ставкой привлечения и размещения («наценка») и др. [подробнее, см., напр.: 6, 9, 10].

С учетом того, что методы исследования нейросетей носят вероятностный характер, возникающий вследствие случайного выбора начальных значений весов аксонов у нейронов, итерация обучения была произведена 40 раз, после чего было выбрано минимальное из полученных среднеквадратических отклонений модельных (обученных) результатов от наблюдаемых.

Для ослабления фактора случайности обучение и тестирование модели производилось 10 раз на основании различных выборок.

Контрольная проверка модели производится для избежания переучивания сети. Важно отметить, что она не используется в процессе обучения сети. В процессе работы сети ошибки на обучающей и контрольной выборках должны быть близкими по значению, обратное может означать следующее: либо обучающая и контрольная выборки неоднородны, либо в процессе обучения произошло переучивание сети.

Главным критерием качества модели является значение контрольной ошибки. При этом при выборе из двух сетей с приблизительно одинаковыми контрольными ошибками чаще всего выбирается более простая.

В качестве контрольной выборки использовалась выборка из 30 наблюдений

Результаты работы

Эффективность работы модели оценивалась на основании оставшихся 50 банков каждой выборки.

В приводимой ниже таблице указаны усредненные результаты, полученные в результате работы модели.

Модель/Фактически

Дефолт

Здоровый

Дефолт

0.37

0.06

Здоровый

0.13

0.44

В целом модель правильно объясняет 81% банковских дефолтов и не объясняет оставшиеся 19%, при этом модель реже здоровому банку присваивает статус «дефолт» (6,0%) – ошибка I рода, чем наоборот (13%) – ошибка II рода.

Необходимо отметить, что цена ошибки I рода для ЦБ РФ и/или инвестора значительно выше цены ошибки II рода.

Развитие модели

Дальнейшее развитие модели планируется производить следующим образом:

  • 1.    Введение новых объясняющих переменных и исключение несущественных. Отдельно будут введены следующие качественные переменные: «государственный банк», «карманный банк», «розничный или корпоративный банк», значения которых будут определяться экспертно.

  • 2.    В нейросетевых моделях, особенно при использовании многослойного персептрона, крайне важен объем исходных данных, поэтому целесообразным представляется увеличение выборки.

  • 3.    Применение других видов нейронных сетей: радиальные сети RBF, сети с самоорганизацией в результате конкуренции нейронов, сети с самоорганизацией корреляционного типа и др. Важным логическим продолжением развития модели

является применение «гибридных сетей» – объединения различных видов нейронных сетей в одну.

Отметим, что, несмотря на некоторое «недоверие» к нейросетям применительно к моделированию надежности банков, бытующее среди специалистов [см., напр.: 3], полученные результаты показывают, что нейросетевые модели можно использовать для поиска потенциально «проблемных» банков и целых сегментов банковского сектора, при выявлении которых необходимо производить их точечную и полную проверку.

Список литературы Об одной модели оценки рисков дефолта банка с использованием нейросетевых методов

  • Бибикова Е.А., Кичаев И.Н. Факторы, влияющие на устойчивость банков в условиях финансового кризиса//Наука и экономика. 2010. №1(1). С. 12-14.
  • Бирюков А.Н. Байесовский подход к регуляризации нейросетевых моделей кластеризации экономических объектов (на примере модели поддержки принятия решений по налоговому регулированию).//Вестник УрФУ. 2011. № 6. С. 109-125.
  • Карминский А.М., Пересецкий А.А., Петров А.Е. Рейтинги в экономике. М.: Финансы и статистика, 2005. 240 с.
  • Калабекова Т.В. Взаимодействие банковской системы и реального сектора экономики в условиях экономического кризиса//Вестник Северо-Осетинского государственного университета им. К.Л. Хетагурова. 2010. №3. С. 90-96.
  • Никитина Е.Б. Необходимость и пути повышения статуса региональных банков в российской банковской системе//Вестн. Перм. ун-та. Сер. Экономика. 2012. Вып. 4(15). С. 75-80.
  • Пересецкий А.А. Методы оценки вероятности дефолта банков//Экономика и математические методы. 2007. Т. 43, №3. С. 37-62.
  • Шимановский К.В. Оценка вероятности дефолта отраслей экономики на основании информации банковской отчетности//Информационные системы и математические методы в экономике: сб. науч. тр./Перм. гос. ун-т. 2009. Вып.2. С.133-142.
  • Ясницкий Л.Н. Введение в искусственный интеллект. М.: Изд. центр «Академия», 2005. 176 с.
  • Boyacioglu M.A., Kara Y., Baykan OE.K. Predicting bank financial failures using neural networks, support vector machines and multivariate statistical methods: A comparative analysis in the sample of savings deposit insurance fund (SDIF) transferred banks in Turkey//Expert Systems with Application. 2009. №36. P.3355-3366.
  • Carlos A. Molina. Predicting bank failures using a hazard model: the Venezuelan banking crisis//Emerging Markets Review. 2002. № 3. P. 31-50.
  • Demyanyk Y., Hasan I. Financial crises and bank failures: A review of prediction methods//Omega. 2010. №38. P. 315-324
  • Tam KY. Neural network models and the prediction of bank bankruptcy//Omega: The International Journal of Management Science. 1991. №19 (5). P. 429-445.
Еще
Статья научная