Методика кластеризация стран с ИТ для выявления наиболее лучшего опыта для банка России

Автор: Леонов М.А.

Журнал: Экономика и социум @ekonomika-socium

Статья в выпуске: 3 (8), 2013 года.

Бесплатный доступ

Короткий адрес: https://sciup.org/140105643

IDR: 140105643

Текст статьи Методика кластеризация стран с ИТ для выявления наиболее лучшего опыта для банка России

Банк России намерен в 2015 году осуществить переход к ИТ. Для успешного перехода необходимо, чтобы в стране был соответствующий уровень развития. На данный момент не мало стран уже перешло к ИТ, и их опыт Банк России мог бы использовать для успешного перехода. Но встаёт вопрос, чей опыт является более релевантным для России? Ниже описаны, как и условия, при которых применение данного режима может быть успешным, так и рассуждения о том, что оценка по этим условиям может быть затруднительна, и предложена методика поиска стран аналогов.

Условия успешного применения инфляционного таргетирования

Для успешного применения ИТ необходимо выполнение некоторых условий. Опыт первоначальных развитых стран служил примером для некоторых экономистов для формирования таких условий [9, 10, 11].

В целом же список необходимых условий был составлен путём опроса руководителей ЦБ разных стран МВФ и содержит следующие пункты: институциональная независимость монетарных властей;

надёжные статистически данные;

развитая финансовая система;

минимальная долларизация, свободные цены, высокая степень диверсификация экономики8.

Для развивающихся стран помимо этих требований, часто обращают ещё на несколько проблем, с которыми могут столкнуться эти страны, которые приводятся в работах [4, 6, 12]:

слабое управление государственными финансами;

слабое развитие финансового сектора, институтов;

низкое доверие к монетарным властям;

значительная долларизация;

высокая чувствительность к динамике международных потоков капитала.

В экономической литературе также есть и условия, при которых применение ИТ нежелательно, и сформулированы они в работах [7, 12]: малый размер экономики;

в случае привязки заработных плат и цен к другим валютным в малых, открытых экономиках;

высокие темпы инфляции;

отсутствие поддержки фискальных органов;

отсутствие желания руководителя ЦБ жёстко придерживаться поставленной цели.

После того, как были сформулированы необходимые условия, ЦБ различных стран стали пытаться оценить своё собственное макроэкономическое положение и уровень институционального развития, чтобы оценить «готовность» экономики для перехода к ИТ (для успешной реализации ИТ). Так как условия сформулированы в качественных понятиях, как можно видеть выше, то возникает проблема их перевод в количественные показатели.

В тоже время, авторы показали, что при невыполнении некоторых условий, ЦБ может успешно применять ИТ [2]. Следовательно, не существует чётких значений границ, при недостижении которых применение ИТ ухудшит макроэкономическое положение. Иначе говоря, существуют как минимум две проблемы для оценки готовности к ИТ: перевод качественных показателей в количественные, установка границ для показателей.

Вместо чётких границ можно было бы сформировать некое доверительное множество9 на Жп, где п равно количеству факторов, которые количественно описывают необходимые условия. Если страна со своими показателями попадает в такое доверительное множество, то можно сделать вывод о том, что применение ИТ скорее всего будет успешным. Сразу возникает вопрос о том, как его таковым сделать, как применять политику ИТ.

Для решения этой проблемы для России задача может быть переформулирована как поиска страны, которая соответствует России наилучшим образом. Опыт этой страны (или стран) можно изучать и использовать банком России. Для выявления таких стран была сделана кластеризация при помощи вычисления вероятностей наличия ИТ, удаленности от рассматриваемого года, удаленность от года принятия ИТ.

Сначала оценивалась вероятность наличия ИТ в стране в зависимости от её показателей. Как уже отмечалось, факторы, участвующие в критериях описанных ранее, являются качественными, а не количественными, поэтому для вычисления вероятностей брались основные макроэкономические показатели. Затем рассматривалось в пространстве вероятности, удалённости от даты принятия ИТ, удаленности от рассматриваемого периода. В этом пространстве вычислялось расстояние между точкой, которая характеризирует России, и точками, которые отражают все остальные страны.

Оценка вероятности наличия ИТ

Для оценки вероятностей рассматривались следующие случаи:

страна не использовала ИТ, но стала использовать ИТ;

страна использовала ИТ, продолжила использовать ИТ;

страна не использовала ИТ, затем тоже не использовала.

Y ,t = щ + 6' Хи + £l> t                        (1)

где Yi,t дамми переменная, которая принимает значение 1, если страна i в момент t, использует ИТ, и 0 в противном случае, влияние факторов Xi,t на вероятность перехода к ИТ. В Xi,t входили переменные, отвечающие за финансовое развитие (отношение выданных кредитов внутри страны к объему ВВП), волатильность роста денежной массы М2, баланс бюджета (излишек баланса к ВВП), ВВП на душу населения, торговая открытость (объём экспорта и импорта к ВВП), а щ отвечает за индивидуальные страновые фиксированные эффекты. Оценка производилась с помощью дискретных панельных моделей на выборке из 98 стран (с ИТ и без ИТ) на промежутке 1975-2005. Результаты свидетельствуют о том, что на решение о переходе к ИТ положительно влияет финансовое развитие, профицит государственного бюджета, ВВП на душу населения, торговая открытость.

Положительное влияние на вероятность применения ИТ профицита бюджета и финансового развития означает, что страны перейдут к ИТ в случае отсутствия фискального и финансового доминирования. Показатель ВВП является прокси для общего институционального уровня развития, которое включает в себя, такие показатели, как, например, независимость ЦБ. Торговая открытость является прокси переменной для оценки влияния «лучших» практик монетарной политики за границей.

Аналогичное исследование проводилось в работе [8], где автор включил в модель ещё и показатель инфляции. Эконометрическая модель выглядела следующим образом:

Уи =( У ≥0).                         (2)

где 1(∙) индикаторная функция, которая принимает значение 1, в случае, если страна i принимает ИТ в момент времени t . У – некая скрытая переменная, которая вычисляется как

= Pi + ayi (t-i)+ xitP + Eit                    (3)

где, ^i – индивидуальные эффекты для страны, использование У( ( t 1 ) указывает на то, что приянтие решение в момент времени t зависит от решений в предыдущий момент времени. xlt – набор возможных макроэкономических и структурных объясняющих экзогенных переменных. Включение переменной отвечающей за предыдущие решение очень важно, так как экономика не принимает новую политику каждый раз при текущей макроэкономической обстановке. Страны ведут себя устойчивей (или по «инерции», то есть скорее сохранят предыдущий режим, чем перейдут к новому). Не учитывая данный эффект и тот момент, что нет ни одной страны, которая бы отказалась от ИТ, эконометрический анализ может привести к смещенной оценки других параметров [8].

Результаты качественно не отличались. Предельный эффект от роста ВВП на душу населения даёт наибольший прирост вероятности наличия ИТ в стране. Используя эту методику можно получить оценку вероятности наличия ИТ в странах (с ИТ) при их текущей макроэкономической обстановке для каждого года. Получив аналогичную оценку для России, далее методом кластерного анализа можно выделить страны, наибольшим образом соответствующие России на данный момент.

Первоначально эконометрическая модель выглядела следующим образом:

Уи =(«I + Р1Уи-1 + P2INFit + P3NXit + P4DGPlt + ^Dit + ^DCit +M2 it , где У it индикатор наличия ИТ в стране i в момент времени t, INFlt – показатель инфляции, NX отвечает за открытость экономики, измеренный как сумма экспорта и импорта относительно ВВП, DGPlt – показатель реального ВВП на душу населения, D^ – показатель размера государственного долга относительно ВВП, в качестве прокси для меры фискального доминирования, D Qt – объём кредитов выданного частному сектору, как прокси для финансового развития, M2 – отношение М2 в экономике к ВВП. Последний показатель был взят в качестве показателя монетизации экономики, необходимого условия для применения ИТ. Временной интервал был взять с1980 по 201110. Используемые данные представлены в таблице ниже.

Таблица 1. Данные и источники, ожидаемые э

фекты

Показатель

Мера

Источник

Ожидаемые эффект

Инфляция

Прирост ИПЦ за год

WDI

Отрицательный

Открыть экономики

Отношение суммы импорта и экспорта страны к ВВП

WDI,  собственные

расчёты

Положительный

Показатель   долга

страны

Отношение объёма долга центрального правительства к ВВП

WDI,    ЦБ    и

статистические органы соответствующих стран, IMF

Отрицательный

ВВП   на   душу

населения

Натуральный логарифм ВВП на душу населения

WDI

Положительный

Объём кредитов

Объём кредитов выданных частному сектору

WDI

Положительный

M2

Отношение М2 к

ВВП

WDI

Положительный

Наличие ИТ

Булевая переменная

ЦБ

соответствующих стран

Анализ уравнения показал статистическую значимость запаздывающей переменной. В работе [8] автор отмечает, что надо было использовать латентную переменную, но так как она не наблюдаема, то она была просто исключена из оцениваемого уравнения.

Таблица 2 Регрессия первой модели

Logit

Весь период

До 2008

Parameter

P-value

Parameter

P-value

NX

0.012

0.276

0.012

0.276

INF

-0.026

0.595

-0.026

0.595

D

0.008

0.582

0.008

0.597

GDP

0.000

0.580

0.000

0.580

DC

0.023

0.042

0.023

0.042

Y(-1)

34.357

1.000

33.507

1.000

M2

0.038

0.148

0.038

0.148

cons

-6.145

0.003

-0.719

0.414

10 2012 не был взят, так как нет показателей по некоторым странам.

Весь период

До 2008

Probit

Parameter

P-value

Parameter

P-value

NX

0.006

0.338

0.006

0.338

INF

-0.012

0.621

-0.012

0.621

D

0.004

0.615

0.004

0.615

GDP

0.000

0.596

0.000

0.596

DC

0.011

0.051

0.011

0.051

Y(-1)

8.200

1.000

8.200

1.000

M2

0.021

0.163

0.021

0.163

cons

-3.289

0.295

-3.289

0.295

Источник: расчёты автора.

Из регрессии была исключена переменная отвечающая за наличие ИТ в предыдущем периоде. Причём, стоило учесть, что страна планирует в каком-то году перейти к ИТ, и если она достигает какого-то уровня, показателей, то вскоре переходит к новому режиму. Иначе говоря, страна переходит к ИТ в момент времени t на основе показателей в момент времени t -1. Исходя из этой логики в модель были включены запаздывающее переменные:

Уи =( ai + РтУи-т + MNF^ + /№-1 + P^GP^ + Ps^n-i + ^6^Qt-i                                                         (5)

Оценка производилась на всей выборке, то есть с 1980 по 2011 года и по 2008 года, чтобы учесть возможное влияние кризиса. На промежутке с 2008 по 2011 исследовать не было смысла, так как очень мало стран приняло ИТ в этот режим, и мало наблюдений. В качестве функции f (∙) брались логит и пробит модели.

Результаты эмпирического анализа уравнения (5) представлены ниже.

Таблица 3 Оценка коэффициентов регрессии на всей выборке на всём временном отрезке

Logit

Probit

NX

0.766

1.423

1.505*

1.412*

INF

-0.440*

-0.290*

-0.275*

-0.151*

-0.147*

D

7.746*

4.384*

3.506*

1.4150*

1.411*

GDP

43.524*

19.366*

15.891*

6.0795*

5.830*

DC

6.201*

4.305*

3.896*

2.1560*

2.149*

M2

-0.014

-0.0810

cons

-418.626*

-193.798*

-152.104*

-67.894*

-66.058*

AIC

322.747

353.810

381.290

382.389

BIC

356.809

383.627

388.116

415.352

412.206

* – статистически значим при 1%

** – статистически значим при 5%

*** – статистически значим при 10%

Источник: расчёты автора

Из эмпирических результатов видно, что предположение о включении показателя м2 оказалось статистически незначимым. Хотя требование достаточной степени монетизации экономики является необходимым требованием работы трансмиссионных механизмов ДКП, но возможно в данном случае оно является незначим, так как включена переменная, отвечающая за объем кредитования, что, по сути, также отражает возможность и эффективность работы ДКП. Более того, для логит модели статистическая незначимость показателя открытости экономики может причиной кризиса, во время которого резко сократились объёмы торговли между странами, хотя и режим они не меняли, что в результате привело к статистической незначимости показателя. В остальном результаты качественно соответствуют результатам других авторов. При анализе того же уравнения на периоде до 2008 года коэффициент, характеризующий открытость экономики, статистически значим, как и все остальные, кроме показателя денежной массы.

В рамках данной статистической модели по получаемыми прогнозам не получится провести кластеризацию, так как у развитых стран вероятность наличия ИТ равна 1, а развивающихся 0. Для более подробного разбора эмпирический анализ далее проводился в рамках развивающихся11 стран.

Ниже представлены результаты на выборке из развивающихся стран.

Таблица 4 Оценка коэффициентов регрессии на выборке из развивающихся стран на всём временном отрезке

Logit all

Probit all

NX

-5.48

-4.56

-2.32854

INF

-0.43**

-0.56*

-0.52*

-0.57*

-0.23*

-0.23*

-0.22*

-0.25*

D

7.35*

16.46*

9.32*

8.81*

3.00*

2.29**

2.29*

2.93*

GDP

78.19

125.44*

86.10*

79.47*

29.36*

26.01*

23.25*

27.06*

DC

-6.31***

-7.42***

-4.58

-1.75

-0.88

-0.36

M2

6.94

2.72478

1.4530

cons

-610.16

-979.12

-670.23*

-635.33*

-229.17*

-208.06*

-184.00*

-214.52*

AIC

170.05

162.83

166.84

166.74

166.04

169.09

169.01

167.47

BIC

198.28

187.54

188.04

184.40

194.27

193.83

190.21

185.14

* – статистически значим при 1%

** – статистически значим при 5%

*** – статистически значим при 10% Источник: расчёты автора

Статистический анализ на основе всей выборке показал, что при рассмотрении всего интервала, из-за кризиса возможно недооценка некоторых показателей. Результаты, приведённые чуть выше показали статистическую незначимость показателя, отвечаю за его за открытость экономики. В случае с разувающимися анализ также был произведен на временной выборке до 2008 года включительно.

Таблица 5 Оценка коэффициентов регрессии на выборке из развивающихся стран на с 1980 по 2008

Logit

Probit

NX

-1.19**

-1.03***

-1.16**

-0.91***

-0.63**

-0.57***

-0.50***

INF

-0.30*

-0.30*

-0.30*

-0.31*

-0.16*

-0.16*

-0.17*

D

0.80**

0.85**

0.82**

0.86**

0.45**

0.47**

0.47**

11 В рамках групп стран с доходами выше среднего и ниже среднего.

GDP

1.60*

1.60

1.58*

1.72*

0.85*

0.85*

0.92*

DC

-0.15

0.2631805

-0.0245229

0.1591678

M2

0.71

0.50

0.30

cons

-10.01*

-9.60**

-9.82*

-10.19*

-5.26**

-5.05**

-5.31*

AIC

153.59

152.08

151.64

150.74

155.22

153.51

152.22

BIC

179.00

174.32

173.88

169.79

180.63

175.74

171.28

* - статистически значим при 1%

** - статистически значим при 5%

*** - статистически значим при 10% Источник: расчёты автора

Результаты же последнего анализа уже качественно не соответствуют результатам полученных, например, в работе [8]. Причина данного расхождения возможно лежит в том, что автор используют вместо показателя инфляции, «нормированный» показатель инфляции 1/(1+ / NР). Почему именно такой показатель берётся, автор не объясняет. Корреляция данного показателя с показателем инфляции в рамках одной страны колеблется от 0.33 до 0.99, соответственно это может приводить к другим оценкам коэффициентов. Помимо оценки коэффициента при открытости экономики, остальные оценки соответствуют полученным в других работах.

При оценке логит и пробит моделей коэффициенты разные, но прогнозные значения обеих моделей практически совпадают. Средний показатель разницы составляет 1п.п. Прогнозные значения – это вероятности наличия режима ИТ в стране в данный год. Для России был подсчитан показатель наличия вероятности ИТ в 2011 году и он составил 39%.

Кластеризация

Далее для каждой страны и для каждого года были вычислены две величины х и у:

х разница между текущем годом и годом принятия ИТ в данной стране (в результате для года, когда страна приняла ИТ этот показатель был равен нулю, для России показатель был также принят за ноль);

у разница между текущим годом и 2011 годом.

Первый показатель показывает как далеко «отстоит» данное наблюдения от года принятия ИТ. Если у России и какой-то страны одинаковая вероятность наличия ИТ, но у страны данный показатель был за 5 лет до принятия ИТ, нет причин сравнивать Россию и эту страну, то есть, возможно, не стоит их объединять в один кластер. Та страна будет «лучше» другой страны для сравнения с Россией при одинаковых вероятностях, которая имеет первый показатель ближе к нулю. Распределение стран на см. Рис. 1.

100%

90%

80%

70%

60%

50%

40%

Russia

30%

20%

10%

; @ oee»e*wee

0%

2000   2001   2002   2003   2004   2005   2006   2007   2008   2009   2010   2011

Рис. 1. Распределение стран по вероятности и годам

Второй показатель должен учитывать внешнеэкономические показатели. Если у двух стран одинаковая вероятность наличия ИТ, но первая страна имеет данную вероятность, например в 2007, а другая страна в 1997, то первая страна будет «лучше» для сравнения с Россией, так как её макроэкономические показатели учитывают текущие внешнеэкономическое состояние мировой экономики. Распределение стран в координатах вероятности и второго показателя.

100%

90%

80%

70%

ж ия

30%

20%

10%

-9    -8    -7    -6    -5    -4    -3    -2    -1    0     1     2     3    4    5     6    7    8    9

Рис. 2. Распределение стран по вероятности и разнице от даты принятия ИТ Вероятность лежит в интервале [0,1], но оба вычисленных показателя лежат в интервале [-27,21] и [0,31]. При кластеризации будут вычисляться расстояния между точками. Для того, чтобы как то сравнять показатели, новые вычисленные показатели были отображены на интервал [0,1].

I fl

Ifl

Рис. 3. Распределение точек в трёхмерном пространстве

Одна из проблем кластеризации заключается в том, что необходимо знать количество кластеров12. Всевозможное количество кластеров можно посмотреть на дендограмме.

12 По крайней мере первоначально необходимо указать количество первоначальных кластеров.

Рис. 4. Дендрограмма

Выделять классы на основе дендрограммы тяжело, потому в дальнейшим применяли методологию K-means. Первоначально были рассмотрены вероятности наличия ИТ в странах на момент принятия ИТ. Далее вычислялись расстояния от точки «Россия» до всех остальных. Расстояния вычислялись по соответс твующей формуле:

П t = V (PRи - P1 1 )2 + (r - X1 J 2, где                (6)

pRи - вероятность наличия ИТ в России в 2011 году, рi 1 - вероятность наличия ИТ в стране I в момент времени t , r и хt 1 соответственно значения х или у для России и страны i в момент времени t. Расстояния вычислялись как и для х или у.

Затем, чтобы учесть все факторы (и год принятия ИТ, и разница между годом принятия ИТ и «текущим» годом) расстояния вычислялись и в трёхмерном пространстве:

П t = V (PRи - P t )2 + ( R r и - R t )2 + (yRи - yt)2•          (7)

В результаты были получены списки стран, которые используют ИТ, и даты, которые наилучшем образом, с точки зрения вычисленных расстояний, соответствуют макроэкономической ситуации в России в 2011 году. В результате был получен следующий список:

Индонезия;

Чили;

Гватемала;

Армения.

Результаты являются достаточно интересным. В Индонезии основной отраслью является добыча и переработка нефти и газа, по добычи нефти она занимает 37 место на 2009 год, а по добычи газа на 8 месте. В Чили также основой отраслью является добыча полезных ископаемых, но в данном случая идет экспорт меди. Обе страны являются экспортноориентированными, соответственно они сталкиваются, как и Россия, с колебаниями цен на международным рынке, которые могут существенно влиять на экономику внутри страны. А что важнее, именно эти колебания являются одной из причин отклонения текущей инфляции от целевого показателя [1]. Армения интересна как страна участник СНГ. Дальнейший анализ будет сосредоточен на этих странах.

Кластерный анализ при помощи оценки наличия вероятности ИТ дал список стран, на основе которых можно изучить последствия применения ИТ для дальнейшей экстраполяции на Россию.

Кластерный анализ без вычисления вероятностей, то есть поиск кластера (ближайших соседей) в пространстве, образованным параметрами, которые входили в левую часть (25) и показателями х и у. Для того, чтобы параметры были сравнимы, каждый параметр был нормирован к интервалу [0; 1]. Далее были вычислены расстояния между точкой, которая отражает показатели России в 2011 году, и всеми остальными точками, координатами которых являются параметры страны, включая год. В результате применяя метода ближайших соседей получается иной список стран: Румыния и Турция. Если исключить из переменных показатель денежной массы, который был также исключён как статистически незначимый в регрессии, то результаты качественно не изменились. Конечно, можно подобрать коэффициенты таким образом, чтобы вторая кластеризация давала те же результаты, что и первый способ, но в случае, если мы не знаем, какие результаты должны быть получены, то подбор весов становится невозможным.

На данный момент Банк России может полагаться на опыт этих стран для проведения политики ИТ. В рамках исследования их опыта применения ИТ было выделено несколько моментов. Во-первых, применение политики ИТ должно идти вместе с организацией стабилизационного фонда, что также отмечалось в [5, 12]. Во-вторых, ЦБ не обязан резко прекращать проводить интервенции на валютном рынке. Стабилизационный фонд должен помочь России, как стране экспортёру, нивелировать потери бюджета в случае колебании цен на энергоносители, чтобы уменьшить вероятность давления на монетарные власти со стороны фискальных властей

Заключение

Данная методика может позволить выявить страны, опыт которых может использовать для перехода к ИТ. Отличие данной кластеризации от кластеризации на множестве всех макроэкономических параметров заключается в том, что при огромном числе параметров, могут учитываться незначительные факторы, что приведёт к «ложным» кластерам, а использование весов в данном случае невозможно, так как невозможно их определить. Более того остаётся вопрос, какие использовать данные.

Статья