Нечётко-множественная кластеризация поступлений в московский бюджет от рынка наружной рекламы
Автор: Лабунец Леонид Витальевич, Лебедева Наталья Леонидовна, Чижов Михаил Юрьевич
Рубрика: Математическое моделирование в экономике и управлении
Статья в выпуске: 4, 2014 года.
Бесплатный доступ
В статье на основе методов интеллектуального анализа данных продемонстрирована взаимосвязь вероятностных и нечётко-множественных подходов к анализу и моделированию поступлений в московский бюджет от объектов наружной рекламы (ОНР). Представлена методика лингвистического анализа распределения поступлений в бюджет в виде аппроксимации гистограммы, сглаженной сдвигом полигауссовой модели. Рассмотрены основные этапы нечёткого логического вывода и кластеризации ОНР по критерию поступлений с помощью байесовского классификатора и метода главных компонент
Преобразования бокса - кокса, диаграмма рассеяния, квазистатистики, экспоненциально взвешенные оценки мешалкина, лингвистический анализ гистограммы, em-алгоритм, байесовские оценки, нечёткий логический вывод, метод главных компонент
Короткий адрес: https://sciup.org/148160191
IDR: 148160191
Текст научной статьи Нечётко-множественная кластеризация поступлений в московский бюджет от рынка наружной рекламы
Описательные и прогнозные модели, основанные на применении современных методов и алгоритмов Data Mining. позволяют выявить закономерности, содержащие знания, необходимые для оценки финансовых рисков и прогнозирования рыночных тенденций. В докладе проанализирована проблема формирования описательных моделей эффективности объектов наружной рекламы (ОНР). Надежной методической основой такого рода моделей являются
ВЕСТНИК 2014. ВЫПУСК 4
алгоритмы нечеткой кластеризации различных типов ОНР по уровню поступлений в бюджет. Представлен экспертный подход к анализу исходной информации, который позволяет учесть ее неопределенность. Плодотворным в этом смысле является применение систем обработки знаний экспертов с помощью алгоритмов нечеткого логического вывода [1; 2].
Модель многомерных данных
Трехмерная модель исходных данных представляет собой информационный «куб» [3] со следующими измерениями:
-
1. «время» в виде последовательности месяцев n = 1,2,..., N ( N = 48 ) в период с 2008 по 2011 год включительно;
-
2. «округ» в виде упорядоченной последовательности административных округов г. Москвы m = 1,2,..., M ( M = 11 ) , представленных в таблице 1 по состоянию на 2011 год;
-
3. «тип ОНР» в виде упорядоченной последовательности типов наружной рекламы k = 1,2,..., K ( K = 30 ) , представленных в таблице 2;
Таблица 1
Административные округа
m |
Наименование |
1. |
Общегородской заказ (ОГЗ) |
2. |
Восточный административный округ (ВАО) |
3. |
Западный административный округ (ЗАО) |
4. |
Зеленоградский административный округ (ЗелАО) |
5. |
Северный административный округ (САО) |
6. |
Северо-восточный административный округ (СВАО) |
7. |
Северо-западный административный округ (СЗАО) |
8. |
Центральный административный округ (ЦАО) |
9. |
Южный административный округ (ЮАО) |
10. |
Юго-восточный административный округ (ЮВАО) |
11. |
Юго-западный административный округ (ЮЗАО) |
Кластерная структура данных исследовалась в пространстве Евклида одиннадцати административных округов г. Москвы. Исходными при- знаками в этом случае являются компоненты вектора столбца
x = ( x j
x m ) )
в виде поступлений в московский бюджет от ОНР, консолидированных по месяцам в периоды 2008 ( 1 < n < 12 ) , 2009 ( 13 < n < 24 ) , 2010 ( 25 < n < 36 ) и 2011 ( 37 < n < 48 ) годов. Здесь и далее зависимость векторов от индекса времени n опускаем для упрощения записи.
Типы наружной рекламы
Таблица 2
23. |
Транспарант-перетяжка |
24. |
Тумба отдельно стоящая |
25. |
Щит на временном ограждении |
26. |
Щит на ограждении |
27. |
Щит отдельно стоящий |
28. |
Электронный экран на здании |
29. |
Электронный экран на крыше |
30. |
Электронный экран отдельно стоящий |
Иными словами, для каждого года выборка обучающих примеров представляет собой блочную матрицу X = ( X 1 :•••: X K ) размером M х K .
- т
Текущий столбец X k = ( X 1 k ,..., XMk ) матрицы – это поступления в бюджет от k -го типа рекламы в административные округа за фиксированный год.
Разведочный анализ данных выполнялся после предварительного преобразования Бокса – Кокса (БКП) [4] обучающей выборки для каждого административного округа. Величина смещения БКП е выбиралась из условий X mk + е > 0, m = 1,2,...,M, к = 1,2,^,K . Оптимальное значение параметра gm БКП удовлетворяли критерию максимума логарифма правдоподобия L(gm). Зависимости логарифма правдоподобия L ( gm) от параметра gm для поступлений в московский бюджет от ОНР за 2008 г. в один- надцати административных округах и значения смещения е = 10-8 иллюстрирует рис. 1.

Рис. 1. Зависимость логарифма правдоподобия от параметра преобразования Бокса – Кокса
Результаты расчета показали, что оптимальные оценки параметра БКП лежат в интервале - 0,15 < gm < 0,1, m = 1,2,..., M . Графики БКП для указанных выше значений параметра gm демонстрирует рис. 2.

Рис. 2. БКП для различных значений параметра g :
1 - g = - 0,15; 2 - g = - 0,1; 3 - g = - 0,05;
4 - g = 0; 5 - g = 0,05; 6 - g = 0,1
Удобным инструментом разведочного анализа данных является диаграмма рассеяния (ДР), содержащая K точек в M-мерном пространстве . T преобразованных признаков Yk = ( Y1 k, ^, YMk) , к = 1,2,^,K. Здесь и в дальнейшем зависимость от параметра gm БКП опускается. Топологию ДР удобно исследовать методом ‟Grand Turˮ динамической визуализации многомерных данных [5]. Ортогональная проекция ДР на одну из гиперплоскостей в пространстве одиннадцати административных округов г. Москвы для поступлений в 2008 г. представлена на рис. 3.
ВЕСТНИК 2014. ВЫПУСК 4

Рис. 3. Ортогональная проекция многомерной ДР на плоскость визуализации
ВЕСТНИК 2014. ВЫПУСК 4
Анализ формы ДР с различных ракурсов свидетельствует о наличии достаточно выраженных генеральных направлений в пространстве преобразованных признаков. Иными словами, имеет место значимая корреляция признаков y = ( У 1 , — , У м ) .
Нечетко-множественый и вероятностный подходы к анализу данных
Существенной проблемой формирования адекватных описательных статистик является наличие жесткого ограничения малого объема данных. В нашем случае гипотетический объем выборки K = 30 ассоциирован с количеством типов ОНР Однако значения Xmk = 0, свидетельствующие об отсутствии поступлений в округа от некоторых типов рекламы, приводят к необходимости игнорировать аномально низкие величины признаков. Это снижает фактический объем данных. Известно, что в соответствии с правилом Старгеса (Sturges’s rule) [6] объем выборки, необходимый для формирования гистограммы нормального распределения, содержащей как минимум 5 разрядных интервалов, рассчитывают по формуле K min = 2 5 - 1 = 2 4 = 16 .
Рациональное решение проблемы малого объема выборки основано на нечеткомножественном подходе к анализу данных. В рамках такого подхода конструктивным является понятие квазистатистики, введенное в работе [2, с. 28]. В частности, консолидированные по годам выборки поступлений в бюджет от 30 типов ОНР в каждый из одиннадцати округов г. Москвы будем считать достаточными, чтобы с приемлемой степенью достоверности сформировать оценки законов распределения наблюдений.
С другой стороны, нет оснований кардинально разграничивать нечетко-множественный и вероятностный подходы к интеллектуальному анализу данных. В указанном смысле следует отметить результаты теоретического анализа, представленного в разделе 1.4.6 работы [7], интерпретирующего нечеткие множества как «проекции» случайных множеств. Последующее содержание статьи демонстрирует плодотворное сочетание нечетко-множественной и вероятностной методологий.
Исключение аномальных значений из данных
Аномальные значения в данных существенно искажают результаты стандартного оценивания основных статистик. Одним из рациональных методов исключения влияния загрязнений выборки являются экспоненциально взвешенные оценки (ЭВО) характеристик положения и масштаба Л. Д. Мешалкина. Одномерные робастные ЭВО математического ожидания (МО) am (2) и среднего квадрата отклонения (СКО) sm (2), m = 1,2,—, M представляют собой решение соответствующей системы нелинейных уравнений [8].
Структура ЭВО обеспечивает автоматическое подавление выбросов в данных, если параметр эффективности статистик 2 > 0 . Аномально большие значения Ymk формируют большие расстояния Махаланобиса, поэтому взвешиваются экспоненциальными весами, достаточно малыми, чтобы не вносить значимого вклада в результирующую оценку. В работах А.М. Шурыгина [8] показано, что ЭВО являются оценками минимума контраста. Однако снижение эффективности ЭВО повышает их устойчивость к нарушению гипотезы нормальности плотности распределения вероятности (ПРВ).
Процесс сходимости алгоритма расчета ЭВО с параметром 2 = 1 для характеристик положения и масштаба поступлений от ОНР за 2008 г. в случае общегородского заказа ( m = 1) иллюстрирует рис. 4
ЭВО удобны для формирования границ, отделяющих кластер «типичных» значений Ymk , k = 1,2, — , K от выбросов. Результаты моделирования показали, что в качестве границ рационально выбирать правило «двух сигм», т.е. величины ( a m ± 2 sm ) . В соответствии с указанным правилом выполнялось масштабирование данных:
(у _у( min)l / 1 у( max)_у( min)!
-
y mk mk m \ \ m m J,
-
k = 1,2,..., K m ,
очищенных от загрязнений, с целью преобразования их к стандартному интервалу от 0 до 1. Здесь Y m min ) и Y m max ) - робастные оценки точной нижней и верхней границ кластера «типичных» значений; Km – количество наблюдений в кластере.

Рис. 4. ЭВО характеристик положения и масштаба: 1 – МО; 2 – СКО
Гистограмма, сглаженная сдвигом
В рамках понятия квазистатистики адекватной моделью закона распределения для выборки данных, очищенных от загрязнений, является ASH-оценка. Процедуру сглаживания классической гистограммы окном данных Wm ( n ) описывает уравнение дискретной свертки [6]. Ширина разрядных интервалов выбиралась в соответствии с робастной оценкой Фридмана – Дьякониса 2 IQm J ^ К m , где IQm - интерквартильный диапазон нормированных поступлений в бюджет в m-ом административном округе за фиксированный год. Кроме того, ширину разрядных интервалов классической гистограммы выбирали так, чтобы их количество было не ме- нее пяти.
Окно данных W m ( n ) выбирали из условия Е п-1- i W m ( n ) = i m . В этом случае ASH-оценка распред m еления интегрируема с единицей. Такой нормировке удовлетворяет обобщенное окно вида: / im - 1
Wm ( П ) = imKer ( njim )/ Е Ker ( llim ) , l=1-im где Ker (u) - положительная четная функция ядра, заданная на стандартном интервале [–1; 1] и интегрируемая с единицей. Популярные модели ядерных функций приведены в [6, с. 140]. На рис. 5 представлена ASH-оценка распределения нормированных поступлений в бюджет за 2008 г. для общегородского заказа.

Рис. 5. Оценки распределения нормированных поступлений в бюджет:
1 – ASH; 2 – полигауссовская аппроксимация
Конечная смесь стандартных распределений
Теоретически обоснованной методической основой процедуры лингвистического анализа гистограммы [9] является модель конечной смеси стандартных распределений:
Nm f m (у I ^ m ) = ^ Pmn Ф mn (у I
N m П = 1
У p =1 mn , n =1
c mn ’ s mn ) ,
где Pmn , n = 1,2,..., Nm и Nm - априорные веса лингвистических классов уровней «доходности» ОНР и их количество для m -го административного округа; Ф mn ( y\c mn , s mn ) - парциальные распределения с характеристиками положения cmn и масштаба smn лингвистических классов. В дальнейшем там, где это не вызвано необходимостью, зависимость параметров модели (3) от номера m административного округа опускаем для сокращения записи.
В рамках представления (3) байесовский подход к формированию параметрической мо- дели лингвистической переменной сводился к описанию функций принадлежности классов апостериорными весами:
wn (у| 9 )= Pn Ф n ( y |cn , sn )/ f ( y| 9), n = 1,2,^, N (4)
Оптимальную оценку вектора параметров 6 = ( P 1 ,^, PN , c 1 ,^, cN , s 1 , ^ , S N ) модели (3) получают с помощью эффективного в вычислительном отношении EM -алгоритма. Стандартным критерием оптимальности параметров модели является функционал правдоподобия Фишера:
-
6 opt = argmax { L ( 6)}
1θ
L ( 9 ) = J ln { / ( ^ | 9)} f ( y ) dy .
Рациональным критерием оптимальности является также функционал расстояния Бхатача-рия [10]:
9 1 opt = arg min { D (9)} ,
ВЕСТНИК 2014. ВЫПУСК 4
l 0 J
Решением указанных выше задач условной оптимизации является система нелинейных уравнений, представленная в [10]. Итерационная процедура решения такой системы уравнений [11, с. 1299] позволила аппроксимировать ASH- оценку распределения нормированных поступлений в бюджет за фиксированный год в текущем административном округе параметрической моделью (3).
Выбор количества классов N терм множества лингвистической переменной уровней «доходности» ОНР и начальных оценок параметров модели (3) в значительной степени является субъективным и основан на мнении эксперта.
Популярной на практике является полигаус-совская модель конечной смеси распределений (3), в которой в качестве парциальных применяют нормальные распределения:
ϕ
n ( y\cn , sn ) rz—exp{ (y cn ) 122 sn )} sn 2π
Полигауссовская аппроксимация ASH-оцен- ки распределения нормированных поступлений в бюджет за 2008 г. для общегородского заказа представлена на рис. 5. Явно выраженная мо-
ВЕСТНИК 2014. ВЫПУСК 4
дальная структура распределения свидетельствует о наличии трех классов уровней «доходности» ОНР – низкой, средней и высокой. Байесовскую модель (4) соответствующей трехуровневой лингвистической переменной демонстрирует рис. 6.

Рис. 6. Байесовская модель лингвистической переменной: 1, 2, 3 – функции принадлежности классов низкой, средней, высокой «доходности» ОНР;
4 – полигауссовская аппроксимация ASH-оценки распределения
Процесс сходимости EM -алгоритма обучения модели (3) по критерию правдоподобия иллюстрирует рис. 7. Из графиков видно, что сходимость параметров модели к оптимальным значениям достигается практически за 10 итераций как по критерию правдоподобия Фишера L ( i ) , так и по критерию расстояния Бхатачария D ( i ) .

Рис. 7. Сходимость EM -алгоритма по итерациям i обучения модели
Нечеткий логический вывод
Ранжирование ОНР по уровню поступлений в бюджет выполнялось с помощью алгоритмов нечеткого логического вывода. Одним из основных этапов формирования моделей приближенных рассуждений является агрегирование нечеткой информации об объекте анализа. В нашем случае – это композиция средних уровней «доходности» лингвистических классов. Иными словами, комплексный показатель эффективности различных типов ОНР представлен в виде байесовской модели учета неопределенности:
N m
У(AC>=Y c w ymk mn mn n =1
m = 1,2, . , M ,
k = 1,2, ^ , K ,
где c mn и y mk – средняя «доходность» (узловая точка [2, с. 157; 9]) n -го лингвистического класса и нормированные поступления в городской бюджет от k -го типа ОНР в m -ом административном округе за фиксированный год.
Последовательность значений y mAC ) k = 1,2, ..., K упорядоченная по убыванию, ранжирует различные типы ОНР по их «доходности» в m -ом административном округе за фиксированный год. Кроме того, байесовский классификатор, зачисляющий k -й тип ОНР в n -й класс «доходности» по правилу победителя, т.е.
( ^ ^"
V , \ 0 > W V , У , ymk m m j ymk m , j = 1,2,...,Nm , j ^ n реализует лингвистическую кластеризацию ОНР. В качестве примера в таблицах 4–6 представлены результаты такого рода кластеризации по уровням поступлений в бюджет за 2008 г. для общегородского заказа.
Таблица 4
:S О
о в
о V 3 аа v
ОО ОО о о |
ОО ОО о о |
ОО ОО о о |
сч ОО о о |
мч о о |
СП 40 о |
ОО 40 40 О |
<п сд о |
о о мп ОО 40 О |
|
о о о о о о iH |
о о о о о о ^ |
о о о о о о ^ |
40 04 04 04 04 о |
о сч 04 04 04 о |
сч сп хг 04 о |
00 04 04 «Г, О |
ХГ ГО 1Л 04 40 О |
40 m 04 1-4 40 К) о |
|
з |
о о о о о о о |
о о о о о о о |
о о о о о о о |
сч о о о |
ОО сч о о о |
04 40 vn сд о о |
04 04 сч ОО сч о |
04 40 ОО сч о о |
СП о |
о о о о о о о |
о о о о о о о |
о о о о о о о |
о о о о о |
сч о о о о о |
04 04 О О О О О |
о 40 О О о |
мп о о о |
04 ОО сч о о о |
|
МП сч |
04 04 МП о |
сч о о о о о о о |
04 о о 40 04 о |
04 ОО 04 ОО о |
О 04 оо о |
vn МП 04 сч сч о |
04 ОО о 04 О |
сч S о о |
|
сч |
сч |
о |
ОО |
г- |
о |
хГ |
S |
г- |
|
в н В О У В н |
ж Д 2 н о о и й (D ^ н о |
cd у (D (D Д н Д Он Д И cd э |
12 Й д сч (D (D ч о хо 2 й ^ cd о о и и cd д (D о и и (D н о cd к |
cd д и о и cd н д 2 |
(D Он о к о >д о Й о н (D Й о cd и и ж (D н 2 и |
Д о н о о и й 5 о и се & m )В И И о & |
(D Д хо зД О н о о Й S 2 Й У (D (D Ч О хо о о н о 3S о и « о 2 й « cd о S cd « со cd И И Ж (D Н 3 |
2 о н о о и й 5 О cd хо 2 |
cd н СХи О к о И cd X cd Й о и cd Н О о cd И cd (D сц |
ю
:В
О у
аа
:В В
В о»
Ч В
в
S
в аа
S В в
Я о
мп мп 40 ОО 40 40 О |
40 СЧ 40 мп о |
04 О 40 СЧ мп о |
ОО 40 СЧ сч мп о |
мп о мп о |
О 04 о |
|
О 40 сч 40 О |
мп ОО о о о |
40 ОО О О о о |
сч 40 О О О о |
о о о о о |
40 О О О О О |
|
00 ID ХГ m ГП о |
40 ХГ ID ГП 1Г> 04 О |
^ сч сч о о |
04 1Л 40 о |
04 ХГ СП 1-Н 40 О |
т W СП 1-4 ID 40 О |
|
40 04 О О О |
04 мп мп о о |
04 мп 04 СЧ сч о |
04 О S О |
ОО мп ОО СП о |
40 ОО О |
|
мп 40 04 40 О |
3 о 40 О |
мп мп о |
сч мп о |
мп мп ОО мп о |
ОО 04 мп мп о |
|
СЧ сч |
СП |
04 |
’—1 |
мп |
04 СЧ |
|
в в S н В О S В н |
2 й н о cd У Ж (D ^ СО (D О & ^ cd И cd ^ Й о и cd Н о^ S & И о S cd Н О |
2 cd й S ч о хо о о к S д cd со Д Д cd о Д t^ д н rt о & д 1 о Д о Д К Д cd В я Н * 5 s § в о ч -& U S в |
X се В В н о ч о в X в и S ЕВ В X се се Ч ■& се В се (D сц |
^ Й X сч (D (D д (D 2 2 й « cd 2 о g о д д cd Д (D О д д (D н О cd К |
2Д о н о о Й д 2 Й д (D (D д (D 2 2 д о о н о )Д о д « о 2 й « cd 2 о g в се П го се В Я § 1Г> В о 2 я « S |
(D 3 & се В В се & m 5В В В В о & |
ВЕСТНИК 2014. ВЫПУСК 4
ВЕСТНИК 2014. ВЫПУСК 4
Os гц D ОО о |
гц Os ОО о |
Os ОО tn о |
о о 40 Os о |
о о |
ОО m о |
о tn о |
ОО О |
ГЦ 40 40 О |
D О |
D О |
D О |
IT) о |
D О |
tn о |
|
3 |
о о о |
о о о о |
о о о о |
о о о о |
о о о |
о о о |
о о о о о о о |
о о о о о о о |
О О О О О О о |
О О о о о о о |
О о о о о о о |
О О о о о о о |
о о о о о о о |
О О о о о о о |
о о о о о о о |
3 |
Os Os о ГЦ о |
Os Os tn о о |
ОО ОО D о о |
ОО 40 о ГЦ о о |
о о о |
40 ГЦ о о о |
3 Os о о о |
ОО Os о о о о |
ОО Os tn о о о о |
о о о о о о о |
о о о о о о о |
о о о о о о о |
о о о о о о о |
о о о о о о о |
о о о о о о о |
ГЦ о о 40 Os о |
W гц о гц ^г OS о |
ГЦ iH id ^г ID OS о |
ГЦ m ID Os OS о |
m SO ID OS 00 OS о |
Os ГЦ Os OS о |
40 W о 40 Os OS о |
ГП W о OS OS OS о |
ГЦ о ^ Os OS OS о |
о о о о о о W |
о о о о о о W |
о о о о о о W |
о о о о о о W |
о о о о о о W |
о о о о о о ^ |
|
й Os tn s о |
Os о о о |
ОО 40 40 9 о |
о о о |
гц о Os о |
tn 40 40 ОО о |
tn ОО ГЦ Os о |
о о Os о |
ОО о |
ГЦ ОО о ГЦ о |
о Os о ГЦ о |
ОО ГЦ Os tn о |
40 о о о о о о о о |
40 о Os Os 40 tn о |
40 tn tn со tn о |
|
tn |
гц |
tn гц |
Os |
40 |
о ГЦ |
ОО ГЦ |
40 |
40 ГЦ |
’—1 |
ГЦ |
ГЦ |
ОО |
|||
Я Я я о. н я о я я я н |
X о о и X и 5 X & rt S X се се ■е се И се 1 (D Он t* О н о о и й 5 о |
rt И н ^3 i и t* и о к cd И о о И m |
cd к О о cd й И И (D И cd о о & и 5 (D Й ю О |
S S П Й & о 5 о И 5 и се И Ё |
cd со S |
(D Он о к о ж о и о н (D О (D И cd И И Ж (D н 3 и о |
t^ о н о о и й 5 О (D Й Ю О 3S И И (D Й И О И cd Н О о & и (D Й ю О |
2 л rt се о ч м S s' се S X о ч о S X S и X & rt S X се се -^^ S м' се S ^ § 8 (D О Сц ю |
S S S се П м се S S се & m 5S S S о & |
9 S S и о В S S о ■& ч о н В & S 5S S § (D 3 и о о 3 и (D Й Ю О (D 3 Й о к S и (D и (D S о С |
S S S о П Й се & о се S Ё |
й cd ^ S m |
2 л rt се о ч В м S в s'1 се П м се S X се о ч о S X S и 5 X S & rt S X се се -^^ Я § 5 ^ cd Рч В |
cd в се Ч И & К се В S Q О К |
(D н (D о Эй о и Й 5 О Он и о cd И cd 1 (D Он |
Заключение
В работе проанализирована тесная взаимосвязь вероятностного и нечетко-множественного подходов к анализу и моделированию эффективности различных типов ОНР по критерию поступлений в московский бюджет. Представлена методика учета фактора неопределенности, обусловленного малым объемом выборки на основе применения фундаментальной процедуры сглаживания экспериментальных данных. В частности, проиллюстрирована эффективность лингвистического анализа распределений исходных признаков в результате комбинации непараметрической модели в виде гистограммы, сглаженной сдвигом, и параметрического описания в виде конечной смеси стандартных плотностей.
Список литературы Нечётко-множественная кластеризация поступлений в московский бюджет от рынка наружной рекламы
- Ведерников В.В. Нечётко-множественное моделирование в анализе и прогнозировании экономических явлений и процессов: исторический аспект //Проблемы современной экономики. -2006. -№ 1 (17). -URL: www.m-economy.ru.
- Недосекин А.О. Нечётко-множественный анализ рисков фондовых инвестиций. -СПб.: Сезам, 2002. -181 с.
- Барсегян А.А. Технологии анализа данных: Data Mining, Visual Mining, Text Mining, OLAP/А.А. Барсегян, М.С. Куприянов, В.В. Степаненко, И.И. Холод. -2-е изд., перераб. и доп. -СПб.: БХВ -Петербург, 2007. -384 с.
- Box, G.E.P., Cox, D. R. An analysis of transformation//Journal of the Royal Statistical Society. Series B (Methodological). -1964. -Vol. 26. -№ 2. -Pp. 211-252.
- Buja, A., Cook, D., Asimov, D., Hurley, C. Theory and computational methods for dynamic projections in high-dimensional data visualizations//Journal of Computational and Graphical Statistics. -1999. -Vol. 8. -№ 3. -Pp. 1 -24.
- Scott D.W. Multivariate Density Estimation: Theory, Practice, and Visualization. -N.Y.: John Wiley & Sons, Inc, 1992. -317 c.
- Орлов А.И. Прикладная статистика. -М.: Экзамен, 2006. -671 с.
- Шурыгин А.М. Прикладная стохастика: робастность, оценивание, прогноз. -М.: Финансы и статистика, 2000. -224 с.
- Недосекин А.О., Фролова С.Н. Лингвистический анализ гистограмм экономических факторов//Вестник ВГУ. -Серия: «Экономика и управление». -2008. -Выпуск 2. -С. 48-55.
- Лабунец Л.В. Рандомизация многомерных распределений в метрике Махаланобиса//Радиотехника и электроника. -2000. -Т. 45. -№ 10. -С. 1214-1225.
- Лабунец Л.В., Лукин Д.С., Червяков А.А. Реконструкция отражательных характеристик 3D-объектов в однопозиционной системе оптической локации//Радиотехника и электроника. -2012. -Т. 57. -№ 12. -С. 1289-1300.