Выявление устойчивых наборов значимых факторов кадастровой стоимости земли малых и средних городов северо-запада методом главных компонент
Автор: Киселев В.А., Беляев В.В., Балтыжакова Татьяна Игоревна
Журнал: Имущественные отношения в Российской Федерации @iovrf
Рубрика: Оценка всех видов собственности
Статья в выпуске: 2 (137), 2013 года.
Бесплатный доступ
Статья посвящена определению набора значимых факторов кадастровой оценки для малых и средних населенных пунктов на примере городов северо-западного региона с помощью метода главных компонент (расчеты проводились в статистической среде R на основе результатов кадастровой оценки). Авторами рассматривается теория метода главных компонент, приводится пример анализа результатов расчетов, определяются факторы кадастровой оценки в сложившихся в регионе условиях.
Кадастровая оценка, фактор кадастровой оценки, кадастровая стоимость, метод главных компонент
Короткий адрес: https://sciup.org/170171983
IDR: 170171983
Текст научной статьи Выявление устойчивых наборов значимых факторов кадастровой стоимости земли малых и средних городов северо-запада методом главных компонент
Кадастровая оценка земли – это один из экономических методов управления земельными ресурсами. В настоящее время кадастровая оценка земель населенных пунктов осуществляется в соответствии с Методикой государственной кадастровой оценки земли, утвержденной в 2007 году [2]. При проведении кадастровой оценки земельных участков для конкретного вида разрешенного использования формируется перечень ценообразующих факторов. Для каждого конкретного города этот состав может быть различен в силу местных особенностей, и, следовательно, предлагаемый набор факторов должен быть обоснован. Подходов к обоснованию выбора исследуемых факторов существует несколько. В частности, Методические указания [2] предусматривают выбор факторов стоимости земельных участков для каждой сформированной группы двумя способами. Первый способ заключается в расчете коэффициентов корреляции факторов стоимости с рыночными стоимостями земельных участков. В соответствии с этим подходом для последующего расчета кадастровой стоимости земельных участков отбирают только те факторы, коэффициенты значимости которых составили не менее 0,2–0,3 [4]. Второй способ предполагает выбор факторов стоимости земельных участков группы на основе экспертного мнения.
Однако оба способа не могут считаться полностью удовлетворяющими требования оценщиков, поскольку в силу неразвитости рынка недвижимости в России получить значения рыночной стоимости земельного участка довольно проблематично, а экспертный подход характеризуется субъективностью суждений. В связи с этим в целях повышения объективности оценки земли возникает необходимость минимизировать использование экспертных методов и обратиться к численным методам объективного выявления значимых факторов кадастровой стоимости земли.
В качестве метода решения поставленной задачи был выбран метод главных компонент (PCA – Principal Components Analysis), который представляет собой один из основных способов уменьшения размерности с потерей наименьшего количества информации и позволяет выделить ведущие факторы вариации исследуемых случайных величин. Метод применяется в тех случаях, когда можно предполагать, что значения случайной величины флюктуируют под воздействием ограниченного числа причин и эти причины могут быть выражены через исследуемые случайные величины. Это позволяет определять наиболее значимые факторы без привлечения значений результирующей функции, как это реализуется в методах регрессионного анализа.
Для представления переменных, характеризующих земельные участки, формируют матрицу переменных X размерностью ( I x J ), где I - число объектов, например земельных участков (количество строк), а J – число независимых переменных (столбцов), которых, как правило, много ( J >> 1). В методе главных компонент используются новые, формальные переменные ta ( a = 1,…, A ), являющиеся линейной комбинацией исходных переменных xj ( j = 1,…, J ) [3]:
t a = P a 1 x 1 + - + P^x j - (1)
С помощью этих новых переменных матрица X разлагается в произведение двух матриц T и P :
A
X = TP‘ + E = £ t a P a + E , (2)
a = 1
где T – матрица счетов (scores), размерность ( I x A );
P – матрица нагрузок (loadings), размерность ( J × A );
E – матрица остатков, размерность ( I × J ).
Новые переменные ta называются главными компонентами (Principal Components). Число столбцов ( ta в матрице T и pa в матрице P ) равно A и называется числом главных компонент (PC).
Важным свойством PCA является ортогональность (независимость) главных компонент.
Матрица счетов T дает проекции исходных образцов (J-мерных векторов x1, …, xI) на подпространство главных компонент (A-мерное). Строки t1,…,tI матрицы T – это координаты образцов в новой системе ко- ординат. Столбцы t1,…,tA матрицы T ортогональны и представляют проекции всех объектов на одну новую координатную ось.
Матрица нагрузок P – это матрица перехода из исходного пространства переменных x 1 , … xJ ( J -мерного) в пространство главных компонент ( A -мерное). Каждая строка матрицы P состоит из коэффициентов, связывающих переменные t и x . Например, a -я строка – это проекция всех переменных x 1 , … xJ на a -ю ось главных компонент. Каждый столбец P – это проекция соответствующей переменной xj на новую систему координат.
График нагрузок используется для исследования роли переменных. На этом графике каждая переменная xj отображается точкой в координатах ( pi , p j ), например p 1 , p 2 . Анализируя его, можно понять, какие переменные связаны, а какие независимы.
С целью исследования возможности применения метода главных компонент для выявления наиболее значимых факторов кадастровой оценки земель были проанализированы результаты кадастровой оценки следующих городов северо-западного региона: Всеволожск, Тосно, Великие Луки, Нарьян-Мар, Тихвин и Советск. Все выбранные города относятся к типу малых и средних. В них сосредоточено большинство жителей региона, а значит, обеспечивается максимальное поступление налогов.
Исходный перечень факторов был составлен в соответствии с Методическими указаниями [2]. При этом перечень факторов был разбит на две группы: обобщенные факторы и подфакторы. Обобщенные факторы содержат информацию о группе факторов. Так, например, обобщенный фактор «доступность населения к центру города» подразделяется на подфакторы:
-
• интенсивность движения общественного транспорта;
-
• доступность с территории кадастрового квартала до остановок общественного транспорта;
-
• доступность с территории кадастро-
- вого квартала до железнодорожной станции (платформы) и т. п.
При кадастровой оценке земли факторы могут быть заданы как в абсолютных значениях (например доступность до центра города в километрах), так и в виде относительных коэффициентов относительной ценности территории.
Города Всеволожск и Тосно были оценены по обобщенным факторам, остальные города – с разбиением обобщенных факторов на подфакторы. Рассматриваемые в настоящей работе результаты кадастровой оценки по факторам представлены в виде коэффициентов.
В качестве исходных данных для города Тосно выступали результаты кадастровой оценки по 7 обобщенным факторам, представленные в виде коэффициентов относительной ценности территории. Перечень факторов представлен в таблице 1. Исходные данные были сформированы в матрицу, каждая строка которой содержит информацию об одном кадастровом квартале, а столбцы таблицы – значения оценочных факторов.
Метод главных компонент представляет собой довольно сложную расчетную процедуру, поэтому пользователи стараются применять компьютерные программы. Рассматриваемый метод реализован во многих программах для статистических расчетов и анализа данных. В настоящей статье для расчетов была выбрана статистическая среда R. Выбор именно этой программной среды для анализа данных обусловлен возможностью бесплатного легального использования и высокой вычислительной мощностью при невысоких системных требованиях. Статистическая среда R – это язык программирования для статистических расчетов и работы с графикой, имеющая открытый исходный код (см. [1]).
Метод главных компонент – это итерационная процедура, в которой новые компоненты добавляются последовательно, одна за другой. Важно знать, когда остановить этот процесс, то есть определить правильное число главных компонент. Для решения этой задачи в статистической среде R создается матрица важности компонент (см. табл. 1).
Таблица 1
Матрица важности компонент
Параметр |
Компонента |
||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
|
Стандартное отклонение |
0,6363817 |
0,2198594 |
0,1424772 |
0,1155102 |
0,0862352 |
0,0257807 |
0,0112596 |
Доля в вариации |
0,8178307 |
0,0976154 |
0,0409939 |
0,0269444 |
0,0150175 |
0,0013422 |
0,0002560 |
Кумулятивная доля |
0,8178307 |
0,9154460 |
0,9564399 |
0,9833843 |
0,9984018 |
0,9997440 |
1,0000000 |
Самым важным параметром в этой матрице для выделения нужного количества компонент является последняя строка – кумулятивная доля. Она показывает накопленное значение вариации, объясненное полученными компонентами. Установленный для настоящей работы уровень надежности – 95 процентов. Как видно из получен- ных результатов (см. табл. 1), достаточным количеством компонент будет 3, так как именно эти три компоненты объясняют 95,6 процента всей вариации.
В дополнение к матрице важности компонент программой выводится график, показывающий величину собственных значений (важность каждой компоненты) (рис. 1). Из

Рис. 1. График важности компонент
этого графика видно, что наиболее значимой в рассматриваемом случае будет первая компонента, минимальная же важность у компонент 6 и 7.
Анализ главных компонент подразумевает интерпретацию полученных компонент, однако для выявления наиболее значимых факторов в этом нет необходимости, поскольку для выделения факторов, наиболее сильно влияющих на компоненты, выполняется вывод матрицы нагрузок (см. табл. 2).
Таблица 2
Матрица нагрузок
Фактор |
Компонента |
||
1 |
2 |
3 |
|
x 1 |
0,983 |
– |
0,132 |
x 2 |
– |
– |
- 0,790 |
x 3 |
0,144 |
– |
0,390 |
x 4 |
– |
- 0,866 |
0,116 |
x 5 |
– |
0,352 |
0,437 |
x 6 |
– |
0,334 |
– |
x 7 |
– |
– |
– |
Согласно матрице нагрузок на три наиболее важные компоненты больше всего влияют 1-й, 2-й и 4-й факторы (в таблице 2 значения коэффициентов нагрузок отмечены жирным шрифтом). В представ- ленной матрице нагрузок влияние фактора на компоненту считается незначимым при абсолютном значении коэффициента нагрузки менее 0,7, и он исключается. Так, например, на первую компоненту оказывают влияние первый и третий факторы. Однако коэффициент нагрузки для первого фактора составляет 0,983, а для третьего – 0,144, поэтому первый фактор x1 отмечается как значимый, а третий в дальнейшем не учитывается. Аналогичный анализ был выполнен и для других главных компонент.
Помимо представленных матриц, связь между факторами и компонентами может быть показана в графическом виде (рис. 2).
Компоненты показаны координатными осями, а векторами обозначены факторы. По углу между вектором и осью, а также по длине вектора оценивается сила влияния фактора на компоненту: чем меньше угол и длиннее вектор, тем сильнее влияние. Так, на рисунке 2а видно, что фактор 1 очень сильно влияет на первую компоненту, а фактор 4 значительно влияет на вторую компоненту. Влияние других факторов на компоненты 1 и 2 мало ́ , так как значение векторов незначительно отличается от нуля. То есть на первую и вторую компоненты сильнее всего влияют факторы 1 и 4, эти факторы взаимно независимы (угол между векторами на графике почти равен 90 º ). Согласно графику (см. рис. 2б) на третью компоненту сильнее всего влияет фактор 2.
0.0

Компонента 1

а) б)
Рис. 2. Связь между факторами и компонентами (а – компоненты 1 и 2; б – компоненты 3 и 4)
Также на эту же компоненту влияют факторы 4 и 5. Но факторы 4 и 5 расположены в одной координатной четверти с небольшим углом между ними, что указывает на наличие корреляции между ними. Для исключения взаимной корреляции между факторами в набор значимых факторов включается только один из них. Таким образом, значимым является фактор 4.
Из представленных результатов следует, что на кадастровую стоимость земель в городе Тосно больше всего влияют следующие факторы:
-
• фактор х 1 – доступность населения к центру города, объектам культуры и бытового обслуживания общегородского значения;
-
• фактор х 2 – обеспеченность централизованным инженерным оборудованием и благоустройством территории, транспортная доступность к местам приложения труда;
-
• фактор х 4 – санитарные и микроклиматические условия.
Аналогично были проведены расчеты и анализ результатов для города Всеволожска. В таблице 3 показаны полученные результаты для городов Всеволожск и Тосно.
Обобщение результатов, полученных по двум городам, позволило выделить значимые факторы. Влияние фактора х 1 объясняется тем, что участки со свободным доступом к указанным в таблице 3 объектам значительно более ценны, чем участки, не имеющие такого доступа. Обеспеченность централизованным инженерным оборудованием также вносит значительный вклад в ценность земли, так как, безусловно, недвижимость, обладающая этим признаком, ценится гораздо выше. Также в этот фактор входит и транспортная доступность к местам приложения труда.
Фактор х 3 является значимым только для Всеволожска вследствие высокой степени дифференциации уровня развития сферы культурно-бытового обслуживания в районах города. Фактор х 5 слабо влияет на стоимость земли в этих городах ввиду отсутствия значимых в этом отношении объектов. Город Тосно менее развит в промышленном отношении, поэтому влияние фактора х 4 значительно. Фактор х 6 слабо влияет на кадастровую стоимость земли в этих городах, так как их территории однородны в этом отношении (в городах Всеволожск и Тосно нет крупных объектов рекреации).
Таблица 3
Фактор |
Всеволожск |
Тосно |
Итог |
x 1 – доступность населения к центру города, объектам культуры и бытового обслуживания общегородского значения |
2 |
||
x 2 – обеспеченность централизованным инженерным оборудованием и благоустройством территории, транспортная доступность к местам приложения труда |
2 |
||
x 3 – уровень развития сферы культурно-бытового обслуживания населения в пределах микрорайона, квартала или иной планировочной единицы местного значения |
1 |
||
x 4 – состояние окружающей среды, санитарные и микроклиматические условия |
1 |
||
x 5 – историческая ценность застройки, эстетическая и ландшафтная ценность территории |
0 |
||
x 6 – инженерно-геологические условия строительства и степень подверженности территории разрушительным природным и антропогенным воздействиям |
0 |
||
x 7 – рекреационная ценность территории |
0 |
Примечание:
1) значимые факторы отмечены выделенными серым тоном ячейками;
2) цифра в последнем столбце показывает количество городов из рассматриваемой группы, для которых фактор является значимым.
Результаты определения наиболее значимых факторов для городов, оцененных по обобщенным факторам кадастровой оценки
Количество рассматриваемых городов слишком мало ́ , чтобы делать полностью обоснованные выводы в отношении большой территории. Однако следует отметить, что для средних городов, расположенных в Ленинградской области, значимым будет являться набор из двух факторов.
Аналогично, с использованием метода главных компонент, были проанализированы результаты кадастровой оценки городов Великие Луки, Нарьян-Мар, Советск и Тихвин, но расчеты проводились по подфакторам (отдельно для каждой группы факторов). Результаты выделения наиболее значимых факторов представлены в таблицах 4 и 5.
В колонках «Итог» таблиц 4 и 5 – значимость фактора для группы городов. Цифра показывает количество городов из рассматриваемой группы, для которых фактор яв- ляется значимым.
Анализ таблицы 4 показывает, что из первых двух групп в набор значимых факторов кадастровой оценки следует включить (критерием включения фактора в набор является его значимость более чем для половины рассматриваемых городов) следующие факторы: 1.1; 1.3; 1.5; 1.6; 1.8.
Для третьей, четвертой, пятой и шестой групп факторов значимым является следующий набор факторов: 3.2; 3.3; 3.4; 3.5; 3.7; 4.1; 4.3; 4.4; 4.5; 5.1; 5.2; 5.3; 5.7; 5.8; 6.2 (см. таблицы 4 и 5).
Определенный нами перечень наиболее значимых факторов кадастровой стоимости земельных участков может быть использован в качестве базиса для расчета кадастровой стоимости земель под многоэтажной жилой застройкой малых и средних городов Северо-Западного федерального округа
Продолжение таблицы 4
S |
1- |
СО |
со |
со |
со |
1- |
см |
$ |
|||||||
8 |
|||||||
ф |
|||||||
о н 0) н о 3 X т е; 0) н 05 СО О СО 05 ю о 0) ю о ^ >s т 0) EI ^ 0) X т о о EI X § 05 Н 05 ^ 5£ СО о о ь О О Н ^1 S со ^ |
05 е; 05 н о_ 05 СО ^ О о со о н о 05 EI 05 ^ О_ О н 0) н о т о с X е; о о со со S X о н 0) Ц н о о т EZ н о о d см со |
^ со О о н о т т т со о о_ со о 0) г^ ю о X т 05 Н EZ 05 ^ 05 05 н о_ 05 СО ^ О о со о н о 05 ” го S 1- О о о го ГО о Q. л Ф 1- с о >, о о С 00 >, о 1- т о S О со с[ го со го со 3- |
^ о EI 05 5 О е; EZ X т со н о EZ О 05 е; 05 н о_ 05 СО ^ О о со о н о 05 EI 05 ^ О н 0) н 05 т 0) т е; 05 Т СО |
>s т 0) о о о X т 0) т 0) т X т со о о 05 05 н о_ 05 СО ^ О о со о о_ н о --? §с ГО 1 S -п о. о го 1- го Q. о ГО 00 ф 1- >s О ГО _□ ф о ° о 2 с т но. 8 8 СО 1- |
>s т 0) т 0) е; со со 05 о_ S 05 X о н о т ^ со о н 0) Д1 ю о го ГО ^-> ГО С ГО 00 s го о ГО 1— го 00 О -0 ГО ГО о т л 0) О 05 8 Го ^е о § о о <2 g-С0 L |
X т е; 05 =Г О о X т 0) ^ го с СО СО 5 го О- ZT с I О ф ГО ¥ $ ю 05 _0 о_ 05 0) Н L_ Q_ 05 05 с; со 05 2 3 о о. 00 О о £ о. . го i го: т го 5 s о s ю 2 го и о н го § о X 11 н го о о ag ■о ю со о |
|
CQ Ф 2 §.8 С 5 |
bqiedi |
V) X 6 s ф X X I |
s |
co |
1- |
CM |
co |
co |
CM |
CM |
CM |
1- |
i- |
1- |
СМ |
СМ |
1- |
СО |
1 т 05 ZE СО сх о н ф сх е; со сх Оо н 05 -& X о н о ^ сх е; EI С EZ О_ >S О ф 05 СО н 05 О о 05 CL СО S S со 05 5 О >S Q-0) о т L- сх о i s S сП ф -0 -0 X 00 о 5 с т Ф Ф =г т ю Ф го 2 ° о о о. | ф го го ..-8-0 § ф 1= S -0 со ?1^ |И X ф =г С - см |
X 1 |
|||||||||||||||||
8 |
|||||||||||||||||
05 05 H Q_ 05 ^ О b о 05 El 05 ^ О H 0) H 05 T 05 X EI CO DO CX 0) co ex Q_ b co T 0) co о CL |
05 e; 05 H Q_ 05 CO ^ О О co о Q_ 1— о 05 EI 05 ^ S Q_ О H Q_ Q_ 0) H 05 T m T О EZ CX T 0) T co ex Q_ b co T 0) co о CL CM |
EI О DO X T T 0) co T о EZ CX ZE 0) ZE co ex CL b co ZE 0) co о CL CO |
05 e; 05 H CL 05 CO ^ О b co о CL 1— о 05 EI 05 ^ S CL О H CL CL 0) H 05 ZE CX ZE 0) ZE CO ex CL 05 CO о о co о 3 I 0) co о CL |
05 e; 05 H CL 05 CO ^ О о co о CL 1— о 05 EI 05 ^ S CL О H CL CL 0) H 05 ZE >S 0) o EZ X ZE H ZE 05 О CL H ^ 0) e; о ZE 0) CO о CL LQ |
05 e; 05 H CL 05 CO ^ О b co о CL 1— о 05 EI 05 ^ S CL О H CL CL 0) H 05 ZE S ^ О CL 1— О 05 CO 1— о о ZE ZE 0) zzr ex 05 о 0) T 1— 0) 1— о 9 6 ZE CL H ^ 0) H X CL < LO |
05 EZ X ZE e; 0) s о s e; s co О 0) e; EZ X о 0) T CL О 1— о s 05 e; 05 H CL 05 CO ^ О о co о CL 1— о 05 го ^ 5 S Q. X >. CL S Si ГО Q. X О и s co с; О si c\i ID 5 |
05 e; 05 H CL 05 CO ^ О о co о CL 1— о 05 EI 05 ^ S CL О H CL CL 0) H 05 ZE >S ZE 0) О CL 1— О X X 1— 0) co s X CL 05 1— О 0) T e; 05 I co LO |
05 EI О CL О S H о 05 T >s о 0) T CL О H о s co 05 e; 05 H CL 05 CO ^ О b co о CL H о 05 EI 05 ^ 0) ZE 0) EI ^ О X 05 T LO |
6 5 Ю о s ZZT 05 0) CL 0) CL CO о H 0) Д1 © о X о о o Ф Ю о го го 1 го 00 X о о 00 о Q. 1— О го EI 05 ^ CL О Н Ф о о о S 5 о т о го С 1-н i о _0 О ZE cl =с . 0) LQ СО LD О |
СО о н 0) г^ ю о X ZE ZE О со ф о X о EI о CL О ф ю о 05 е; 05 н CL 05 СО ^ О о СО _ о CL О н н О CL 05 О EI EZ 05 О ZE о 5 ^ § о. о о. d Ф о н Q_ ° 2 -0 Q) о 5 о ю Т О &i о го С[ Ф <р ф LO CL |
05 е; 05 н CL 05 СО ^ О о со о CL н о 05 EI 05 ^ CL О Н CL CL Ф Н 05 ZE ci н S ф со о 05 со с; ю S ф е; .05^ сх ZE Ф ZE Ф е; ф О) О Ф т е; 05 Т LO |
X ZE EI Ф СО О EZ 05 СО о EI о CL CL EZ X ZE ZE 05 CL X О о EI о CL CL EZ 05 е; 05 н CL 05 СО ^ О о со о CL н о 05 EI 05 ^ CL О н CL CL Ф ZE ь О 05 <^ 1 >< Ц) -0 S ZE Т ZE 05 Щ CL CQ X ^ § " о LD СО |
X СО о н ZE CL сх ZE 05 Ф е; 05 СО ^ ф ZE СО о о_ о о со о н о ф 05 е; 05 Н CL 05 СО ^ О о со о CL н о 05 EI 05 ^ CL О н CL CL Ф Н 05 ZE Ф Т е; 05 Т ■ ci о СО со |
05 ZE Н О ф X ZE ZE Ф т о о ю 05 СО ф т е; 05 ZE S ^ 05 ^ EI О СО 05 EZ Ф ZE Ф е; EZ О t СУ О 05 EZ Н - CL сх 05 S со ZE ^ Го 2 Е о О 00 -о 2 1- го О Ц о го Т X X S о s го о о н m ^ g-© н |
|||
CQ §.8 C 5 ■8- |
tseidaaiah |
ВВ1ВЦ |
веюэщ |
Российской Федерации. Это позволит существенно сократить объем подготовительных работ по сбору значений ценообразующих факторов, так как факторы, не вошедшие в перечень, могут не рассматриваться.
Список литературы Выявление устойчивых наборов значимых факторов кадастровой стоимости земли малых и средних городов северо-запада методом главных компонент
- Балдин Е. Введение в R. URL: http://www.inp.nsk.su/~baldin/DataAnalysis/R/R-01-intro.pdf
- Методические указания по государственной кадастровой оценке земель населенных пунктов: приказ Министерства экономического развития и торговли Российской Федерации от 15 февраля 2007 года № 39. Доступ из справочной правовой системы «КонсультантПлюс».
- Померанцев А. Л. Метод главных компонент. URL: http://www.chemometrics.ru/materials/textbooks/pca.htm
- Технические рекомендации по государственной кадастровой оценке земель населенных пунктов : приказ Министерства экономического развития и торговли Российской Федерации, Федерального агентства кадастра недвижимости от 29 июня 2007 года № П/0152 : в редакции приказа Федерального агентства кадастра объектов недвижимости от 14 августа 2008 года. Доступ из справочной правовой системы «КонсультантПлюс».