Эконометрическое моделирование стоимости квартир в г. Реутове
Автор: Губина Е.А., Халикова А.А.
Журнал: Теория и практика современной науки @modern-j
Рубрика: Основной раздел
Статья в выпуске: 6 (6), 2015 года.
Бесплатный доступ
В статье охарактеризованы основные факторы, оказывающие влияние на формирование стоимости квартир в г. Реутове. Составлена эконометрическая модель по отобранным факторам для оценки их влияния на стоимость квартир. Осуществлена оценка значимости параметров модели с использованием корреляции, коэффициента детерминации и F-критерия Фишера. В работе определена оптимальная модель прогнозирования стоимости квартиры и сделан соответствующий прогноз.
Стоимость квартиры, эконометрическая модель, оценка значимости параметров, коэффициент детерминации, f-критерий фишера, корреляция
Короткий адрес: https://sciup.org/140266970
IDR: 140266970
Текст научной статьи Эконометрическое моделирование стоимости квартир в г. Реутове
Активная динамика развития инфраструктуры г. Москвы и близлежащих городов Московской области предполагает строительство новых жилых микрорайонов. Одним из таких развивающихся микрорайонов является Новокосино в г. Реутове. В данной работе произведен анализ стоимости квартир в ЖК «Новокосино» и Мкр. «Новокосино-2». Наша работа будет полезна для потенциальных покупателей квартир в данном микрорайоне, а также для всех людей, интересующихся в целом развитием и строительством Новой Москвы.
На стоимость квартир (У) влияет ряд факторов, наиболее важными из которых являются: количество комнат (Х 1 ), жилая площадь (Х 2 ), этаж (Х3 ), удаленность от метро (Х4) [5]. Поэтому именно они были использованы для построения модели. Так как ЖК «Новокосино» расположен существенно ближе к метро, чем Мкр. «Новокосино-2», то при построении модели было сделано следующее допущение. Если квартира расположена в ЖК «Новокосино», то фактору Х4 присваивалось значение 1, а если в Мкр. «Новокосино-2», то – 0.
-
1. Количество комнат
-
2. Жилая площадь
-
3. Этаж
-
4. Удаленность от метро
Выбор количества комнат осуществляется исходя из личных предпочтений и материальных возможностей домохозяйства. Для многодетной семьи желательнее приобретение квартиры с большим количеством комнат, а для молодых пар, пожилых людей достаточной может оказаться квартира с 1 или 2 комнатами.
Иногда людям важнее иметь квартиру с большим количеством комнат, хотя и небольшую по площади. Например, детям будет комфортнее в отдельной маленькой комнате, нежели в одной большой комнате с родителями. Зачастую стоимость большой однокомнатной квартиры и небольшой двухкомнатной отличается несильно.
Этаж выбирается в основном исходя из личных желаний покупателя. К сожалению, поломки лифтов – это остро стоящая проблема, поэтому не все стремятся жить на высоких этажах, хотя там лучшая шумоизоляция и зачастую более приятный вид из окна. Однако пожилым людям и людям с ограниченными физическими возможностями может быть удобнее жить на более низких этажах.
Очевидно, что большая часть людей стремится жить как можно ближе к метро, так как это сокращает время на дорогу до места работы/учебы. Но ограниченные финансовые возможности заставляют людей покупать более дешевое удаленное от метро жилье.
Для анализа была сделана выборка из 15 квартир в ЖК «Новокосино» и Мкр. «Новокосино-2». Исходные данные представлены в табл. 1 [4].
Табл.1 Исходные данные выбранных факторов
Y стоимость квартиры, тыс. руб. |
X i количество комнат, шт. |
Х 2 площадь квартиры, кв.м. |
Х 3 этаж |
Х 4 удаленность от метро |
4 700 |
1 |
40,18 |
2 |
0 |
4900 |
1 |
40,18 |
10 |
0 |
4 979 |
1 |
30,9 |
13 |
1 |
5 300 |
1 |
44,26 |
24 |
0 |
6 162 |
1 |
41,2 |
25 |
1 |
6 850 |
2 |
66,83 |
6 |
0 |
7 012 |
1 |
50 |
3 |
1 |
7 100 |
2 |
67,72 |
16 |
0 |
7 500 |
2 |
69,66 |
22 |
1 |
9 493 |
2 |
74,89 |
16 |
1 |
10 000 |
3 |
77,89 |
20 |
0 |
10 570 |
3 |
78,3 |
20 |
0 |
10 995 |
3 |
96,3 |
2 |
1 |
11 415 |
3 |
96,4 |
16 |
1 |
11 609 |
3 |
96,4 |
25 |
1 |
Оцениваемая модель носит линейный характер и описывается уравнением: Y = а0 + а 1 • Х 1 + а2 • Х 2 + а3 • Х3 + а4 • Х4 + £t.
Работа предполагает решение следующих задач:
-
• анализ коэффициентов корреляции между результирующим признаком Y и каждым из факторов Xj и оценка статистической значимости коэффициентов корреляции;
-
• расчет параметров линейных парных регрессий для всех факторов Х;
-
• выбор лучшей модели с помощью оценки качества каждой модели через коэффициент детерминации и F-критерий Фишера;
-
• прогнозирование среднего значения показателя Y c помощью выбранной модели.
Анализ коэффициентов корреляции между результирующим признаком У и каждым из факторов Xj и оценка статистической значимости коэффициентов корреляции.
Используя функцию Анализ данных/корреляция из вкладки «Данные», получим матрицу коэффициентов парной корреляции между всеми имеющимися переменными [3]:
Y стоимость квартиры, тыс. руб. |
Х 1 количество комнат, шт. |
Х 2 площадь квартиры, кв.м. |
Х3 этаж |
Х 4 удаленность от метро |
|
Y стоимость квартиры, тыс. руб. |
1 |
||||
Х 1 количество комнат, шт. |
0,938509 |
1 |
|||
Х 2 площадь квартиры, кв.м. |
0,952442 |
0,949060911 |
1 |
||
Х 3 этаж |
0,216254 |
0,200338004 |
0,140278 |
1 |
|
Х 4 удаленность от метро |
0,345054 |
0,073043589 |
0,202964 |
-0,04424 |
1 |
r(Y, Х1) = 0,939 > 0, следовательно, между переменными Y и Х1 наблюдается прямая корреляционная зависимость: чем больше количество комнат в квартире, тем выше цена на нее. |r(Y, Х1 )|=0,939 > 0,8, следовательно, эта зависимость тесная.
r(Y, Х2) = 0,952 > 0, следовательно, между переменными Y и Х2 наблюдается прямая корреляционная зависимость: чем больше жилая площадь в квартире, тем выше цена на нее. |r(Y, Х2)|= 0,952 > 0,8, следовательно, эта зависимость тесная.
r(Y, Х3) = 0,216 > 0, следовательно, между переменными Y и Х3 наблюдается прямая корреляционная зависимость: чем выше этаж, на котором расположена квартира, тем выше цена на нее. |r(Y, Х3 )|= 0,216 < 0,4, следовательно, эта зависимость слабая.
r(Y, Х4) = 0,345 > 0, следовательно, между переменными Y и Х4 наблюдается прямая корреляционная зависимость: чем меньше удаленность квартиры от метро, тем выше ее стоимость. |r(Y, Х4 )|= 0,345 < 0,4, следовательно, эта зависимость слабая.
Для проверки значимости найденных коэффициентов корреляции используем критерий Стьюдента. Для каждого коэффициента г^,Ху)
вычислим t-статистику по формуле t
J
r2*(n-2) 1-Т3
r (Y, Х 1 ) 0,939 t1 8,161919085
r (Y, Х 2 ) 0,952 t2 9,266885507
r (Y, X3 ) 0,216 t3 0,782753238
r (Y, X4) 0,345 t4 1,270269512
С помощью функции СТЬЮДРАСПОБР при уровне значимости а = 5% и числе степеней свободы k = n - 2 = 15 - 2 = 13 определим критическое значение tкр. = 2, 16. Сопоставим фактические значения статистик с критическим значением tкр. и сделаем соответствующие выводы:
t(r(Y, X i )) = 8,162 > tкр. = 2,16, следовательно, коэффициент r(Y, X 1 ) является значимым.
t(r(Y, X2)) = 9,267 > tкр. = 2,16, следовательно коэффициент r(Y, X2) является значимым.
t(r(Y, X 3 )) = 0,783 < 1кр. = 2,16, следовательно коэффициент r(Y, X3) не является значимым.
t(r(Y, X4 )) = 1,27 < tкр. = 2,16, следовательно, коэффициент r(Y,X4) не является значимым.
Теперь применим пошаговый метод исключения факторов. Мы наблюдаем сильную связь между факторами X 1 и X2, следовательно, один из них необходимо исключить. Так как связь между X 1 и Y меньше, чем между X2 и Y, исключаем фактор X 1 . Строим матрицу коэффициентов парной корреляции заново без фактора X 1 : _______________________________
Y стоимость квартиры, тыс. руб. |
X 2 площадь квартиры, кв.м. |
X 3 этаж |
X 4 удаленность от метро |
|
Y стоимость квартиры, тыс. руб. |
1 |
|||
X 2 площадь квартиры, кв.м. |
0,952442 |
1 |
||
X 3 этаж |
0,216254 |
0,140278002 |
1 |
|
X 4 удаленность от метро |
0,322925 |
0,233307475 |
0,077415 |
1 |
Из построенной матрицы коэффициентов парной корреляции, мы видим, что связь между X3 и Y очень слабая, поэтому исключаем фактор X3 . Перестроим матрицу коэффициентов еще раз:
Y стоимость квартиры, тыс. руб. |
X 2 площадь квартиры, кв.м. |
X 4 удаленность от метро |
|
Y стоимость квартиры, тыс. руб. |
1 |
||
X 2 площадь квартиры, кв.м. |
0,952442 |
1 |
Х 4 удаленность от метро |
0,322925 |
0,233307475 |
1 |
Из построенной матрицы коэффициентов парной корреляции, мы видим, что связь между Х4 и У очень слабая, поэтому исключаем фактор Х4 , оставив однофакторную модель У = а0 + а2 • Х2.
Расчет параметров линейных парных регрессий для всех факторов Х
Для построения парной линейной модели У t = а0 + at • Xt используем функция Анализ данных/регрессия во вкладке «Данные» [3]. В качестве входного интервала Х покажем значение фактора Х2. ___________________
Регрессионная статистика |
Дисперсионный анализ |
|||||
Множеств енный R |
df |
SS |
MS |
F |
Значимость F |
|
R-квадрат |
Регрессия |
1 |
81653059,69 |
81653059,7 |
127,0049 |
4,42147E-08 |
Нормиров анный R-квадрат |
Остаток |
13 |
8357867,645 |
642912,896 |
||
Стандарт ная ошибка |
Итого |
14 |
90010927,33 |
|||
Наблюден ия |
15 |
Коэффи циенты |
Станда ртная ошибка |
t-статист ика |
P-Значение |
Нижние 95% |
Верхние 95% |
|
У - пересечен ие |
933,5390 596 |
652,3852 90 |
1,4309627 6 |
0,176038 |
-475,853 |
2342,932 |
Х2 площадь квартиры, кв.м. |
107,6931 698 |
9,556040 83 |
11,269643 1 |
4,42E-08 |
87,04859 |
128,3377 |
Из полученной таблицы извлекаем коэффициенты и составляем уравнение модели: У=933,539+107,693*Х2. Коэффициент регрессии а2 =107,693, следовательно, при увеличении жилой площади квартиры на 1 кв.м. стоимость квартиры в среднем увеличивается на 107,693 тыс.руб. Свободный член а0 = 933,539 не имеет реального смысла.
Аналогичные расчеты проводим для остальных факторов. Составляем уравнение модели для Х 1 : У=2699,518+2692,835*Х 1 . Коэффициент регрессии
<7 1 =2692,835, следовательно, при увеличении на 1 комнату в квартире в среднем на 2692,835 тыс.руб. увеличивается цена квартиры. Свободный член а0 = 2699, 518 не имеет реального смысла.
Уравнение модели для Х3: Y=6941,142+65,763*Х3 . Коэффициент регрессии а3 =65,763, следовательно, при увеличении этажа, на котором расположена квартира, на 1 единицу, стоимость квартиры в среднем увеличивается на 65,763 тыс. руб. Свободный а0 = 6941, 142 не имеет реального смысла.
Уравнение модели для Х4 : Y=7060+1585,625*Х4. Коэффициент регрессии а4 =1585,625, следовательно, стоимость квартиры в ЖК «Новокосино» при идентичности всех остальных параметров в целом на 1585, 625 тыс. руб. выше, чем стоимость квартиры в Мкр. «Новокосино-2». Свободный член а0 = 7060 не имеет реального смысла.
Выбор лучшей модели с помощью оценки качества каждой модели через коэффициент детерминации и F-критерий Фишера
Коэффициенты детерминации R-квадрат определены для каждой модели программой Регрессия (таблица «Регрессионная статистика») и составляют:
Модель |
R-квадрат |
Y=2699,518+2692,835*Х 1 |
0,881 |
Y=933,539+107,693*Х 2 |
0,907 |
Y=6941,142+65,763*Х 3 |
0,047 |
Y= 7060 + 1585, 625*Х 4 |
0,104 |
Таким образом, вариация цены квартиры Y на 88,1% объясняется по уравнению (1) изменением количества комнат Х 1 ; на 90,7% по уравнению (2)изменением жилой площади квартиры Х 2 ; на 4,7% по уравнению (3) изменением этажа, на котором располагается квартира Х3 ; на 10,4% по уравнению (4) различной удаленностью от метро Х4 .
Модель |
F-критерий |
Y =2699,518+2692,835* Х 1 |
96,05975656 |
Y =933,539+107,693*Х 2 |
127,0048559 |
Y =6941,142+65,763*Х 3 |
0,637783943 |
Y = 7060 + 1585, 625*Х 4 |
1,513469781 |
С помощью функции FРАСПОБР найдем значение Fкр. = 4,667 для уровня значимости ос = 5%, и чисел степеней свободы k1 = 1, k2 = 13.
F = 96,06 > Fкр. = 4,667; F = 127,005 > Fкр. = 4,667, следовательно уравнения модели являются значимыми, их использование целесообразно, зависимая переменная Y достаточно хорошо описывается включенной в модель (1) факторной переменной Х 1 и включенной в модель (2) факторной переменной Х 2 . F = 0,63 8 < Fкр. = 4,667; F = 1, 513 < Fкр. = 4,667, следовательно уравнения модели (3) и (4) не являются значимыми и их использование нецелесообразно.
На основании оценки качества моделей по коэффициенту детерминации и критерию Фишера наилучшей является модель (2) зависимости цены квартиры от ее жилой площади.
Прогнозирование среднего значения показателя У c помощью выбранной модели
В качестве примера рассмотрим следующую задачу: с использованием лучшей модели осуществить прогнозирование среднего значения показателя Y при уровне значимости а = 0,1, если прогнозное значение фактора Х составит 90% от его максимального значения.
Согласно условию прогнозное значение фактора Х 2 составляет 90% от его максимального значения. Максимальное значение Х 2 = 96,4 найдем с помощью функции МАКС. Тогда прогнозное значение Х 2 * = 86,78. Рассчитаем по уравнению модели (2) прогнозное значение Y *:
Y * = 933,54 + 107,7* Х 2 * = 933,54 + 107,7*86,78 = 10 277
Таким образом, если жилая площадь квартиры составит 90% от ее максимального значения, то ожидаемая цена квартиры будет составлять около 10 277 тыс. руб.
Зададим доверительную вероятность p = 1 - а = 1 -0,1 = 0,9 и построим доверительный прогнозный интервал для среднего значения Y.
Рассчитаем стандартную ошибку прогнозирования для среднего значения
* 2
результирующего признака: S(Y *) = S(E) *
1 ( x - x )
[2], где S(E) -
\ n Уд(x - x)
стандартная ошибка, S(E) = 801,82. Среднее значение Х 2 найдем с помощью функции CРЗНАЧ = 64,74, а также посчитаем среднеквадратическое отклонение (функция КВАДРОТКЛ) = 7040,38. t кр. = 1,770933 для уровня значимости а = 10% и числа степеней свободы k=13. Тогда S (Y *) = 295,330204. Размах доверительного интервала для среднего значения U(Y *) = S (Y *) * t кр. = 523,0101.Таким образом, границами прогнозного интервала будут:
U нижн. = Y* - U(Y*) = 9753,99; U верх.= Y* + U(Y *) = 10800,01.
Таким образом, с надежностью 90% можно утверждать, что если жилая площадь квартиры составляет 90% от ее максимального значения и составит 86,78 кв. м., то ожидаемая средняя цена будет от 9753,99 тыс. руб. до 10800, 01 тыс. руб.
Используя пошаговую множественную регрессию, построим модель формирования цены квартиры за счет значимых факторов. Так как ранее было получено, что значимыми являются факторы Х 1 и Х2, то данная двухфакторная модель будет иметь вид: Y = 1421,24 + 999,45 • Х 1 + 70,31 • Х2. А четырехфакторная модель выглядит следующим образом: Y = 2401,85 + 1692,09 • Х 1 + 38,81 • Х2 + 10,70 • Х3 - 937,264 • Х4 .
Выберем лучшую из моделей. Для сравнения моделей с различным количеством учтенных в них факторов используем нормированные коэффициенты детерминации, которые содержатся в строке «нормированный R-квадрат» итогов программы Регрессия. Чем больше величина нормированного коэффициента детерминации, тем лучше модель. Модель Нормированный
R-квадрат
Y = 933,54 + 107,7 * X2 0,900003
Y = 1421,24 + 999,45 • X1 + 70,31 • X2 0,905725
Y = 2401,85 + 1692,09 • X1 + 38,81 • X2 + 10,70 • X3 0,929541
-937,264^X4
Таким образом, лучшей является четырехфакторная модель. Однако значения нормированного коэффициента R-квадрат близки, поэтому допустимо использование и остальных из вышеприведенных моделей для прогнозирования.
В итоге анализ эконометрической модели показал, что на формирование стоимости квартиры в г. Реутове наибольшее влияние оказывают количество комнат в квартире и ее площадь. Было доказано, что эти факторы являются значимыми. Проверка осуществлялась при помощи коэффициентов корреляции, детерминации и F-критерия Фишера. Для оценки значимости использовалась t-cтатистика Стьюдента. Также был приведен пример составления прогноза по модели. И данная модель может быть использована заинтересованными лицами для прогнозирования стоимости желаемой квартиры.
Список литературы Эконометрическое моделирование стоимости квартир в г. Реутове
- Бакушева Г.В. Основы эконометрики: решение задач шаг за шагом [Текст]: учебное пособие / Г. В. Бакушева. - Йошкар-Ола: Стринг, 2013. - 413 с.
- Бывшев В.А. Эконометрика: учеб. пособие / В.А. Бывшев. - М.: Финансы и статистика, 2008. - 480 с.
- Шалабанов А.К., Роганов Д.А. Практикум по эконометрике с применением MS EXCEL. Казань: Академия управления «ТИСБИ», 2008. - 53 с.
- Супермаркет недвижимости [Электронный ресурс]: Режим доступа: [17.12.2015] http://novostroyki.ndv.ru/kvartiry-v-novostrojkah-podmoskovie
- Что влияет на стоимость квартиры? [Электронный ресурс]: Режим доступа: [17.12.2015] http://domamira.su/chto-vliyaet-na-stoimost-kvartiry/.