Использование платформы визуальной разработки сценариев для моделирования процессов рынка недвижимости

Автор: Егорова Д.К., Денисов Р.В.

Журнал: Огарёв-online @ogarev-online

Рубрика: Технические науки

Статья в выпуске: 1 т.13, 2025 года.

Бесплатный доступ

Введение. Рынок недвижимости - ключевой сектор экономики с высокой динамикой цен, зависимостью от макроэкономических факторов и сложностью прогнозирования. Традиционные методы анализа требуют много времени и ресурсов, что ограничивает их применение. Использование low-code платформ позволяет сократить затраты на разработку моделей и сделать инструменты анализа доступными для специалистов без углубленных навыков программирования. Цель исследования - продемонстрировать использование KNIME для прогнозирования стоимости объектов недвижимости и их классификации; оценить, насколько точны модели и насколько они полезны на практике.

Еще

Регрессия, методы снижения размерности, метод главных компонент, кластеризация

Короткий адрес: https://sciup.org/147250604

IDR: 147250604   |   DOI: 10.15507/2311-2468.013.202501.053-063

Текст научной статьи Использование платформы визуальной разработки сценариев для моделирования процессов рынка недвижимости

Оригинальная статья / Original article

EDN:

В настоящее время анализ данных и моделирование процессов играют ключевую роль в принятии эффективных решений. Рынок недвижимости не является исключением. Его сложность и высокая волатильность требуют применения определенных инструментов и методов для понимания динамики и прогнозирования будущих тенденций.

Весьма актуальным здесь является использование инструментария low-code, позволяющего сократить время разработки моделей для специалистов без глубоких навыков программирования. В частности, «процесс анализа следует “собирать” из своего рода узлов-nodes, в которых используются библиотеки Python, R, JavaScript» [1].

Примером такого инструмента является аналитическая платформа визуальной разработки сценариев KNIME1, которая может использоваться для моделирования процессов рынка недвижимости – извлечения данных, построения модели прогнозирования цен на

  • 1    KNIME Analytics Platform [Электронный ресурс]. URL: https://www.knime.com (дата обращения: 01.02.2025).

54 Технические науки недвижимость, кластеризации объектов недвижимости по нескольким параметрам, визуализации результатов.

Цель исследования – продемонстрировать применение KNIME для прогнозирования цен и кластеризации объектов недвижимости, оценив точность моделей и их практическое использование.

ОБЗОР ЛИТЕРАТУРЫ

В данном направлении проведено множество исследований. Например, предложен подход к определению стоимости объектов недвижимости на основе метода бинарного кодирования качественных характеристик объекта недвижимости, выполнен кластерный анализ определения схожих по характеристикам объектов, построена регрессионная модель стоимости объекта недвижимости [2]. В. Н. Деркаченко построена модель краткосрочного прогноза средней цены одного квадратного метра жилья [3].

Для анализа рынка недвижимости М. А. Зуев использовал метод кластеризации k-means, чтобы найти оптимальное число кластеров в рамках решения задачи для одного мегаполиса [4]. На основе исследования эластичности цен на жилье по доходам и типизации рынков Г. М. Стерник построил линейные модели прогнозирования цен на жилье при наличии прогнозов динамики душевых доходов населения [5].

В работах2 [6; 7] приведен обзор и сравнительный анализ инструментария Data Mining, таких как Weka, RapidMiner, TANAGRA, Orange, Deductor, WizWhy KNIME и т. д. Рассмотрены принципы работы данных инструментов, представлены основные критерии для их сравнения.

Средствами KNIME реализована кластеризация однородных районов в рамках крупных территориальных образований, которая может быть использована при организации обоснованного государственного финансирования развития территорий [8].

При этом потенциал KNIME для задач кластеризации и прогнозирования в контексте региональных рынков недвижимости изучен недостаточно, что определяет научную новизну исследования.

МАТЕРИАЛЫ И МЕТОДЫ

В данном исследовании для моделирования процессов на рынке недвижимости использовалась аналитическая платформа визуальной разработки сценариев KNIME.

Для анализа рынка недвижимости в г. Саранске использованы данные, собранные с крупнейшего в России ресурса объявлений о продаже и аренде жилой, загородной и коммерческой недвижимости – сервиса ЦИАН. Сбор данных осуществлялся средствами Python библиотеки Cianparser3. В результате получены данные о 1 530 объектах недвижимости, включая квартиры, которые были выставлены на продажу на платформе по состоянию на 1 июня 2024 г. Признаки объектов недвижимости, используемые в анализе, представлены на рисунке 1.

floor

Num—

floor...

Numbs...

room...

Number...

totaL...^

Number..

price

Number (i-

district

Siring

street

String

hou....

String

latit... v

String

longitude

String

4

6

1

28

2300000

Ленинский

Попова

74Б

54.1732...

45.12248

3

5

1

32.5

2400000

Пролетар...

Семашко

9

54.2288...

45.12918

5

10

1

39.9

4650000

Ленинский

Кирова

31

54.1740...

45.17840

3

5

1

27.7

2550000

Ленинский

Республика...

48

54.1722...

45.17531

5

10

1

46.5

6550000

Ленинский

Московская

34

54.1760...

45.18656

8

10

1

39.1

4990000

Ленинский

Гагарина

92

54.1770...

45.15365

Р и с. 1. Признаки, получаемые в ходе сбора данных F i g. 1. Features obtained during data collection

Источник: составлен авторами на основе данных сервиса ЦИАН. Sources: compiled by the authors based on data from the CIAN service.

Для определения географических координат объектов недвижимости использован API сайта openstreetmap.org 4. Из 1 530 собранных объявлений координаты удалось извлечь для 1 455 объектов.

Моделирование в KNIME Analytics Platform . На рисунках 2, 3 представлены рабочие процессы KNIME, осуществляющие прогноз цен на недвижимость по заданным параметрам с помощью линейной и полиномиальной регрессии.

Независимыми переменными, в силу отсутствия попарной корреляции и большей практической значимости, здесь выбраны этаж, общее количество этажей здания, количество комнат, площадь. Зависимой переменной – цена. На рисунках 3, 4 приведены оценки моделей, на основании которых можно сделать вывод об удовлетворительном результате моделирования.

Numeric Scorer

График по цене и площади

ООО

'ООО

Нормализация

ООО

Загрузка данных

Разделение тестовые - 30% и обучающие - 70%

Статистическая оценка регрессии

График по цене и площади

Scatter Plot (JavaScript) Узел прогнозирования

ООО

Р и с. 2. Процесс моделирования линейной регрессии F i g. 2. The linear regression modeling process

Источник: рисунки 2–7, 9–13 составлены авторами.

Sources: figures 2–7, 9–13 are compiled by the authors.

Polynomial Regression Learner

Scatter Plot (JavaScript)

Р и с. 3. Процесс моделирования полиномиальной регрессии F i g. 3. Polynomial regression modeling process

#

RowID

Prediction (price)

Number (double)

#

RowID

Prediction (price)

Number (double)

7

RA2

0.776

1

RA2

0.755

2

mean absolute error

0.046

2

mean absolute error

0.047

3

mean squared error

0 005

3

mean squared error

0.005

4

root mean squared error

0.068

4

root mean squared error

0.069

Р и с. 4. Оценки линейной регрессии Р и с. 5. Оценки полимерной регрессии F i g. 4. Linear regression estimates F i g. 5. Polynomial regression estimates

РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ

В рабочий процесс KNIME импортирован узел Table Creator, который позволяет вводить параметры объекта (независимые переменные) и получать прогноз, чтобы использовать полученные модели для прогнозирования цен. Конфигурация узла содержит столбцы, тип данных, названия которых совпадают с параметрами объекта недвижимости (рис. 6).

Для тестирования работоспособности модели вводились данные реальных объектов, затем результаты сравнивались. Например, при вводе данных объекта, расположенного по адресу г. о. Саранск, ул. Веселовского, д. 26, цена по объявлению на сервисе ЦИАН составляла 3 500 000 руб., а прогнозируемая цена по полиномиальной регрессии 3 616 320 677 руб., что, с некоторой погрешностью, соответствует рыночным ожиданиям (рис. 7).

Кроме этого, сравнивался подобный функционал прогнозирования цен на недвижимость известных сервисов. Например, сервис «Яндекс.Недвижимость» возможности прогнозирования цен не представляет, а оценка вышеупомянутой квартиры на сервисе ЦИАН совпала с данными моделирования в KNIME (рис. 8).

Р и с. 6. Конфигурация узла Table Creator F i g. 6. Table Creator node configuration

  • # RowID ^oor v floors_count rooms_count totaLmeters v district            Prediction (price)

Number (double)         Number (integer)       Number (double)       Number (double)        String                    Number (double)

7 RowO 2                5               2               44.1             Пролетарский     3,616,320.877

Р и с. 7. Работа узла Table Creator

F i g. 7. Operation of the Table Creator node

Оценка этой квартиры от Циан                   Смотреть полный отчет

Поможет покупателю поторговаться, а продавцу — продать квартиру выгоднее и быстрее

  • 3,6 млн      3,5 млн Хорошая цена

Оценка Циан О Цена в объявлении

Изменение цены                                                             Неделя Месяц | Пол года

3,7 _______________—--““Оценка Циан: 3,6 млн ₽

  • 3 5                                                                    _________Цена в объявлении: 3,5 млн ₽

  • 3,3 п-----------------------------------------------1-----------------------------------------------1--------------------------------------------1-----------------------------------------------1----------------------------------------------1-------

  • дек. 23               янв. 24               фев. 24             март 24              апр. 24              май 24

Р и с. 8. Сервис оценки невидимости ЦИАН

F i g. 8. CIAN invisibility assessment service

Источник: сервис ЦИАН.

Sources: CIAN service.

Методы снижения размерности и кластеризации данных . Визуализация данных также является весьма эффективной при анализе рынка недвижимости. Визуализацию можно выполнить последовательно, применив один из методов снижения размерности признакового пространства, а затем выполнив кластеризацию. Данные методы реализованы в KNIME.

Рабочий процесс визуализации данных недвижимости представлен на рисунке 9. После чтения и нормализации данных был применен метод главных компонент, а затем проведена кластеризация методом k- средних. Количество кластеров ( k = 3) получено путем применения метода силуэтов (рис. 10).

Р и с. 9. Рабочий процесс визуализации данных F i g. 9. Data visualization workflow

#

RowID

Mean Silhouette Coefficient

Number (double)

7

cluster_2

0.397

2

cluster.!

0.189

3

cluster.O

0.412

4

Overall

0.367

Р и с. 10. Оценка кластеризации методом силуэтов

F i g. 10. Evaluation of clustering using the silhouette method

Р и с. 11. Кластеры на карте openstreetmap

F i g. 11. Clusters on the openstreetmap

В ходе анализа результатов визуализации выявлено, что, например, квартиры в районах Светотехстрой и Юго-Запад чаще объединяются в один кластер в пределах одного жилого массива (несколько домов находящихся рядом, образующих «колодец», в непосредственной близости от школы, детского сада, магазина). Кластеры района Светотех-строй представлены на рисунке 12, кластеры района Юго-Запад – на рисунке 13. Результаты кластеризации коррелируют с визуальной оценкой интерьера квартир из разных кластеров.

Р и с. 12. Кластеры района Светотехстрой F i g. 12. Clusters of the Svetotechstroy district

Р и с. 13. Кластеры района Юго-Запад

F i g. 13. Clusters of the South-West district

ОБСУЖДЕНИЕ И ЗАКЛЮЧЕНИЕ

Одним из основных преимуществ использования KNIME Analytics Platform является то, что это low-code инструмент, который позволяет пользователю минимизировать программный код, осуществляя построение моделей с помощью визуальных интерфейсов и готовых модулей. Именно low-code подход позволяет быстро создавать и изменять модели рынка недвижимости и может быть интересен специалистам, объектом исследования которых является рынок недвижимости.

В данной статье продемонстрировано применение KNIME Analytics Platform для моделирования процессов рынка недвижимости; построены рабочие процессы, реализующие линейную и полиномиальную модели регрессии прогноза цены объекта недвижимости по нескольким параметрам; проведено сравнение работы построенных моделей с данными сервисов ЦИАН и «Яндекс.Недвижимость»; выполнена визуализация кластерного анализа объектов недвижимости на карте OpenStreetMap.

Однако следует отметить, что проведенное исследование имеет определенные ограничения. Во-первых, не были учтены макроэкономические факторы, такие как инфляция и ставки кредитования, которые могут существенно влиять на рынок недвижимости. Во-вторых, данные были ограничены одним городом и конкретным периодом, что актуализирует необходимость дальнейших исследований для более полного и всестороннего анализа рынка недвижимости.

Список литературы Использование платформы визуальной разработки сценариев для моделирования процессов рынка недвижимости

  • Егорова Д. К., Заварюхина Ю. В. Применение инструментария KNIME Analytics Platform для анализа соответствия рабочих программ учебных дисциплин требованиям работодателей // Огарев-online. 2023. Т. 11, № 16. URL: https://cyberleninka.ru/article/n/primenenie-instrumentariya-knime-analytics-platform-dlya-analiza-sootvetstviya-rabochih-programm-uchebnyh-distsiplin-trebovaniyam (дата обращения: 20.02.2025). EDN: VGKMUC
  • Прогнозирование стоимости объектов недвижимости на основе комплексного анализа их свойств / О. В. Савина [и др.] // Прикаспийский журнал: управление и высокие технологии. 2019. № 4. С. 60-70. DOI: 10.21672/2074-1707.2019.48.4.060-070 EDN: CVOZEW
  • Деркаченко В. Н. Прогнозирование и кластерный анализ развития регионального рынка жилой недвижимости // Научно-методический электронный журнал "Концепт". 2014. T. 20. С. 11-15. URL: http://e-koncept.ru/2014/54262.htm (дата обращения: 20.02.2025).
  • Зуев М. А., Шибаев В. М., Баланев К. С. Разработка модели K-Means для выявления наиболее выгодных предложений на рынке недвижимости Москвы // Информатика. Экономика. Управление. 2024. Т. 3, № 2. С. 212-218. DOI: 10.47813/2782-5280-2024-3-2-0212-0218 EDN: ELAMMI
  • Стерник Г. М. Методика прогнозирования цен на жилье в зависимости от типа рынка // Имущественные отношения в Российской Федерации. 2011. № 1. С. 43-47. EDN: NCCIRR
  • Омарова Ш. Е., Медеубаева А. М. Сравнительный анализ инструментов Data Mining // Заметки ученого. 2020. № 11. С. 185-193. EDN: QYUTBN
  • Пальмов С. В., Диязитдинова А. А., Артюшкина Е. С. Сравнительный анализ возможностей интеллектуальных систем при выявлении скрытых закономерностей в данных // Электросвязь. 2020. № 2. С. 52-58. DOI: 10.34832/ELSV.2020.3.2.008 EDN: NNSBEV
  • Разработка подхода к кластеризации районов на базе инструментального средства машинного обучения KNIME / Е. М. Смирнова [и др.] // Известия высших учебных заведений. Серия "Экономика, финансы и управление производством" [Ивэкофин]. 2021. № 4. С. 165-175. URL: https://ecofin-isuct.ru/article/view/4079 (дата обращения: 20.02.2025). EDN: EDDOKW
Еще
Статья научная