Декомпозиция ценообразующих факторов на основе статистического анализа экспертных оценок их значимости
Автор: Алексеева И.Е., Мезин Е.А., Алексеев А.О.
Рубрика: Управление в социально-экономических системах
Статья в выпуске: 3 т.25, 2025 года.
Бесплатный доступ
Исследуется задача массовой оценки рыночной стоимости. Применительно к развитым рынкам многочисленные исследования демонстрируют эффективность выделения среди всех показателей, описывающих объект оценки, факторов, которые используются для решения задачи классификации объектов, а оставшиеся ценообразующие факторы используются для решения задачи регрессии – вычисления наиболее вероятной цены. Несмотря на эффективность такого многомодельного подхода, отсутствуют общепринятые методы разделения характеризующих факторов на классифицирующие и ценообразующие. Целью исследования является научное обоснование эффективности декомпозиции факторов на классифицирующие и ценообразующие путем статистического анализа экспертных оценок значимости характеризующих факторов. В настоящей работе проверяется гипотеза, что факторы с высоким рангом значимости, определенным по средней, медиане или моде, и большой дисперсией (большим коэффициентом вариации) оценок экспертов следует относить к классифицирующим, а факторы с высокой значимостью и малой дисперсией – ценообразующим. Материалы и методы. В качестве объектов оценки рассматриваются легковые транспортные средства. База данных транспортных средств, использованная для разработки моделей массовой оценки, включала три миллиона записей. Для определения влияния различных параметров транспортных средств на их цену проведен опрос 18 экспертов – профессиональных участников рынка. Средняя, медиана и мода использовались для ранжирования значимости факторов, а дисперсия и коэффициент вариации использовались для декомпозиции факторов. Построены различные модели массовой оценки как с помощью различных методов регрессионного анализа и машинного обучения (градиентный бустинг, случайный лес, искусственные нейронные сети), так и с учетом разделения ценообразующих факторов и без разделения. Результаты. Модели, построенные с учетом разделения ценообразующих факторов, показали увеличение коэффициента детерминации (R²) в среднем на 5–7 % по сравнению с моделями, использующими все признаки в едином наборе. Заключение. Предлагаемый подход к массовой оценке может быть адаптирован для других типов объектов. При этом подход, основанный на статистическом анализе экспертных оценок значимости ценообразующих факторов, носит универсальный характер. Это определяет практическую значимость, поскольку применительно к различным предметным областям оценщикам и аналитикам приходится тратить значительные ресурсы (временные, вычислительные, человеческие, финансовые) на построение адекватных моделей массовой оценки рыночной стоимости.
Массовая оценка, рыночная стоимость, характеризующие факторы, классифицирующие факторы, ценообразующие факторы, экспертные оценки, статистический анализ, машинное обучение, транспортные средства
Короткий адрес: https://sciup.org/147251614
IDR: 147251614 | DOI: 10.14529/ctcr250305
Текст научной статьи Декомпозиция ценообразующих факторов на основе статистического анализа экспертных оценок их значимости
I.E. Alekseeva, , Е.А. Mezin, , Alekseev, ,
Наиболее изученной сферой применения методов массовой оценки рыночной стоимости является жилая недвижимость. Общепризнанной в отечественной профессиональной среде методологией анализа рынка недвижимости является методология дискретно-пространственного параметрического моделирования (ДПММ), разработанная Г.М. Стерником и С.Г. Стерником [1]. Согласно ДПММ, выделяются различные кластеры недвижимости, представляющие собой однородные группы объектов, например, выделенные по качеству, местоположению, размерам [2] и другим параметрам. Эти группы формируются для статистического анализа и моделирования отдельных кластеров недвижимости. Именно поэтому аналитики рынка недвижимости и профессиональные оценщики разрабатывают экономико-математические модели внутри каждого кластера отдельно, в результате чего получается не одна общая модель, а комплекс моделей.
Иностранные исследователи, например, М. Чен, Ё. Чун и Д.А. Грифиц [3], также отмечают целесообразность кластеризации объектов оценки, называя их «субрынками». Так, в [3] выполнили пространственную кластеризацию объектов недвижимости и для каждого кластера построили отдельную модель массовой оценки. С. Сисман и А.Ч. Айдиноглу в [4] продемонстрировали преимущества такого подхода. В их исследовании массовая оценка жилья выполнялась с разбивкой данных на 5 кластеров по географическому положению и социально-экономическим характеристикам районов. Результаты исследования [4] показали, что модели множественной регрессии по кластерам показали себя значительно точнее, чем единая модель по всей выборке.
Таким образом, при массовой оценке рыночной стоимости целесообразно группировать объекты оценки так, чтобы часть ценообразующих факторов принимала одинаковые значения (эти факторы определяют группу, синонимы: кластер, класс), а часть факторов отличалась (эти факторы определяют влияние характеристик на цену объекта внутри группы). Далее первые характеризующие факторы будем называть классифицирующими, вторые – истинно ценообразующими, еще их допустимо называть регрессорами. При таком подходе важным является декомпозиция ценообразующих факторов на классифицирующие и истинно ценообразующие. Несмотря на применение схожих идей в разных сферах, единого подхода к разделению ценообразующих факторов на эти группы нет, поэтому, как правило, выделение истинно ценообразующих факторов осуществляется экспертно.
Вопросы анализа информации, получаемой в процессе экспертной оценки объектов, рассматривают О.Н. Коростелева, Г.В. Савинов в [5]. Так, в [5] описывается статистический подход к обработке количественных экспертных оценок, позволяющий не только определить итоговую оценку, но и оценить ее достоверность. Особое внимание уделяется выявлению случаев расхождения мнений среди экспертов и методам количественной оценки таких отклонений. При этом авторы делают вывод о необходимости исследования отклонений, но рекомендации сводятся к оценке уровня профессиональной подготовки экспертов и их замене или к уточнению параметров оцениваемых объектов [5].
Особенности обработки экспертных мнений, в том числе при оценке рыночной стоимости, исследовались в работах Т.В. Дивиной, Е.А. Петраковой, М.С. Вишневского [6], В.А. Бакланова, Э.Я. Семенцовой, А.П. Чумаченко [7], В.Л. Шабека, А.А. Косовских, А.Ф. Зубрицкого, Д.Л. Кор-жицкого, Д.А. Шалагина [8].
Нельзя не отметить, что обработка экспертных суждений нашла широкое применение в оценке различных видов недвижимого имущества, прежде всего благодаря работам Л.А. Лейфера, Т.В. Крайниковой [9, 10]. Мнения профессиональных участников рынка недвижимости (агенты недвижимости, брокеры недвижимости, оценщики, аналитики рынка) о размерах корректировок цены объектов-аналогов ложатся в основу издаваемых Приволжским центром методического и информационного обеспечения оценки справочников оценщика, например, [11].
Помимо научных и аналитических работ существуют нормативные рекомендации, указанные в законе об оценочной деятельности и федеральных стандартах оценки [12–14].
В указанных выше трудах и нормативных актах изложены различные подходы к анализу экспертных суждений и способах их вынесения, при этом, как уже отмечалось выше, методов определения классифицирующих и ценообразующих признаков нет.
Целью настоящей статьи является научное обоснование метода декомпозиции ценообразующих факторов на классифицирующие и истинно ценообразующие, основанного на статистическом анализе экспертных оценок их значимости.
Данные и методы
В настоящей работе рассматривается задача массовой оценки рыночной стоимости легковых транспортных средств. В ходе исследования предложено выписать пользовательские характеристики легковых автомобилей и определить степень их значимости для оценки на основании экспертных опросов.
Под легковым автомобилем в настоящем исследовании понимается транспортное средство заводского массового производства, предназначенное для перевозки пассажиров и небольших грузов на дорогах общего пользования. Основные характеристики, соответствующие легковым автомобилям, приведены в табл. 1.
Таблица 1
Параметры легковых транспортных средств
Table 1
Parameters of passenger vehicles
№ |
Название характеристики |
Описание характеристики |
1 |
Марка производителя |
Наименование завода, осуществившего, как правило, проектирование и выпуск легкового автомобиля |
2 |
Модель |
Принадлежность легкового автомобиля к определенному проекту (классу), разработанному производителем |
3 |
Год изготовления |
Год завершения производства автомобиля, может не совпадать с годом его поставки в продажу |
4 |
Модификация модели |
Различные производители могут со временем менять внешний вид, характеристики транспортного средства, двигатель и техническое наполнение в рамках одного наименования модели |
5 |
Комплектация |
Совокупность установленных функциональных и(или) визуальных дополнений конкретного автомобиля |
6 |
Цвет автомобиля |
Любая палитра, соответствующая цветовой политике производителя |
7 |
Состояние автомобиля |
Битый, восстановленный, без существенных скрытых повреждений, без существенных внешних повреждений, с нормальным износом относительно года выпуска, с нормальным износом относительно пробега, новый |
8 |
Пробег |
Количество километров, которые преодолело транспортное средство за весь срок его эксплуатации |
9 |
Количество собственников |
Количество владельцев, отраженных в паспорте транспортного средства, которые могли распоряжаться транспортным средством |
10 |
Объем багажника |
Обычно измеряется в литрах и характеризует грузовую вместимость |
11 |
Вместимость |
Легковой автомобиль может перевозить от 2 до 7 пассажиров |
12 |
Грузоподъемность |
Обычно измеряется в килограммах полезной нагрузки |
13 |
Тип топлива |
Бензин, дизель, газ, гибрид, электричество |
14 |
Расход топлива |
Литров на 100 км |
15 |
Запас хода |
Количество километров, которые может преодолеть транспортное средство с учетом обычных условий эксплуатации |
16 |
Тип кузова автомобиля |
Седан, универсал, купе, пикап, лифтбек, внедорожник и т. д. |
17 |
Тип привода |
Передний, задний, полный |
18 |
Тип трансмиссии |
Автоматическая, роботизированная, механическая, на базе вариатора |
19 |
Объем двигателя |
В России общепринято, что измеряется в кубических сантиметрах в большинстве случаев варьирует от 800 до 4000 куб. см |
20 |
Мощность |
Измеряется в КВт, но общепринятая мера измерения – лошадиные силы, которые обычно варьируют от 60 до 300 л.с. |
21 |
Крутящий момент |
Диапазон показателей прилагаемой силы к прокручиванию коленчатого вала, обычно измеряется в Нм |
22 |
Максимальная скорость |
Предельное значение, которое может развивать легковой автомобиль, обычно входит в диапазон от 120 до 200 км/ч |
23 |
Время разгона до 100 км/ч |
Динамика среднего автомобиля эквивалентна диапазону 6–12 с |
24 |
Габаритные размеры |
Длина, ширина и высота легкового автомобиля могут варьироваться в зависимости от модели, но обычно они имеют длину от 3,5 до 5 м, ширину – от 1,5 до 2 м и высоту – от 1 до 1,5 м |
25 |
Экологические характеристики |
В зависимости от типа топлива и мощности двигателя легковой автомобиль может иметь различные уровни выбросов загрязняющих веществ |
26 |
Личность продавца |
Сам собственник, продавший автомобиль |
Комбинации перечисленных выше характеристик влияют на представление покупателя о том, привлекателен к покупке автомобиль или нет.
При этом на формирование цены влияют не только качественные и визуальные характеристики автомобиля, но и внешние условия, к которым можно отнести: государство (регион) продажи автомобиля и связанные с ним нормативные правила, устанавливающие таможенные пошлины, режимы налогообложения; наличие возможности технического обслуживания автомобиля в конкретном регионе и наличие поставок запасных частей; продвижение брендов, реклама, отзывы владельцев в рамках отдельных территорий, которые создают представление потенциальных покупателей о привлекательности конкретного экземпляра транспортного средства; регион производства транспортного средства и связанные с восприятием этого региона представления о престижности и(или) надежности автомобиля; распространенность автомобиля в конкретном регионе; региональный рынок продажи транспортных средств, который показывает величину спроса и предложения в конкретный момент времени; тенденция развития региональной экономики: снижение или рост реальных доходов населения, показатели инфляции; общая динамика цен в отрасли продажи автомобилей: среднее удорожание или удешевление отдельных, нескольких или всех групп легковых транспортных средств с течением времени; культурные особенности взаимодействия людей, проживающих на определенной территории, их готовность изменять продажную цену, согласовывать условия сделки; сезонность: время года, в которое происходит локальное смещение баланса спроса и предложения; наличие кратковременных шоковых экономических ситуаций, которые могут повлечь пиковое изменение баланса спроса и предложения, как то: резкую приостановку продаж, ажиотажный спрос, отсутствие предложений. В связи с поставленной задачей на оценку легковых автомобилей массового производства на локальном рынке Российской Федерации были сделаны некоторые допущения. Приведем некоторые из них. Авторы исследования считают, что на оговоренной территории достаточным образом развит информационный обмен между участниками гражданского оборота, имеется равный доступ к информации, а конъюнктура рынка по легковым автомобилям массового производства сложена оптимальным способом (имеется и спрос, и предложение без сильного дисбаланса). К рассмотрению не будут приниматься марки и модели легковых транспортных средств, не распространенных в Российской Федерации (так, например, популярная в Индии марка «Тата» не представлена на российском рынке и не может служить объектом автоматизированной оценки ввиду отсутствия спроса на данную марку). Тенденции изменения баланса спроса и предложения отслеживаются по имеющимся на рынке предложениям: общее количество предложений и ежемесячная динамика цен по категориям и в целом по рынку предложений.
С учетом указанных допущений было предложено сконцентрировать внимание только на внутренних факторах транспортного средства, а внешнюю среду считать единой для всего рынка. Динамика цен предложений по когортам автомобилей будет указывать на смещение всего сегмента и должна повлиять не только на продавцов, но и на покупателей транспортных средств.
Модель
Для ранжирования значимости факторов с точки зрения их влияния на цену автомобиля было предложено провести исследование в формате опросов экспертов. Все оговоренные выше характеристики транспортного средства были предложены в виде несортированного списка экспертам. Респондентам в персональных опросах было предложено оценить значимость каждой характеристики с точки зрения ее влияния на цену автомобиля по десятибалльной шкале, где «0 баллов» – оценка, соответствующая тому, что характеристика абсолютно не имеет значимости для оценки, «10 баллов» – характеристика имеет максимальное влияние на оценку транспортного средства покупателем и продавцом.
Далее по каждой характеристике были рассчитаны статистические показатели экспертных суждений: среднее значение, медианное значение, мода, дисперсия и среднее квадратичное отклонение.
Одной из задач было определение согласованности мнений экспертов, высказанной по каждой характеристике. Для определения согласованности была использована методика, предложенная А.М. Гри-ганом в монографии [15]. Согласно методике необходимо рассчитать среднее квадратичное отклонение оценок экспертов, после чего определить коэффициент вариации. Согласованными мнениями считались оценки экспертов, по которым коэффициент вариации не превышал значения 0,4 [15].
Полученные результаты
В результате проведенных расчетов получена таблица ранжированных критериев, которые должны включаться в базовую модель оценки транспортных средств (табл. 2).
Таблица 2
Значимость критериев оценки и согласованность экспертных суждений
Table 2
Significance of evaluation criteria and consistency of expert judgments
Характеристика |
Среднее квадратичное отклонение |
Коэффициент вариации |
Мода |
Медиана |
Среднее арифметическое |
Год изготовления |
0,5549 |
0,0772537 |
10,00 |
10,00 |
9,64 |
Пробег |
0,8846 |
0,0990042 |
10,00 |
10,00 |
9,50 |
Состояние автомобиля |
0,8791 |
0,0994440 |
10,00 |
10,00 |
9,43 |
Марка производителя |
19,2088 |
0,6391559 |
10,00 |
10,00 |
6,86 |
Модель |
18,4176 |
0,6530652 |
10,00 |
10,00 |
6,57 |
Тип трансмиссии |
1,2088 |
0,1202524 |
10,00 |
9,50 |
9,14 |
Модификация модели |
13,4780 |
0,4803495 |
10,00 |
9,50 |
7,64 |
Комплектация |
0,6429 |
0,0976085 |
9,00 |
8,00 |
8,21 |
Мощность |
1,3242 |
0,1564097 |
8,00 |
8,00 |
7,36 |
Тип привода |
1,1484 |
0,1515410 |
8,00 |
7,50 |
7,07 |
Объем двигателя |
1,4121 |
0,1647167 |
7,00 |
7,00 |
7,21 |
Количество собственников |
1,5385 |
0,1771925 |
7,00 |
7,00 |
7,00 |
Цвет автомобиля |
0,6868 |
0,1196122 |
6,00 |
7,00 |
6,93 |
Тип топлива |
1,8736 |
0,2202674 |
5,00 |
6,50 |
6,21 |
Тип кузова автомобиля |
5,3022 |
0,3883988 |
7,00 |
6,50 |
5,93 |
Расход топлива |
3,1923 |
0,3248551 |
5,00 |
5,00 |
5,50 |
Крутящий момент |
7,2088 |
0,6480839 |
5,00 |
5,00 |
4,14 |
Вместимость |
4,7473 |
0,7625867 |
5,00 |
3,00 |
2,86 |
Максимальная скорость |
10,4011 |
0,9606602 |
0,00 |
2,50 |
3,36 |
Время разгона до 100 км/ч |
10,5549 |
0,9677388 |
0,00 |
2,50 |
3,36 |
Запас хода |
6,7692 |
0,8672582 |
6,00 |
2,50 |
3,00 |
Грузоподъемность |
3,5659 |
0,8528114 |
0,00 |
2,50 |
2,21 |
Габаритные размеры |
5,8736 |
1,0945094 |
0,00 |
1,50 |
2,21 |
Объем багажника |
2,7253 |
1,0505349 |
0,00 |
1,00 |
1,57 |
Экологические характеристики |
1,7857 |
0,9846467 |
1,00 |
1,00 |
1,36 |
Поскольку эксперты давали оценку в дискретных значениях, при анализе их оценок дополнительно рассматривались такие статические меры, как мода и медиана. Сортировка табл. 2 выполнена по медианным значениям.
При высокой значимости факторов наибольшее внимание привлекают факторы марки, модели и модификации транспортного средства, поскольку по ним эксперты дали значительные отклонения в оценке. Дополнительные опросы показали, что эксперты, поставившие наименьшее значение указанным факторам, поясняли, что указанные параметры не участвуют в оценке конкретного транспортного средства, а именно по указанным критериям производится отбор аналогов, с которыми сопоставляются при сравнительном анализе цен, другие эксперты указали, что оценка конкретного автомобиля производится, исходя из их начального группового отбора и типизации, поэтому они присваивали данным факторам максимальное значение.
Для построения моделей оценки и их сопоставления по точности было проведено дополнительное исследование в части построения различных моделей нейросетевых алгоритмов по полной выборке значимых параметров либо с предварительной кластеризацией экземпляров оценки по классифицирующим параметрам. Оценку точности моделей производили на основе показателя коэффициента детерминации (R2), значения которого представлены в табл. 3 .
Таблица 3
Результаты моделей массовой оценки на основе показателя коэффициента детерминации
Table 3
Results of Mass Valuation Models based on the Coefficient of Determination
Предсказание по абсолютному отклонению от среднего |
Предсказание по процентному отклонению от среднего |
|||
Все характеристики |
С учетом классификации |
Все характеристики |
С учетом классификации |
|
Линейная регрессия |
0,757 |
0,907 |
0,866 |
0,938 |
Множественная линейная регрессия |
0,823 |
0,937 |
0,891 |
0,944 |
Случайный лес |
0,883 |
0,944 |
0,924 |
0,949 |
Полносвязная нейронная сеть |
0,921 |
0,945 |
0,934 |
0,941 |
Бустинг |
0,941 |
0,950 |
0,948 |
0,954 |
CatBoost |
0,945 |
0,952 |
0,950 |
0,954 |
Как видно из приведенной табл. 3, любая из предложенных моделей представляла наиболее значимые результаты при сегментации выборки на основе классифицирующих параметров: марка производителя, модель, модификация модели. При этом выделение в том числе модификации модели в классифицирующий признак давало существенный прирост точности рассматриваемых алгоритмов.

Алгоритм определения значимых классифицирующих и ценообразующих параметров объектов массовой оценки
Algorithm for Identifying Significant Classifying and Price-forming Parameters of Mass Apprical Objects
В современных научных работах прослеживается тенденция уделять внимание однородности объектов при оценке. Разделение в настоящем исследовании факторов на классифицирующие и характеризующие получило практическое подтверждение улучшения точности всех исследованных моделей, начиная от линейной регрессии и заканчивая методологией CatBost.
Сегментация объектов оценки по ключевым признакам позволяет учесть структурные различия и повысить качество оценки. Методологически важно обосновать выбор таких признаков – через экспертные рейтинги значимости и согласованности мнений либо через их статистический анализ и отбор.
Концептуально предложенный в настоящей работе метод декомпозиции ценнобразующих факторов на классифицирующие и характеризующие приведен в виде блок-схемы, выполненной в нотации BPMN (см. рисунок).
Приведенный в статье метод оценивает роль человеческого фактора, при котором рассогласованность суждений не является ошибкой, а является проявлением экспертности, что выражается в увеличении коэффициента вариации при сохранении высокой значимости факторов оценки.
Заключение
Из данного исследования можно сделать следующие выводы.
-
1. Оптимальным для использования можно считать фактор с медианным значением больше 5, что говорит о том, что большинство экспертов считают его значимым для использования в оценке автомобиля.
-
2. Для отбора ценообразующих факторов экземпляра оценки предлагается выбрать все значимые критерии, по которым коэффициент вариации менее или равен 0,4, что говорит об удовлетворительной согласованности экспертных мнений относительно критериев оценки легкового автомобиля.
-
3. Если значимость фактора выше среднего и при этом наблюдается неудовлетворительная согласованность экспертов относительно критерия оценки (коэффициент вариации больше 0,4), то фактор можно считать классифицирующим, а не ценообразующим.
Таким образом, разработан гибридный метод декомпозиции ценообразующих факторов, отличающийся от известных тем, что в случае высокого значения медианы рангов и их значительной дисперсии такой признак следует относить к классифицирующей категории, в противном случае признак можно считать регрессором.
Такой подход позволяет построить комплекс математических моделей (в том числе ансамбль нейронных сетей), точность которых превосходит общую модель, в которой все признаки учтены в комплексе.
Альтернативные подходы и мнения
Не все исследования однозначно поддерживают необходимость и перспективность кластеризации объектов оценки. Отмечается, что эффект сегментации зависит от природы данных и метода моделирования. В [16] Е. Аленани, Л.А. Лехам и С. Лу указывают, что ими был реализован интегрированный подход кластеризации с последующей регрессией по локации, результаты получились смешанными: для одного кластера точность прогноза слегка улучшилась, а для другого – даже ухудшилась по сравнению с общей моделью. Авторы отмечают, что такие причины, как перегруппировка данных или недостаточный размер выборки в отдельных кластерах, могли нивелировать выигрыш от сегментации. Это предупреждает, что неправильная или чрезмерная сегментация может снизить точность (например, когда группы получаются слишком мелкими или неустойчивыми).
В [17] В.Л. Ясницкий, Л.Н. Ясницкий указывают на целесообразность оценки не только на основании рыночных факторов, присущих объекту массового оценивания, но и на основании внешнеэкономических факторов: курсы валют, значение ВВП, объем строительства в регионе.
В [18] предпринята попытка построить комплексную нейросетевую модель для оценки рыночной стоимости не только в масштабах локального рынка, но и в масштабах всех крупнейших городов России.
Действительно, современные методы машинного обучения способны во многом учесть нелинейности и взаимодействия признаков без явного разделения на группы. Например, градиентные бустинги и случайные леса автоматически выявляют важные разветвления по категориальным признакам (условно выполняя роль сегментации внутри модели).