Состоятельность статистических оценок терстоуна-мостеллера
Автор: Бугаев Ю.В., Никитин Б.Е., Шурупова И.Ю., Бабаян М.К.
Журнал: Вестник Воронежского государственного университета инженерных технологий @vestnik-vsuet
Рубрика: Информационные технологии, моделирование и управление
Статья в выпуске: 1 (63), 2015 года.
Бесплатный доступ
Традиционная методика анализа процедур коллективного выбора подразумевает три различных подхода: проверка оператора голосования на соответствие характеристическим условиям, исследование свойств функции выбора, анализ манипулируемости (оценка устойчивости процедуры голосования по отношению к негативным воздействиям со стороны избирателей или организатора - манипулирования). Коллективом сотрудников кафедры ИТМиУ ВГУИТ предложен и реализуется четвертый подход - исследование вероятностных характеристик (величины смещения математического ожидания оценки полезности конкретной альтернативы от ее истинного значения, среднеквадратичное отклонение оценки полезности альтернативы от ее истинного значения, вероятность правильного ранжирования альтернатив на выходе процедуры и т.д.) результатов выполнения процедур. В предлагаемой работе анализируется состоятельность оценок полезностей сравниваемых альтернатив, полученных посредством известной процедуры Терстоуна-Мостеллера и её обобщения, созданного авторами работы. В общем, под состоятельностью статистической оценки понимается уменьшающаяся до нуля погрешность оценивания при увеличении объёма выборки. Однако в зависимости от толкований понятия «погрешность» в науке выделяют следующие основные виды состоятельности: слабая состоятельность, опирающаяся на понятие сходимости случайной величины по вероятности; сильная состоятельность, опирающаяся на понятие сходимости с вероятностью к единице; состоятельность в среднем квадратичном. Дисперсия такой оценки стремится к нулю. В данной статье приводится доказательство теоремы, согласно которой при допущениях достаточно общего характера оценки полезностей ранжируемых альтернатив, полученных с помощью процедуры Терстоуна-Мостеллера, состоятельны в среднем квадратичном смысле. При этом из состоятельности в среднем квадратичном следует обычная, т.е. слабая состоятельность оценок полезностей альтернатив исходной выборки.
Альтернатива, коллективный выбор, процедура терстоуна-мостеллера, состоятельность оценок полезностей
Короткий адрес: https://sciup.org/14040392
IDR: 14040392
Текст научной статьи Состоятельность статистических оценок терстоуна-мостеллера
Из-за большого количества существующих процедур коллективного выбора остро стоит проблема их сравнительного анализа и разработки рекомендаций по использованию в конкретных ситуациях на практике. Традиционная методика анализа подразумевает три различных подхода к этому вопросу: проверка оператора голосования на соответствие характеристическим условиям; исследование свойств функции выбора; анализ манипулируемости.
Коллективом сотрудников кафедры ИТМиУ ВГУИТ предложен и реализуется четвертый подход [3] - исследование вероятностных характеристик результатов выполнения процедур. В данном случае исследуется состоятельность оценок полезностей сравниваемых альтернатив, полученных посредством известной процедуры Терстоуна-Мостеллера и её обобщения, созданного авторами работы.
Напомним, что неформально под состоятельностью статистической оценки понимается уменьшающаяся до нуля погрешность оценивания при увеличении объёма выборки. Исходя из различных толкований понятия «погрешность», получают различные виды состоятельности. Наиболее часто встречаются следующие её виды:
-
1. Просто состоятельность или слабая состоятельность . Она опирается на понятие сходимости случайной величины по вероятности. Формально: P {| ап - а | > е } ^ 0 при n ^ да для любого е > 0 .
-
2. Сильная состоятельность . Она опирается на понятие сходимости с вероятностью к 1. Формально: P { lim ап = а } = 1.
-
3. Состоятельность в среднем квадратичном . Дисперсия такой оценки стремится к нулю.
n ^да
Формально: M [( ап - а )2] ^ 0 при n ^ да .
Многомерная статистика an состоятельно оценивает многомерный параметр а в каком-либо смысле 1-3, если соответствующая состоятельность имеет место для каждой координаты а i либо по некоторой норме || - ||.
Чаще всего используют слабую состоятельность, однако легче всего доказать состоятельность в среднем квадратичном. Тогда слабая состоятельность будет следовать из неравенства Чебышева:
P {| a n - а | > е } < M [( a n 2а ) 2 ] е 2
•
Имеют место следующие связи между различными видами состоятельности:
-
1. Состоятельность в среднем квадратичном и сильная состоятельность влекут слабую состоятельность.
-
2. Если нет дополнительной информации, нельзя доказать, что сильная состоятельность влечёт состоятельность в среднем квадратичном или наоборот.
Что же касается процедуры Терстоуна-Мостеллера, то в традиционном виде [1, 5] она представляет собой частный случай линейной модели парных сравнений, в рамках которой эксперту предъявляются пары альтернатив ( A, , A j ) из исходного предъявления, состоящего из m вариантов (1 < i < j < m ), и он для каждой пары должен определить лучшую, по его мнению, альтернативу: либо A i ^ A j , либо A j ^ A i . Предполагается, что каждая альтернатива A i , i =1,..., m , обладает «истинной полезностью» Vi , а эксперт способен дать лишь некоторую её оценку yt , которая, вообще говоря, отличается от Vt и принимается за случайную величину. Таким образом, по мнению эксперта, A i превосходит A j ( A i ^ A j ) в том случае, если y i > y j , ( i , j =1,., m ). Также предполагается, что вероятность предпочтения Р ( A i ^ A j ) = n j = P ( y i - y j > 0) зависит от численного значения разности у, - y j . Набор П у , ( i , j =1,., m ) удовлетворяет линейной модели, если существует набор действительных чисел V i , ( i , j =1 ,., m ), таких, что п ij = Н ( V i - V j ), где Н ( x ) - симметричная относительно нуля функция распределения непрерывной случайной величины, монотонно возрастающая от Н (- да) = 0 до Н (+ да) = 1 и Н (- x ) = 1 - Н ( x ).
В процедуре Терстоуна-Мостеллера делается допущение, что экспертная оценка полезности i -ой альтернативы имеет нормальное распределение y i ~ N ( V i , a2).
Метод поиска оценок для полезностей V i ( i = 1, m ), предложенный Ноезе, использует дополнительное условие Г К = 0 и состоит в i = 1
следующем:
-
1) определяются экспериментальные вероятности парных предпочтений по следующей формуле:
а^J pj = N где aij - число случаев, когда эксперт предпочел:
A i ^ A j , « у + а j = N ( i , j = 1, m , i * j ).
-
2) значения вероятностей py = 0 и py = 1 заменяются py = 1/(2 n ) и py = 1 — 1/(2 n ) соответственно и вычисляются:
dij = H—1(ру ), где H'(pij) - функция, обратная функции нормального распределения.
-
3) по методу наименьших ква дратов производится минимизация по V i , ( i = 1, m ) величины:
s= е [dj— (V—v >] при условии, что i * j
раметр распределения экспертных оценок полезностей альтернатив равен 0 n .
Сформулируем теорему.
Если:
1 ° существует конечное истинное значение параметра распределения экспертных оценок 0° ,
2° система необходимых условий экстремума функции (2) замкнута в окрестности 0°, то оценка 0n состоятельна в среднем квадратичном при N ^ ю, т.е. выполняется соотношение:
m
Е V = 0.
i = 1
Авторами настоящей работы разработано обобщение традиционной процедуры Терстоуна-Мостеллера на случай использования экспертами для сравнения альтернатив
M ( ^N — 0 o ) 2 ^ 0 при N ^ ю .
Для доказательства нам понадобятся два известных соотношения.
1) Для любых вещественных а и b справедливо неравенство :
( a + b ) 2 < 2 a 2 + 2 b 2.
более сильной шкалы, чем порядковая
–
лингвистической шкалы [4], применение которой позволяет значительно повысить точность статистических оценок полезностей. Тогда система предпочтений экспертов представляется системой неравенств вида:
2) Для любой случайной величины ^ справедливо соотношение [2] :
§ > 0 ^ M [ £ ] > 0.
Cw > 0,
где w - вектор полезностей альтернатив выборки, C - структурная матрица экспертного ранжирования - прямоугольная матрица, содержащая m столбцов. Вид матрицы C определяется использованной шкалой; например, при линейном упорядочении выборки A i ^ A 2b-> Am матрица имеет вид:
Доказательство теоремы.
Обозначим P i ( 0 ) - теоретическая вероятность выполнения i -го соотношения между полезностями альтернатив, вычисленная при произвольном значении параметра 0 . Устремим N -^-ю. Согласно известной теореме Бернулли [2], если проводится N независимых испытаний, в каждом из которых случайное событие А происходит с вероятностью p , то относительная частота появления события А при N ^ ю сходится по вероятности к р . То есть:
C =
— 1
—
I 0
1 .... 0
•
V5 > 0 lim P
N -^ю
m ( A )
N
—
p >5L =0,
....
( 0
В процессе
....
— 1 J
экспертного ранжирования
N экспертами обучающей выборки каждый эксперт должен ответить утвердительно или отрицательно на вопрос о выполнении каждого неравенства из системы (1). По результатам ранжирования определяются экспериментальные вероятности предпочтений по следующей формуле: q; = n^ , где n - число случаев, когда эксперты проголосовали за выполнение i -го неравенства, i = 1, 2, .„, s . Далее из условия минимума суммы:
где m ( A ) - число наступлений события А . В данном случае мы имеем дело с совокупностью случайных событий, каждое из которых означает выполнение i -го соотношения между полезностями альтернатив. К каждому из них теорема Бернулли применима. Следовательно:
V 5 > 0 lim P 1 —
N ^ю
N
—
P(^ ) > 5 > = 0,
иными словами, все оценки — слабо состоятель-,N ны. Кроме того, согласно известным формулам:
M
m ( A )
Е [ P1 ( 9 n ) — Q i ] 2
i = 1
вычисляется 0 n - статистическая оценка параметра 0 . Здесь P i ( 0 n ) - теоретическая вероятность выполнения i -го неравенства, если па-
M
m ( A )
N
—
P 12
L N J
Р (1 — Р )
N
= p ;
> 0 при N ^ ю
n оценки q, = — состоятельны также в среднем квадратичном. Преобразуем сумму:
Q n = 1 [ P 0 n ) - P0 ) ] 2 (5)
i = 1
и применим неравенство (3) к каждому её слагаемому:
Qn = I [p 0 ) — P-(0 )]2=
I = 1
I [ ( P i (0 N ) - q j+ q - - P i (0 ° ) ) ] 2 < i = 1
-
< 2 E [ P i ( 0 N ) - q - ] 2 + 2 Z P( 0 ° ) — q - ] 2 .
Поскольку оценка 0 n определяется из условия минимума суммы (2), то при любом наборе реализаций случайных величин q i справедливо неравенство:
l[P(0N)-q-]2
Отсюда по (4):
M I P ( 0 n ) - q - J 2 < M I P ( 0 ° ) - q - ] .
Следовательно:
M [ Q n ] < 4 M M P(0 ) - q - ] 2 .
Далее, в силу состоятельности ni , для N любого 8 > 0 и i можно подобрать номер Ni (8), при котором неравенство:
M I P ( 0 °)
x 2 n - I
N J
s
<---
4 • s
Список литературы Состоятельность статистических оценок терстоуна-мостеллера
- Тюрин Ю.Ю., Френкель Д.А. Статистические методы анализа экспертных оценок. М.: Наука, 1977. 384 с.
- Королюк В.С., Портенко Н.И., Скороход А.В. Справочник по теории вероятностей и математической статистике. М.: Наука, 1985. 640 с.
- Бугаев Ю.В., Миронова М.С., Никитин Б.Е. Вероятностный метод анализа процедур построения коллективных экспертных оценок//Вестник ВГУ. Серия «Системный анализ и информационные технологии». 2011. №2. С. 130 -135.
- Бугаев Ю.В., Миронова М.С., Никитин Б.Е., Чайковский А.С. Система поддержки принятия решений на основе экстраполяции экспертных оценок методом максимального правдоподобия//Вестник БГТУ. Брянск. 2010. №1. С. 84-90.
- Thurstone L.L. A law of comparative judgment//Psychol. Rev. 1927. V. 34. P. 273 -286.