Приближение оценки QN параметра масштаба с помощью быстрых М-оценок

Автор: Смирнов Павел Олегович, Шевляков Георгий Леонидович

Журнал: Сибирский аэрокосмический журнал @vestnik-sibsau

Рубрика: Кибернетика, системный анализ, приложения

Статья в выпуске: 5 (31), 2010 года.

Бесплатный доступ

Рассмотрены популярные робастные оценки параметра масштаба, обладающие высокой эффективностью, в частности оценка QN Предложено параметрическое семейство M-оценок, обеспечивающих более быстрые вычисления с допустимым снижением пороговой точки. Приведены результаты статистического моделирования.

Робастность, m-оценки, параметр масштаба

Короткий адрес: https://sciup.org/148176362

IDR: 148176362

Текст научной статьи Приближение оценки QN параметра масштаба с помощью быстрых М-оценок

Один из подходов к оптимизации и принятию решений в условиях неопределенности вероятностных моделей сигналов и помех связан с использованием робастных статистических методов, обеспечивающих устойчивость и надежность результатов статистического анализа к возможным отклонениям от принятых гипотез о распределениях [1]. В свою очередь задачи робастного оценивания параметра масштаба распределений занимают второе по значению место после задач робастного оценивания параметра положения распределений [2]. В данной статье предлагаются быстрые высокоэффективные и робастные оценки параметра масштаба симметричных распределений.

Оценкой масштаба называется любая положительная статистика S n , которая удовлетворяет равенству S n ( ax 1 , …, ax n ) = aS n ( x 1 , …, x n ) для a > 0 [2–4]. Такая оценка определяет степень разброса значений в выборке и может использоваться как в непараметрических задачах, так и для оценивания значений неизвестного параметра масштаба семейства распределений вероятности. Примером такого параметра может служить параметр σ нормального распределения с плотностью вероятности N (0, σ 2) = exp(– x 2/2 σ ) / (2 πσ 2)1/2, а возможной оценкой – стандартное отклонение SD .

Эта часто используемая оценка обладает серьезным недостатком: при небольших отклонениях от предполагаемой модели результат может оказаться далеким от истинного. Такими отклонениями могут быть загрязненные данные или ошибочные предположения о законе распределения генеральной совокупности. Классическая статистика рассматривает идеализированные условия, но, согласно [3], в статистических данных, как правило, встречается от 1 до 10 % больших ошибок, а некоторые ряды измерения после тщательной проверки не подтверждают принадлежность нормальному распределению, имея более тяжелые «хвосты».

Подобные отклонения от идеальной модели рассматриваются в робастной статистике. В зависимости от задачи в качестве робастных альтернатив для оценивания масштаба чаще всего используют межквартильный размах IQR = F–1(3/4) – F–1(1/4) или абсолютное медианное отклонение от медианы MAD = medi | xi – med x |. Одним из критериев робастности в данном случае служит пороговая точка оценки, т. е. наибольший процент наблюдений, который можно заменить произвольно большими значениями, оказав лишь ограниченное влияние на значение самой оценки [2]. По этому критерию абсолютное медианное отклонение является более предпочтительным, поскольку оно имеет максимально возможную пороговую точку 50 %. Пороговые точки стандартного отклонения и межквартильного размаха равны 0 и 25 % соответственно.

Стандартное отклонение SD имеет минимальную возможную дисперсию для нормального распределения. Робастные же оценки обладают более высокой пороговой точкой, как правило за счет большей дисперсии, т. е. меньшей точности. В этом случае эффективность оценки MAD равна всего 36,7 %, поэтому возникает необходимость построения более эффективных оценок с максимальной пороговой точкой.

В работе [5] были предложены такие оценки, одна из которых, а именно Q n , впоследствии стала часто использоваться на практике. Оценка Q определяется как первый квартиль расстояний между наблюдениями: Q = {| xi x j |} ( k ) , k = C ( h , 2), h = [ n /2] + 1, и имеет асимптотическую эффективность 82,3 % и пороговую точку 50 %. Серьезным недостатком является большая вычислительная сложность такой оценки, так как задействовано n 2 разностей между парами значений. Отметим, что даже более эффективный алгоритм [6] требует в 3–5 раз больше времени, чем MAD .

В данной статье используется параметрическое семейство оценок масштаба, имеющих такую же или большую эффективность за счет снижения пороговой точки, которая, тем не менее, остается в разумных пределах. Введенный параметр позволяет сохранить баланс между пороговой точкой и эффективностью в зависимости от решаемой задачи.

Постановка задачи. В теории робастности важным инструментом для анализа оценок является подход на основе функции влияния. Функция влияния IF ( x ; S , F ) оценки S на модельном распределении F показывает устойчивость оценки к большим ошибкам в точке x и определяется как ее производная по Гато [3]. Построим оценку масштаба с функцией влияния, совпадающей с IF ( x ; Q , F ), тем самым обеспечив совпадение выражающихся через нее характеристик, в частности асимптотической дисперсии и эффективности.

Рассмотрим класс M -оценок масштаба S , задаваемых неявным уравнением

∑ χ(xi / S) = 0, где х — некоторая оценочная функция, обычно четная и неубывающая при x > 0. Выбирая вид функции х, можно получать различные как робастные, так и неробастные оценки масштаба. Этот класс был введен Хьюбером и подробно рассмотрен в [2; 3].

Известно, что функция влияния таких оценок с точностью до нормирующего множителя совпадает с выбранной оценочной функцией IF ( x ; S , F) x х ( x ). Воспользуемся этим фактом и построим М -оценку масштаба M a , приближающую Q , положив

Ха ( x ) = c a a ' ( Ф ( x + a ) - Ф ( x - a )), a > 0,

в случае четной монотонно возрастающей при x > 0 функции х ( x ). Эти условия будут выполнены при [0; 2], причем при нуле достигается максимум s ^ = 29,3 % (рис. 2).

где Ф ( x ) - стандартное нормальное распределение; c a выбирается из условия состоятельности оценки J x ( x ) d ( x ) = 0. При a = Ф -1(5/8) 72 = 0,450 6 функ

ция влияния соответствующей оценки M a будет совпадать с IF ( x ; Q , Ф ) [5].

Основной результат. Для удобства будем рассматривать другое параметрическое семейство, взяв первые несколько членов разложения Ф ( x ) в ряд Тейлора:

Х а ( x ) = c a — 3 (6 — a 2 ( x 2 - 1)) ф ( x ), c a =

= (12 - a 2) / (12 77).

Рис. 1. Эффективность оценки в зависимости от параметра a

Такое представление позволит получить результат в явном виде через элементарные функции.

Из-за своей простоты также будет интересен частный случай при a = 0:

X a ( x ) = 1 / 7л - 2 ф ( x ).

Исследования показали, что не имеет смысла рассматривать разложение с большей точностью: выигрыш в характеристиках минимален, а объем вычислений возрастает. В качестве альтернативы можно взять функцию xa p ( x ) с произвольным полиномом второй степени от x 2, но в свете полученных результатов это также представляется избыточным.

Получим характеристики предложенной оценки. Формула для асимптотической дисперсии M -оценок масштаба выглядит следующим образом [3]:

Рис. 2. Пороговая точка оценки в зависимости от параметра a

Вычисление оценки как решения неявного уравнения в большинстве случаев затруднительно, но при этом возможно применение итеративных схем. В частности, можно ограничиться первой итерацией, получив так называемую M -оценку [2]:

V ( M a , Ф) = J IF 2 ( x ; M a , Ф) d Ф( x ) =

2 ( x ) ф ( x ) dx

( J xx' a ( x ) ф ( x ) dx )2,

ST = ST

Lx ( x / S ) d S EX ( x - / S )

S = S<0>

.

что дает выражение для эффективности

1 e„ =----------=

a 2 V ( M a ,Ф)

=________________ 81( 0 2-4) 2_________________

" 8(432(273 - 3) - 24(873 - 9) a 2 + (1673 - 9) a 4.

Максимальная достижимая эффективность составляет 95,9 %, но даже при a = 0 она не опускается ниже уровня 80,8 % (рис. 1).

Пороговая точка оценки определяется соотношением

а (0)    = 12(72 - 2) - (72 - 4) а 2

Х а И а (0)        4( « 2 - 6)

Начальное приближение должно быть само по себе в высшей степени робастно. Подставляя предложенную оценочную функцию, получаем, что одношаговая оценка при a = 0 задается как уточнение медианы абсолютных отклонений:

Mn = 1,483 MAD ■1 1 - Z 0 n /^2 0                    I           7

V        Z 2

r-7 X 1 k - u 2 /2

Z k L u - e i , u -

x i - med x

.

1,483 MAD

Множитель перед MAD необходим для того, чтобы обеспечить состоятельность оценки на нормальном распределении.

Следует отметить, что функция влияния, а значит асимптотическая дисперсия и эффективность одношаговой оценки, будут несколько отличаться от первоначальных теоретических результатов. Но важным свойством таких оценок является то, что они наследуют пороговую точку начального приближения [6]. При выборе в качестве основы медианы абсолютных отклонений пороговая точка одношаговой оценки M α повышается до 50 %.

Сравнение оценок. Приведем численные результаты статистического моделирования оценок при 50 000 испытаний на стандартном нормальном распределении (табл. 1). Параметр α имеет значение 0,450 6, что обеспечивает совпадение основных асимптотических характеристик оценок Mα и Q. Время вычисления оценок в миллисекундах соответствует конфигурации Intel Core i7 с частотой 2,8 ГГц. Влияние отклонений от идеальных условий проверялось на модели больших ошибок Тьюки вида (1 – ε) Φ(x) + ε Φ(x/σ) при ε = 0,1, σ = 3. Результаты моделирования представлены в табл. 2. Таким образом, предложена оценка масштаба, имеющая такую же функцию влияния, асимптотическую дисперсию и эффективность, что и часто используемая оценка Qn. Результаты моделирования показывают, что одношаговый алгоритм вычисления оценки не только требует значительно меньшего времени, но и обеспечивает меньшее смещение относительно оцениваемой величины, особенно на малых выборках. При подстановке медианы абсолютных отклонений в качестве начального приближения пороговая точка имеет максимально возможное значение 50 %, а свободный параметр позволяет повысить эффективность оценки до 95 %.

Статья научная