Прогнозирование при малой выборке

Автор: Тюлькина Н.В., Корнеева А.П., Селиверстова А.В.

Журнал: Теория и практика современной науки @modern-j

Рубрика: Математика, информатика и инженерия

Статья в выпуске: 12 (42), 2018 года.

Бесплатный доступ

В данной статье рассматривается выборочное наблюдение для обработки малого числа наблюдений, объясняется понятие предельной ошибки выборки, разбирается прогнозирование при малой выборке и морфологический анализ, анализируется проблема прогнозирования при малой выборке.

Малая выборка, ошибка, анализ, наблюдение, прогнозирование

Короткий адрес: https://sciup.org/140272769

IDR: 140272769

Текст научной статьи Прогнозирование при малой выборке

Задача прогнозирования по выборке появляется в случае если присутствуют данные по нескольким объектам, подобным объекту прогнозирования по близким свойствам, и на базе этой информации нужно спрогнозировать состояние искомого объекта прогнозирования. Вторая версия – имеется информация о состоянии объекта прогнозирования ранее и нужно на их базе спрогнозировать его состояние в перспективе. В первом случае говорят, что имеются перекрестные данные, во втором – временные.

Прогнозирование случайных процессов – основной компонент трудоёмкой задачи описания изменения характеристик динамических процессов, происходящих в системах всевозможных направлений экономики, техники, медицины, социологии, военного дела и т.д.). Сейчас общеизвестны более ста всевозможных способов построения прогнозирующих моделей.

Выборочное наблюдение

Задача создания ранее не известных статистических методов, направленных на обработку малого числа наблюдений, была обусловлена невозможностью использования классических методов математической статистики, которые не подходят для обрабатывания выборок такого объема.

Выборочное наблюдение – ключевой вид из множества способов прерывистого наблюдения. Выборочным наблюдением называют заблаговременно учреждённое количество единиц совокупности, выделенных в определённом порядке. Выборочный метод исследования подразумевает получение обобщающих характеристик исследуемой совокупности по исследованной ее части. Подлежащая изучению совокупность является генеральной совокупностью, а отобранные ее элементы называется выборочной совокупностью.

Выборочный метод дает возможность при малом количестве исследуемых единиц извлечь объективные данные из всей исследуемой совокупности. Это тем более важно в нынешних условиях, когда сплошные наблюдения дорогостоящи и не всегда результативны. Теория и опыт продемонстрировали, что при верном способе организации выборочного наблюдения можно подчерпнуть достоверную информацию о исследуемой совокупности. Эта информация достаточно точно отражает всю совокупность. Выборочные наблюдения практикуются во всех разновидностях социальной и экономической деятельности.

Для более детального исследования выборочного способа будем использовать определенные условные обозначения:

N – величина генеральной совокупности – количество входящих в нее единиц;

n - размер выборочной совокупности – количество единиц, оказавшихся в выборке;

генеральная средняя – средняя величина изучаемого признака в генеральной совокупности;

выборочная средняя – средняя величина изучаемого признака в выборочной совокупности;

р - генеральная доля – часть единиц, заключающих в себе данный

данный

признак генеральной совокупности;

w - выборочная доля – часть единиц, заключающих в себе признак выборочной совокупности; ™ = ~, где m

-

число

единиц,

обладающих исследуемым признаком, n

размер выборочной

совокупности;

а2 - генеральная дисперсия - дисперсия изучаемого

генеральной совокупности;

признака

в

о 0 - выборочная дисперсия - дисперсия

выборочной совокупности;

исследуемого

признака

в

а - среднее квадратическое отклонение генеральной совокупности;

исследуемого

признака

в

а0 - среднее квадратическое отклонение выборочной совокупности.

исследуемого

признака

в

Предельная ошибка выборки

Средняя ошибка выборки употребляется для нахождения вероятных отклонений характеристик выборочной совокупности от соответствующих характеристик генеральной совокупности.

С некоторой вероятностью возможно установить, что эти отклонения не превзойдут данной величины А - предельной ошибки выборки, Этот показатель можно найти по формуле: А = t • р, где t - коэффициент, обуславливаемый вероятностью, с которой возможно гарантировать некоторые объемы предельной ошибки; этот коэффициент является коэффициентом доверия . Он находится по таблице значений интегральной функции Лапласа при данной доверительной вероятности.

Таблица 1

Часто употребляемые уровни вероятности и соответствующие значения t

ЛО

0,6

83

0,9

50

0,9

54

0,9

90

0,997

t

1,0

0

1,9

6

2,0

0

2,5

8

3,00

С увеличением t размер вероятности Г^П стремится к единице. Повышая число выборки n , возможно отклонение выборочной средней от генеральной ( х j: ) уменьшить до сколь угодно небольших размеров.

Малая выборка – это несплошное статистическое наблюдение, и при нем выборочная совокупность формируется из относительно малого числа единиц генеральной совокупности. Обычно размер малой выборки не превосходит 30 единиц, а минимальный размер может доходить до пяти единиц. В некоторых вариантах малой может быть названа выборка до 45 единиц. Малая выборка широко используется в экономических изысканиях и при организации наблюдения качества товаров и услуг.

Прогнозирование при малой выборке. Морфологический анализ

Морфологический анализ — средство прогнозирования, осуществленное при помощи матрицы характеристик объекта прогнозирования и их вероятных значений с дальнейшим перебором и оценкой вариаций комбинаций рассматриваемых значений.

Морфологический метод соединен со структурными связями между объектами, явлениями и положениями. Один из его базисных аспектов — всеобщность, т. е. применение всесторонних знаний об объекте; из-за акцента на всетсторонность знаний важнейшим условием для морфологического анализа считается неимение какого-либо пристрастного заблаговременного суждения.

Метод дозволяет дать ответ на следующие задачи: какие средства нужны для извлечения всех данных об исследуемой совокупности явлений; какова цепь абсолютно всех явлений, случающихся по некоторой 6

причине; как изучить все средства этого класса или полностью исследовать методы данного класса, все ответы на вопрос решения исходной конкретной задачи.

Метод был изобретен швейцарцем Ф.Цвикки и учитывает разделение задачи на компоненты, каждый из которых, являясь в некоторой степени самостоятельным, подвергается кропотливому изучению. Такой подход содержит некоторые этапы:

  • 1.    Четкое формулирование проблемы, которую нужно решить.

  • 2.    Точный анализ абсолютно всех параметров P i (i = 1 , .„, n), значимых с точки зрения решения исходной задачи.

  • 3.    Разработка «морфологического ящика», потенциально включающего все решения. Если данная задача целиком решена, то любое отделение данного «ящика» будет заключать в себе только одно единственное решение или в целом не будет его иметь. Возникновение двух или более решений в единственном отделении показывает, что не все параметры были предусмотрены или добавлены в систему. «Морфологический ящик» создаётся в виде матрицы, чьи элементы имеют свойства

  • 4.    Исследование всех полученных решений со стороны их функциональной ценности. Для изучения вводится шкала оценок. Данный момент является самой непростой частью морфологического анализа. Не существует всепригодной формулы, которая определяет функциональную ценность разных решений.

  • 5.    В заключительном этапе происходит выбор определённых решений и их последующая реализация.

параметров:

[ P 1 1, P 1 2, …, P 1 k 1]

[ P 2 1, P 2 2, …, P 2 k 1]

K

[ P n 1, P n2 , …, P n k1].

Последовательное соединение одного параметра начального уровня с одним из параметров следующих уровней — это одно из возможных решений проблемы. Общее количество решений — это произведение числа всех параметров, показанных в «ящике», которые взяты по строкам. Реальное число решений будет немного меньше, т.к. некоторые из решений практически невозможно осуществить.

В результате работы рассматриваемого метода формируется новая информация о рассматриваемом объекте, а также вырабатывается оценка вероятных альтернатив для каждого компонента проблемы. Цель его — выработка самого подходящего решения, основанного на рассмотрении каждого варианта решения. Достоинство рассматриваемого подхода: его можно осуществить при малом количестве информации по изучаемой проблеме. Для оценки решений возможно применять самые общие критерии.

Матричный    подход    считается    нормативным    методом прогнозирования. В нём ставятся конечные цели, а во время прогнозирования выясняются пути и средства их достижения. Прогностическая роль матричного подхода состоит в оценке влияния разных вариантов происходящих сдвигов на выполнение конечных целей объекта прогноза. Прогнозная информация создаётся за счет того, что комплексы факторов включают в себя альтернативные решения проблем, в том числе и те, что пребывают на различных стадиях разработок.

Для того, чтобы снизить до возможного минимума ошибку прогноза, комплексы факторов должны включать   большее   количество альтернативных решений проблемы.

Рассмотрим последовательность применения матричного метода:

  • 1.    Идентификация факторов, которые влияют на достижение поставленных целей.

  • 2.    Выделение однородных комплексов факторов через группировку данных факторов по стилю их влияния.

  • 3.    Создание матриц влияния комплексов факторов друг на друга и на достижение целей.

  • 4.    Определение влияния факторов на достижение комплекса целей через выполнение операций над матрицами влияний, таких как умножение, сложение, вычитание, в соответствии со схемой направления влияний одних факторов на другие (графом влияний), определение относительных весов факторов и ранжирование их.

Исходной информацией для прогнозирования по матричному методу с использованием экспертных оценок являются:

  • -    перечень целей объекта прогнозирования и коэффициенты их относительной важности;

  • -    перечень факторов, влияющих на достижение целей объекта прогноза, сгруппированных в однородные комплексы;

  • -    коэффициенты (баллы) матриц, определяющих влияние одного комплекса факторов на другой или на достижение целей;

  • -    показатели относительной самооценки компетентности экспертов, принимавших участие в работе по прогнозированию развития объекта;

  • -    данные о группах, участвовавших в работе экспертов, необходимые для определения компетентности экспертов.

Перейдём к Таблице 2, в которой рассмотрим сферу деятельности морфологического анализа, его назначение, а также некоторые характерные черты применения данного метода.

Таблица 2

Морфологический анализ

Область применения  Решаемые задачи

Особенности применения

При малом объема    Прогнозирование

Структурные взаимные связи

информации о       вероятного

между объектами, а также

проблеме, изучаем    исхода

явлениями и концепциями.

для получения       фундаментальных

Всесторонность подразумевает

систематизированной исследований при

применение полной

информации по всем  открытии новых

совокупности знаний об

возможным         рынков,

объекте. Важным требованием

вариантам ее         формировании

является абсолютное

решения.            новых

отсутствие предварительных

потребностей.

мнений. Морфологический анализ включает в себя несколько этапов:

  • а.    формулировка проблемы;

  • б.    анализ параметров;

в. создание «морфологического ящика», что включает все решения.

Проблема прогнозирования при малой выборке

  • 1.    Прогнозирование при малой выборке имеет больший диапазон возможных отклонений, чем прогнозирование при большей выборке (большем количестве измерений).

  • 2.    Можно использовать только простые модели алгоритмов.

  • 3.    Нет возможности найти ошибку в вычисленным смысле прогноза, т.к.

  • 3.1.    математическое ожидание (МО)

  • 3.2.    среднеквадратичное отклонение (СКО)

  • 4.    К недостаткам метода морфологического анализа относятся сложность и трудоемкость выполняемого анализа.

неизвестно его подлинное значение. Но присутствует следующая вероятность: ошибка вычисленного прогноза может превысит некоторую величину/максимальную ошибку прогноза, ожидаемую с установленной вероятностью:

HDz — ПП

МО «---------, где Dz — действительное значение

п

rKR_ ^(Dz — nr)2 ll\D — ------------- п — 1

Заключение

В данной статье было рассмотрено выборочное наблюдение для обработки малого числа наблюдений, объяснено понятие предельной ошибки выборки, разобрано прогнозирование при малой выборке и морфологический анализ и проанализирована проблема прогнозирования при малой выборке.

Список литературы Прогнозирование при малой выборке

  • Anastasiya V. Seliverstova, Darya A. Pavlova, Slavik A. Tonoyan and Yuriy E. Gapanyuk The Time Series Forecasting of the Company's Electric Power Consumption // Advances in Neural Computation, Machine Learning, and Cognitive Research II. The Time Series Forecasting of the Company's Electric Power Consumption. 2018. Springer Nature Switzerland AG
  • Тоноян С.А., Селиверстова А.В., Терехов В.И. Основные показатели метода группового учета аргументов для построения оптимальной модели. Аллея науки. 2017.- Т. 3, № 15.- С. 631 - 638
  • Cеливерстова А.В., Колесникова К.И., Гарина И.О., Варламов О.О. Система поддержки принятия решения повышения энергоэффективности предприятия. Сборник тезисов докладов: Всероссийская студенческая конференция «Студенческая научная весна-2018»;
  • Селиверстова А.В. Сравнительный анализ моделей и методов прогнозирования // Современные научные исследования и инновации. 2016. № 11.
Статья научная