Метод проектирования в задаче вычисления параметров многофакторной регрессионной модели
Автор: Митасов Игорь Михайлович, Завьялкин Андрей Николаевич
Журнал: Сибирский аэрокосмический журнал @vestnik-sibsau
Рубрика: Математика, механика, информатика
Статья в выпуске: 2 (23), 2009 года.
Бесплатный доступ
Задача определения значений параметров многофакторной регрессионной модели обычно решается методом наименьших квадратов (НК) и сводится к решению системы линейных алгебраических уравнений. Эта система может быть вырожденной в силу зависимости векторов значений факторов. Вырожденность приводит к срыву вычислительного процесса. Предлагается метод определения параметров на основе проектирования вектора значений моделируемого показателя на линейное пространство независимых векторов значений факторов.
Метод, факторы, модель, выборка, проектирование
Короткий адрес: https://sciup.org/148175871
IDR: 148175871
Текст научной статьи Метод проектирования в задаче вычисления параметров многофакторной регрессионной модели
В задачах многофакторного регрессионного анализа обычно в рамках одной вычислительной процедуры рассматривается множество многофакторных регрессионных моделей, среди которых выбирается оптимальная в смысле некоторого критерия. При этом решается множество систем линейных алгебраических уравнений. Не- которые из этих систем имеют вырожденную матрицу, что приводит к срыву вычислительного процесса.
Необходимость решения систем уравнений с квадратной матрицей является следствием необходимого условия минимума целевой функции метода НК. Фундаментальная интерпретация метода НК состоит в том, что оп- тимальное решение представляет собой проекцию вектора значений моделируемого показателя на линейное пространство векторов значений факторов. Эта проек ция всегда существует и единственна, в отличие от решения системы линейных алгебраических уравнений.
В работе предлагается метод вычисления проекции на основе известного метода ортогонализации Грамма-Шмидта, который позволяет построить максимальное количество ортогональных векторов из заданной системы векторов значений факторов и вычислить проекцию вектора значений моделируемого показателя на линей- ное пространство полученных ортогональных векторов. Параметры модели вычисляются из решения системы линейных алгебраических уравнений с невырожденной матрицей.
Линейная многофакторная модель регрессионного анализа имеет следующий вид:
У = (A, X) + c , (1) где у - моделируемый скалярный показатель; A - вектор параметров модели; X- вектор факторов; c - скалярный параметр модели.
Построение модели (1) заключается в определении значений параметров A , c на основе выборки V следую-щего вида:
V = { у1, X; i = 1 m } , (2)
где m - количество наблюдений значений характеристик y , X .
В силу выражения (1) возникает следующая система уравнений, связывающая значения показателя у и факторов { x j ; j = 1, n } :
n
Y = 5 a j X j + cE , (3)
j = 1
где n - количество факторов; Y - вектор значений показателя у ; X - вектор значений j -го фактора; E - вектор с компонентами { е. = 1; I = 1, m} .
В системе (3) количество уравнений m >> n +1, система обычно не имеет решения и поэтому согласно методу НК, рассматривается следующая оптимизационная задача: „m (JU
5 ( A опт , c опт ) = min 5 ( 5 a j c - y i I . (4)
-
A , c i = 1 V j = 1 7
Решением задачи (4) является ортогональная проекция Y™т вектора Y на линейное пространство векторов {E, X}. Компоненты вектора Y™т определяются следующим образом y 5 а xj + c опт.
j = 1
Требуется вычислить а о пт , c опт на основе выборки V статистических данных.
Решение задачи. Рассматривается система векторов E , Xр X , ,..., X n . Метод Грамма-Шмидта позволяет из этой системы векторов получить систему ортогональных векторов { Z; j = 1, n * } по следующим формулам:
' ■ Z , = E ,
. Z
=
X
,-
j j - 1 5 ZZ, , Z^
* *
j = 2, n ; n < n + 1.
Значение n * определяется в процессе построения системы векторов { Z }. Если при вычислении вектора Zk получается нулевой вектор, то вектор Xk исключается из рассмотрения и вместо него рассматривается вектор Xk . При этом общее количество ортогональных векторов уменьшается на единицу.
Вектор Zk признается нулевым, если выполнено следующее условие:
m
5KI < = .
i = 1
где £ > 0 - малая величина, например, £ = 10-6.
Метод Грамма-Шмидта позволяет следующее:
-
1. Получить ортогональную систему векторов Z 1 , Z 2,..., Z n * , n * < n + 1. Вектор E всегда входит в эту систему в качестве исходного вектора.
-
2. Определить подсистему линейно независимых векторов { E , Xh , X 2 2 ,..., X j * } , на основе которых строится система ортогональны ix векторов { Z 1 , Z 2,..., Z , } по формулам (5).
Система ортогональных векторов { Z } определяет линейное пространство размерности n * . Вектор Y ,пт является проекцией вектора Y на это линейное пространство и может быть представлен в виде следующего разложения по ортогональному базису:
* n
Y опт = VbZ
J J j =1
Вектор Y всегда можно представить в виде следующей суммы:
Y = Y
опт
+ Y * ,
где вектор Y* ортогонален линейному пространству образованному системой векторов { Zj }.
Тогда коэффициенты bj в формуле (6) выражаются через заданный вектор Y по формулам bj= (y,Zj)/(Zj,Z^, j = 1,n* . (7)
Подставляя формулу (7) в (6), для вычисления ортогональной проекции получаем следующее
* n Y опт = 5
j = 1
/у / \
1 , Zj)
\ Zj ’ Zj)
Z j .
Для вычисления оптимальных значений параметров A, с рассмотрим систему линейно независимых векторов {E, Xh, Xj2,..., Xj* }. Эти векторы принадлежат линейному пространству Z, образованному векторами Z1,Z2,.", Zn* , вектор Yопт G Z. Тогда следующая система уравнений всегда имеет единственное решение n * -1
cE + 5 a „ X „ = 1 оп- , (8)
k = 1
где параметры a j ^ { a j^ ; k = 1, n‘ - 1 } равны нулю. Система уравнений (8) определяет оптимальные значения параметров A , с , ее решение можно найти, например, методом Гаусса.
Результаты решения модельной задачи. Рассмотренный алгоритм решения задачи реализован [1] в виде программы на языке программирования общего назначения C++Builder 6.0.
Рассматривалась следующая модельная задача:
Г11
Г11
Значение вектора параметров модели (1)
-2
l-1JГ 41
' Y = 7
< 1,
Г c л ах a2
, a 3 >
Г 2,310 241 л 1,207 831 0 2- 0,180 723 J
Полученное решение совпадает с решением нормальной системы уравнений сформированной на основе векторов { E , X 1, X 3}.
В результате расчетов в соответствии с изложенным
алгоритмом получены следующие результаты (табл. 1, 2):
Таблица 1
Количество и номера независимых факторов
Количество факторов |
Номера факторов |
3 |
1 2 4 |
Ортогональные векторы Z 1 , Z 2 , Z 3
Таким образом, в работе предложен и обоснован алгоритм вычисления параметров многофакторной регрессионной модели методом проектирования вектора значений показателя на пространство линейно независимых векторов значений факторов. Этот алгоритм не приводит к срыву вычислительного процесса в отличие от обычного решения системы нормальных уравнений.
Также рассмотрены результаты применения программной реализации алгоритма на модельной задаче.
Таблица 2
Z 1 |
Z 2 |
Z 3 |
1 |
–1 |
0,9 |
1 |
1 |
–2,4 |
1 |
3 |
1,3 |
1 |
–3 |
0,2 |
Значение вектора Y опт – проекции вектора Y на линейное пространство ортогональных векторов Z 1, Z 2, Z 3
Г 3,337 349 1
Y
опт
5,933735
7,265060