Об одном методе вычисления обобщённых нормальных решений недоопределённых линейных систем

Автор: Жданов Александр Иванович, Сидоров Юрий Вячеславович

Журнал: Компьютерная оптика @computer-optics

Рубрика: Численные методы и анализ данных

Статья в выпуске: 1 т.44, 2020 года.

Бесплатный доступ

В статье представлен новый метод вычисления обобщённых нормальных решений недоопределённых систем линейных алгебраических уравнений на основе специальных расширенных систем. Преимуществом данного метода является возможность решения очень плохо обусловленных (возможно разреженных) недоопределённых линейных систем большой размерности с использованием современных вариантов метода итерационного уточнения на основе метода обобщённых минимальных невязок (GMRES-IT). Представлены результаты применения рассматриваемого алгоритма для решения задачи балансировки химических уравнений (баланс масс).

Недоопределённые линейные системы, обобщённое нормальное решение, расширенная система

Короткий адрес: https://sciup.org/140247068

IDR: 140247068   |   DOI: 10.18287/2412-6179-CO-607

Текст научной статьи Об одном методе вычисления обобщённых нормальных решений недоопределённых линейных систем

Недоопределённые системы линейных алгебраических уравнений (СЛАУ) возникают при решении различных прикладных задач, например, в сейсмической томографии [1], при обработке сигналов с утраченными фрагментами [2], при расчётах вариообъективов [3] и др.

Для нахождения нормального решения недоопределённых СЛАУ в настоящее время используются следующие подходы: методы, основанные на сингулярном разложении матриц ( SVD -разложение), методы нормальных уравнений и метод расширенных систем. Например, в работе [4] для решения разреженных недоопределённых СЛАУ с матрицами специальной структуры предложен параллельный алгоритм с использованием ортогональных разложений. Однако перечисленные методы не позволяют вычислять обобщённые нормальные решения, минимизирующие расстояние до произвольного априори заданного вектора («пробного» решения).

Для нахождения решений переопределённых разреженных СЛАУ большой размерности существует известный подход, основанный на использовании расширенных систем, который обладает рядом преимуществ [5]. Для недоопределённых разреженных СЛАУ большой размерности в настоящее время нет подхода, позволяющего вычислять обобщённые нормальные решения.

В статье предлагается новый метод нахождения обобщённых нормальных решений недоопределён- ных, возможно разреженных и плохо обусловленных, СЛАУ большой размерности на основе специальной расширенной системы.

1.    Метод расширенной системы

Рассмотрим недоопределённую СЛАУ

Au = f ,                                       (1)

где A e R m x n , u e R n , f e R m , m n , rank( A ) = m .

Необходимо вычислить нормальное решение u * относительно произвольного (априори заданного) вектора u 0 :

  • u . = min I| u - u 0 11,                                            (2)

ueU где U = {ueRn: Au = f} - множество решений Au = f, uо 4 U, ||-|| = ||-||2 - евклидова векторная норма. В дальнейшем (2) будем называть обобщённым нормальным решением.

Известно [6], что решение задачи (2) имеет вид

  • u . = A + f + ( I n - A + A ) u о ,                          (3)

где I n – единичная матрица порядка n , A + – псевдооб-ратная матрица Мура–Пенроуза матрицы A [5].

Однако, как отмечалось во введении, непосредственное нахождение псевдообратной матрицы, например, с помощью SVD -разложения, для разреженных матриц большой и сверхбольшой размерностей сопряжено со значительными вычислительными затратами.

Задача (2) также может быть решена на основе подхода, известного как вторая трансформация Гаусса.

По условию задачи имеем u е U и в соответствии с (2) ( и - и 0 ) ± ker A , из этого следует, что

(и - и0) е Im Aт ,(4)

или и = ATz + и 0.(5)

Подставив u в (1), получаем

A (ATz + и о ) = f(6)

или

AATz = f - Au0.(7)

Решая (6), находим вектор z = ( AA т ) -1 ( f - Au 0). Подставив этот вектор в (5), получаем искомое решение u * .

Если вектор u 0 = 0 то из (3) следует, что u * = A + f .

Одним из главных недостатков при переходе к системе (7) является значительное увеличение спектрального числа обусловленности матрицы AAT , так как

^(AA >=ц2 (A >=5и, где G1(A) и gm(A) - максимальное и минимальное сингулярные числа матрицы A, gm(A) > 0, так как rank (A) = m.

При больших числах обусловленности матрицы системы (6) имеет место численная неустойчивость решения задачи известными прямыми методами.

С другой стороны, в общем случае трудно предсказать степень разреженности матрицы AA т при её формировании. Как показано в [7], матрица AA т может оказаться сильно заполненной даже в случае, когда среднее число ненулевых элементов в строке матрицы A примерно равно m . Например, матрицы с такой структурой возникают в задачах реконструкции двухмерных изображений из проекций [8].

В данной работе для решения задачи (2) предлагается подход, основанный на использовании специальной расширенной системы.

Запишем уравнение (5) в виде и - ATz = и0. (8)

Тогда, объединяя уравнения (8) и (1), приходим к расширенной системе вида

A

Заменяя в (9) z = – y , получаем её симметричную форму

I n A

AT

о B 9 = g ,

где

( \ \              | U |                                | U n |

B R ( n + m и n + m ) , 9 =     е R n + m , g = 0 r n + m .

I y J            I f J

Утверждение 1. Решение системы (10) существует и притом единственно 9 » = ( и T , y Т ) T , где и * является решением (2), т.е. обобщённым нормальным решением.

Доказательство. Для доказательства этого утвер- ждения достаточно показать невырожденность матрицы B расширенной системы (10).

Покажем, что матрица B в расширенной системе (10) всегда невырожденная.

В [9] показано, что собственные значения X i ( B ) матрицы B равны

/ ч — ±       + g2| , i = 1,2, ..., m ;         _ „

X i ( B ) = Ь 4 J,      , , , ’        (11)

  • 1 1,    i = m + 1, . , m + n ,

где g i - сингулярные числа матрицы A , i = 1,2,..., m .

Так как rank ( A ) = m < n , все сингулярные числа матрицы A отличны от нуля, т.е. G 1 > ... g m >0. Следовательно, все собственные значения X i ( B ) ^ 0, i = 1,2,..., m+n и det( B ) ^ 0. Таким образом, система (10) имеет единственное решение 9 » = ( и . т , y . т ) T . □

Из условия (4) следует, что to ( и - и 0) e lm A T для любого to > 0. Тогда систему (10) можно представить в виде:

to I n

A

AT j( и j

о B to 9 = g to

здесь

e R ( n + m ) , to > 0.

Параметр to позволяет контролировать число обусловленности системы (12), что может быть использовано для повышения вычислительной устойчивости решения расширенной системы (12).

Покажем, что матрица B to при всех to > 0 невырожденная и, следовательно, система (12) всегда имеет единственное решение.

Утверждение 2. Решение системы (12) при любых to > 0 существует и притом единственно 9 » = ( и Т , y Т ) T .

Доказательство . Доказательство этого утверждения аналогично доказательству Утверждения 1.

Покажем невырожденность матрицы B to расширенной системы (12).

Сингулярные числа матрицы A отличны от нуля, G1 >... >gm>0, следовательно, все собственные значения Xi(B)^ 0, i = 1,2,..., m+n и равны x,( Bю) =

to

i = 1,2,. . , m ,

i = m + 1, . , m + n .

Таким образом, определитель матрицы Bш^0, из чего следует, что система (12) имеет единственное решение.

Рассмотрим возможные способы выбора параметра to в (12).

В работе [10] предложен способ выбора to , который минимизирует число обусловленности матрицы B to расширенной системы:

to = to = —j=c m

( A ) 2 ( B to) ~ V2 K ( A ) ,      (14)

Выбор единичного вектора в качестве вектора пробного решения u 0 – наиболее простой способ выбора вектора, отличного от нулевого и не принадлежащего области решений системы (15).

  • 2.    Перевод вектора u * из вещественных чисел в целые (если необходимо).

  • 2. Численные результаты

Рассмотрим следующее несбалансированное уравнение химической реакции

MnO- + H+ + Fe2+ ^ Mn2+ + H2O + Fe3+ , или в математической формулировке u1MnO- + u 2H+ + u 3Fe2+ = u 4Mn2+ + u 5H2O+u 6Fe3+. (17)

Для уравнения (17) матрица коэффициентов имеет вид где k2(Bto) - спектральное число обусловленности матрицы Bto расширенной системы (12), k2(A) - спектральное число обусловленности матрицы A исходной задачи (1).

r 1

- 1

- 1 0

- 2 0

0 - 1

(- 1 1

2 - 2

0 - 3 J

В качестве иллюстративного примера рассмотрим задачу балансировки химических уравнений, которая сводится к определению (целочисленных) стехиометрических коэффициентов (баланс масс). Следует отметить, что в зависимости от рассматриваемого химического процесса вычисление целочисленных стехиометрических коэффициентов требуется не всегда.

Современные подходы [11] для определения стехиометрических коэффициентов основаны на решении однородных недоопределённых систем линейных алгебраических уравнений вида

Au = 0, A e К m x n , u e R , m n , rank ( A ) = m . (15)

Здесь A – матрица коэффициентов химической реакции, u – вектор неизвестных целочисленных стехиометрических коэффициентов.

В дальнейшем будем полагать, что химические реакции возможны и имеют одну степень свободы. Это означает, что размерность пространства решений L = { u e R n : Au = 0} однородной СЛАУ (15) равна 1:

dim ( L ) = n - rank ( A ) = n - m = 1. (16)

Одним из недостатков известных методов решения задачи (15) является применение целочисленной арифметики, что значительно усложняет вычислительный процесс [12].

Задачу определения целочисленных стехиометрических коэффициентов с помощью специальной расширенной системы (9) можно разделить на следующие этапы [13]

1. Решение задачи u * = argmin | |u - u 0Ц, где u0 =(1,..., 1)т с использованием (9) при f= (0,..., 0)т.

Для нахождения стехиометрических коэффициентов уравнения (17) на первом этапе вычисляется обобщённое нормальное решение задачи (2) с помощью расширенной системы (9), где f = (0,..., 0) T e R 5 , u 0 = (1,..., 1) T e R 6 .

Решение (вещественное) u * системы (9):

r 0.181818181818182 ^

1.45454545454545

0.909090909090910

0.181818181818182

0.727272727272727

( 0.909090909090909 ?

Для перевода вещественных коэффициентов в целые воспользуемся стандартным подходом [13].

Окончательно получаем вектор целочисленных стехиометрических коэффициентов:

u = ( 1, 8, 5,1, 4, 5 ) T .

Таким образом, сбалансированное уравнение химической реакции имеет следующий вид

1 - MnO - + 8 H ++ 5 Fe2 + = 1 - Mn2 ++ 4 H 2 O + 5 Fe3 + .

Заключение

В работе представлен новый метод вычисления обобщённых нормальных решений недоопределённых систем линейных алгебраических уравнений на основе специальных расширенных систем (9) и (12).

Для нахождения решений систем (9) и (12) могут применяться известные методы, основанные на LU- или QR -разложениях.

В случае плохой обусловленности матрицы A задачи (1), (2) для нахождения устойчивых решений на основе специальной расширенной системы (12) эффективно применять итерационное уточнение, аналогично задачам наименьших квадратов (с матрицей A полного столбцового ранга), предложенное в работе [9] Бьёрком (Å. Björck).

В работе [14] предложен новый алгоритм итерационного уточнения с предобуславливанием на основе метода обобщённых минимальных невязок (GMRES-IT) для очень плохо обусловленных разреженных линейных систем большой размерности. Данный подход можно эффективно использовать для решения очень плохо обусловленных и разреженных задач (1), (2) большой размерности на основе расширенной системы (12).

Список литературы Об одном методе вычисления обобщённых нормальных решений недоопределённых линейных систем

  • Некорректные задачи. Численные методы и приложения / А.Б. Бакушинский, А.В. Гончарский. - М.: Изд-во Моск. ун-та, 1989. - 199 с.
  • Поспелов, В.В. Метод восстановления утраченных фрагментов сигнала / В.В. Поспелов, А.В. Чичагов // Автометрия. - 1988. - № 1. - С. 60-64.
  • Рожков, О. В. Особенности теории и практики научной школы МГТУ им. Н.Э. Баумана "Разработка вариосистем" / О.В. Рожков, Д.Е. Пискунов, П.А. Носов, В.Ю. Павлов, А.М. Хорохоров, А.Ф. Ширанков // Компьютерная оптика. - 2018. - Т. 42, № 1. - С. 72-83. - DOI: 10.18287/2412-6179-2018-42-1-72-83
  • Sukru Torun, F. Parallel minimum norm solution of sparse block diagonal column overlapped underdetermined systems / F. Sukru Torun, M. Manguoglu, C. Aykanat // ACM Transactions on Mathematical Software. - 2017. - Vol. 43, Issue 4. - 31. - DOI: 10.1145/3004280
  • Numerical methods in matrix computation / А. Bjorck. - New York: Springer, 2015.
  • Регрессия, псевдоинверсия и рекуррентное оценивание / А. Алберт. - М.: Наука, 1977.
  • Bjorck, А. Accelerated projection methods for computing pseudoinverse solutions of systems of linear equations / А. Bjorck, T. Elfving // BIT Numerical Mathematics. - 1979. - Vol. 19, Issue 2. - P. 145-163.
  • Herman, G.T. ART: Mathematics and applications / G.T. Herman, A. Lent, S.W. Rowland // Journal of Theoretical Biology. - 1973. - Vol. 42. - P. 1-32.
  • Bjorck, А. Iterative refinement of linear least squares solutions / А. Bjorck // BIT Numerical Mathematics. - 1967. - Vol. 7, Issue 4. - P. 257-278.
  • Bjorck, А. Numerical stability of methods for solving augmented systems / А. Bjorck // Proceedings of Recent Developments in Optimization Theory and Nonlinear Analysis. - 1997. - P. 51-60.
  • Herman, W.C. On balancing chemical equations: Past and present / W.C. Herman // Journal of Chemical Education. - 1997. - Vol. 74, Issue 11. - 1359.
  • Sen, S.K. Chemical equation balancing: An integer programming approach / S.K. Sen, H. Agarwal, K. Sen // Mathematical and Computer Modelling. - 2006. - Vol. 44, Issue 7. - P. 678-691. -
  • DOI: 10.1016/j.mcm.2006.02.004
  • Soleimani, F. Some matrix iterations for computing generalized inverses and balancing chemical equations / F. Soleimani, P.S. Stanimirovic, F. Soleymani // Algorithms. - 2015. - Vol. 8. - P. 982-998.
  • Carson, E. A new analysis of iterative refinement and its application to accurate solution of III-conditioned sparse linear systems / E.A. Carson, N.J. Higham// SIAM Journal on Scientific Computing. - 2017. - Vol. 39, Issue 6. -P. A2834-A2856. -
  • DOI: 10.1137/17M1122918
Еще
Статья научная