К задаче построения кусочно-линейной дискриминантной функции

Автор: Плотников С.В.

Журнал: Вестник экономики, управления и права @vestnik-urep

Рубрика: Образование

Статья в выпуске: 1 (30), 2015 года.

Бесплатный доступ

Рассматривается задача численного нахождения кусочно-линейной функции, разделяющей два конечных множества A и B из Rn, трактуемых как обучающее множество в задаче дискриминантного анализа. Для целей строгой отделимости множеств подразумевается, что множества A и B не имеют общих точек, но и их наличие не является препятствием для предлагаемого алгоритма. Выпуклость дискриминантной функции или пустота пересечения выпуклых оболочек этих множеств также не предполагается. Естественным ограничением является требование принадлежности распознаваемого элемента аффинной оболочке обучающего множества. Для этих целей обобщается основной результат статьи Benchekroun B., Falk James E. [1], в которой была предложена формализация разбиений Делоне средствами линейного программирования для случая принадлежности элемента выпуклой оболочке исходных точек и при условии телесности этой оболочки. В настоящей заметке показано, что эти ограничения можно снять, сохраняя экстремальные свойства разбиений Делоне.

Еще

Распознавание образов, дискриминантный анализ, кусочно-линейная функция, разбиение делоне, аффинная оболочка, линейное программирование, симплекс делоне

Короткий адрес: https://sciup.org/14214657

IDR: 14214657

Текст научной статьи К задаче построения кусочно-линейной дискриминантной функции

Рассматривается задача численного нахождения кусочно-линейной функции, разделяющей два конечных множества A и B из Rn, трактуемых как обучающее множество в задаче дискриминантного анализа. Для целей строгой отделимости множеств подразумевается, что множества и не имеют общих точек, но и их наличие не является препятствием для предлагаемого алгоритма. Выпуклость дискриминантной функции или пустота пересечения выпуклых оболочек этих множеств также не предполагается. Естественным ограничением является требование принадлежности распознаваемого элемента аффинной оболочке обучающего множества. Для этих целей обобщает- ся основной результат статьи [1]. В этой работе была предложена формализация разбиений Делоне [2] средствами линейного программирования для случая принадлежности элемента выпуклой оболочке исходных точек и при условии телесности этой оболочки. В настоящей заметке показано, что эти ограничения можно снять, сохраняя экстремальные свойства разбиений Делоне в аффинной оболочке обучающего множества.

Обозначим через X = { a 1 ,...,a m } обучающее множество точек, часть которых, с индексом I 1 , принадлежит множеству A , а остальные, с индексом I 2 , множеству B . Требуется определить значение кусочно-линейной дискриминантной функции f ( x ) для распознаваемого элемента x е R n из аффинной оболочки обучающего множества M = aff X , в предположении, что значения f j = f ( aj ), j = 1,..., m на обучающем множестве известны. В рамках рассматриваемой задачи распознавания, пусть f j 0 ( j е I 1 ) и fj 0 ( j е 1 2 ), 1 1 и 1 2 = { 1,..., m } . По знаку f ( x ) будем судить о принадлежности элемент а x е L одному из множеств, а ^ а или В ^ B , а именно, при f ( x ) 0 отнесем элемент x е Rn к множеству а , а в случае противоположного знака будем считать, что x е В .

В статье [1] James E. Falk предложил (по совету Christoph J. Witzgall и для несколько иных целей) оценивать значение f (x) при x е co X величиной ю

m

S аjfj, где j=1

вектор а = ( а 1 ,..., аm ) T является базисным решением следующей линейной программы:

min t

mm

S а 11 a \ I : S a a

i j = i

j = 1

m

= x , S a j = 1, все a , 0 (1)

j = 1

Если при этом m n и aff X = R " , то гиперсфера S ( a ), определяемая n + 1 точками a j ,..., a j + i , соответствующими базисным компонентам α ˆ j ,..., α ˆ j вектора α ˆ , не содержит других точек a j в своей внутренности [1, p.80].

Описанная выше конструкция привлека- тельна тем, что в ней процедуры получения симплициального разбиения со свойствами Делоне и последующего вычисления значения f (x) совмещены и выполняются одновременно. Кроме того, кусочнолинейная дискриминация этим способом позволяет допускать наличие общих точек a j во множествах A и B , в таких случаях можно положить f (aj) = 0.

В целях применения этой конструкции к задачам распознавания образов распространим ее в двух направлениях: во-первых, откажемся от ограничительного требования aff X = R" ; во-вторых, укажем способ применения конструкции в случае x t coX .

1. Рассмотрим случай aff X * R" , x е coX . Для этого сохраним общую канв у доказательства соответствующей Теоремы [1, p.80], дополняя ее необходимыми замечаниями.

Теорема 1 . Пусть размерность аффинной оболочки M = aff X равна r n и a j ,..., a j + 1 - точки, соответствующие базисным компонентам α ˆ j ,..., α ˆ j базисного решения задачи (1) при x е coX . Тогда гиперсфера с центром в M , проходящая через точки a j ,..., a j + 1 , определяется однозначно и не содержит других точек a j в своей внутренности.

Доказательству теоремы предпошлем следующие очевидные (в разной степени) факты.

Лемма 1 . Пусть a 1,..., ak - произвольные точки из R n . Тогда

,       ,               ( a 1 )     ( a k )

dim aff { a ,..., a } + 1 = dim{ ! ,..., ! } (2)

V 1 7 V 1 У

Лемма 2 . Пусть точки a 1,..., ak находятся в общем положении. Тогда существует единственная гиперсфера с центром в аффинной оболочке этих точек, проходящая через эти точки, а ее центр c определяется системой линейных уравнений

2 cT (aJ - a 1) = || a 7 || - || a 11 ( j = 2,..., k ) (3)

с дополнительным требованием c е aff {a 1,...,ak}.

К ЗАДАЧЕ ПОСТРОЕНИЯ КУСОЧНО-ЛИНЕЙНОЙ ДИСКРИМИНАНТНОЙ ФУНКЦИИ

Плотников С.В.

Лемма 3 . Пусть задача линейного про-

граммирования T p X г ШП1

Ax = b x > 0

разрешима и ранг ее матрицы Anхm равен r . Если Bnхr - произвольная базисная матрица, соответствующая оптимальному базисному решению задачи (4), то найдется оптимальное решение у * двойственной к ней задачи bTу ^ max

A T У Р ,

для которого будет выполнено равенство

B T y = Р .

Доказательство теоремы 1 . Пусть a = ( а 1 ,..., аm ) T является оптимальным базисным решением задачи (1). В силу соотношения (2) и условия dim M = r каждый базис, соответствующий этому базисному решению, содержит r + 1 вектор вида

' a j 2

' a j +1 2

V

1 )

у

Следовательно, точки a j 1,..., a j + | находятся в общем положении и гиперсфера с центром в M определяется однозначно (см. Лемму 2) соотношениями:

2 cT ( a j - aJ 1 ) = || ajk || -|| aj ||| ( k = 2,..., r + 1),

такую же, как и в (5). Но элемент u e r" не обязан принадлежать M . Обозначим через uˆM ортогональную проекцию элемента uˆ на аффинную оболочку м. Тогда й = йM + йM1, причем йM1 (aj - aj1) = 0 (k = 2,...,r +1) . Поэтому получаем йM (aj - aj1) = ||ajk|| -||aj'|| (k = 2,..., r +1) , что означает йM = 2c. Таким образом, центр гиперсферы совпадает с точкой 12 uˆM .

Покажем, что для любой другой точки a e X , кроме aj 1 ,..., a j +1 , будет выполнено неравенство || c - a ||2 > || c - aj 1|| . Из соотношений (6) и (7) получаем йT ( a - aj 1 ) < || a ||2 - || aj 1|| .

Так как й TM 1 ( a - aj) = 0 и й M = 2 c , то 2 c T ( a - aJ'~) < || a ||2 - || aj 1|| .

Последнее неравенство эквивалентно соотношению || c - a ||2 > || c - aj '|| . Теорема доказана .

Рассмотрим следующий пример. Пусть a1 = (-1,0)T, a2 = (0,0)T, a3 = (1,0)T      и x = (0,0)T . Здесь dimaff {a1,a2,a3} = 1, а задачи 1 и 6 имеют вид

1 a 1 + 0 a 2 + 1 a 3 ^ min

- 1 a + 0 a + 1 a = 0

L :               1       2       3

0 a 1 + 0 a 2 + 0 a 3 = 0

a 1 + a 2 + a 3 = 1

a 0 a 0 a 3 0

123    и

c e aff { aj 1,..., ajr + |} = M                     (5)

Рассмотрим двойственную к (1) задачу xTu ^ max uTaj + v < ||aj'|| (j = 1,...,m)              (6)

Согласно лемме 3, задача (6) имеет оптимальное базисное решение ( u ˆ, v ˆ) , удовлетворяющее равенствам

0 u 1 + 0 u 2 + v ^ max

L^ :      - 1 u 1 + 0 u 2 + v 1

0 u 1 + 0 u 2 + v 0

1 u 1 + 0 u 2 + v 1

Оптимальным базисным решением задачи L является вектор (0,1, 0) T , которому соответствуют две разных базисных матрицы:

й Ta j + v = || aj ||  ( k = 1,..., r + 1)       (7)

'- 1 0 ^

' 0 1

B 1 =

0  0

и   B 2 =

0 0

V 1    1 у

V 1 1

Из соотношений (7) получаем систему равенств йT (aj - aj) = ||ajk || -11aj|| (k = 2,..., r +1),

Для первой находим (в согласии с Леммой 3) решение двойственной задачи u 3 = - 1, u 2 = v = 0; для второй - решение u1 = 1, u 2 = v = 0.

Этим решениям соответствуют окружности радиуса 12 с центрами в точках c1 = (-12,0)T и c2 = (12,0)T .

При этом оптимальное множество двойственной задачи составляют векторы вида ( u 1 , u 2 ,0) T с условием - 1 u 1 1. В исходной статье [1] не отмечено, что равенства (7) будут справедливы только для особых (см. Лемму 3) решений двойственной задачи.

2. Рассмотрим случай x t co X . Покажем один из способов продолжения кусочнолинейной дискриминантной функции, описанной в предыдущем разделе, на область x t coX . Основой для такого подхода является метод точных штрафных функций, разработанный И.И.Ереминым [3].

Определим следующую кусочно-линейную программу с параметрами X j 0 ( j = 1,..., m ), аппроксимирующую задачу (1):

впадения оптимальных множеств и оптимальных значений.

Доказательство . Разрешимость задачи (8) при x e aff X является следствием ограниченности снизу кусочно-линейной целевой функции на непустом допустимом множестве. При X j aj ( j = 1,..., m ) имеем:

m       2 m              m                   2 m        2

£HHI + Е х (-aj) + > E aj +(-aj )+)| l aj || = E a +l aj ll > 0

j = 1                j = 1                    j = 1                                  j = 1

Вторая часть Теоремы проверяется прямым применением стандартной техники точных штрафных функций [3, с.120; 4, с.84]. Теорема доказана .

Важно отметить, что кусочно-линейная программа (8) при X j 0 ( j = 1,..., m ) эквивалентна следующей задаче линейного программирования (в смысле совпадения оптимальных значений и соответствующих частей оптимальных значений переменных α ˆ ):

m

m

m

min

mm  m

E a V I + E X (a ) + : E a X

i 1 = 1                  .j = 1

.i = 1

m

= x E a 1 = 1 1 (8)

.i = 1

m   mm miniEalkll +E Xjtj; E

l j = 1

j = 1          j = 1

m aja = x, Eajj = j =1

Теорема 2 . Пусть x e aff X . Тогда задача (8) разрешима при любых X j > || aj ||2 ( j = 1,..., m ). Пусть x e coX и ( u ˆ, v ˆ) - какое-нибудь решение задачи (6). Тогда при любых X j > || aj || - й T a j - v задачи (1) и (8) эквивалентны в смысле со-

= 1, a j + t j 0, t j 0 ( j = 1,..., m ) >

Таким образом, задача идентификации элемента x e aff X требует решения единственной задачи линейного программирования. Условие принадлежности распознаваемого элемента аффинной оболочке обучающего множества представляется обязательным с позиций корректности постановки задачи.

Список литературы К задаче построения кусочно-линейной дискриминантной функции

  • Benchekroun B., Falk James E. A nonconvex, piecewise linear optimization problem. Computers Math. Applic. Vol.21, No 6/7, pp.77-85, 1991.
  • Delanue B. Sur la sphere vide. A la memoire de Georges Voronoi//Известия АН СССР, 1934, №6. С. 793-800.
  • Еремин И.И., Астафьев Н.Н. Введение в теорию линейного и выпуклого программирования. М.: Наука, 1976. 192 С.
  • Еремин И.И. Теория линейной оптимизации. Екатеринбург: УрО РАН, 1998. 246 С.
Статья научная