Выбор логических закономерностей для построения решающего правила распознавания

Автор: Антамошкин Александр Николаевич, Масич Игорь Сергеевич

Журнал: Сибирский аэрокосмический журнал @vestnik-sibsau

Рубрика: Математика, механика, информатика

Статья в выпуске: 5 (57), 2014 года.

Бесплатный доступ

Исследуется один из аспектов построения логических алгоритмов распознавания - отбор закономерностей из множества найденных закономерностей в данных. Рассматривается задача распознавания объектов, описываемых бинарными признаками и разделенных на два класса. В результате выполнения процедуры поиска закономерностей по обучающей выборке (набору исходных данных) найден ряд закономерностей. Встает вопрос отбора закономерностей из общего их числа для формирования решающего правила, что способно не только уменьшить его размер, но и повысить качество распознавания. Один из способов произвести отбор закономерностей - выделить подмножество закономерностей, которые необходимы для покрытия всех объектов обучающей выборки. Эта задача формулируется в виде задачи оптимизации. Полученная оптимизационная модель представляет собой задачу условной псевдобулевой оптимизации, в которой целевая функция и функции в ограничениях являются унимодальными монотонными псевдобулевыми функциями. Другой способ заключается в том, чтобы произвести отбор таких закономерностей, которые при совместном использовании увеличат разделяющую способность решающего правила. В качестве критерия при формировании решающего правила рассматривается ширина «разделяющей полосы». Еще один способ заключается в отборе опорных объектов, на основе которых формируются правила. Отбор логических закономерностей, произведенный в соответствии с предлагаемым подходом, позволяет значительно снизить их число и упростить решающее правило, практически не снижая точность распознавания. Это делает решающее правило прозрачным, а результаты более интерпретируемыми, что необходимо для поддержки принятия решений при распознавании.

Еще

Анализ данных, классификация, логический алгоритм, распознавание

Короткий адрес: https://sciup.org/148177353

IDR: 148177353

Список литературы Выбор логических закономерностей для построения решающего правила распознавания

  • Ovarian Cancer Detection by Logical Analysis of Proteomic Data/G. Alexe //Proteomics. 2004. No. 4(3). P. 766-783.
  • From Diagnosis to Therapy via LAD/D. Axelrod //Invited Lecture at INFORMS Annual Meeting. Denver, CO. October, 2004.
  • Dupuis C., Gamache M., Page J. F. Logical analysis of data for estimating passenger show rates in the airline industry//Journal of Air Transport Management. 2012. 18. P. 78-81.
  • Esmaeili S. Development of equipment failure prognostic model based on logical analysis of data//Master of Applied Science Thesis/Dalhousie University. Halifax, Nova Scotia, 2012.
  • Масич И. С. Комбинаторная оптимизация в задаче классификации//Системы управления и информационные технологии. 2009. № 1.2(35). C. 283288.
  • Hammer P. L., Bonates T. O. Logical analysis of data -An overview: From combinatorial optimization to medical applications//Annals of Operations Research. 2006. 148.
  • Antamoshkin A. N., Masich I. S. Pseudo-Boolean optimization in case of unconnected feasible sets//Models and Algorithms for Global Optimization. Series: Springer Optimization and Its Applications. Springer. 2007. Vol. 4. P. 111-122.
  • Антамошкин А. Н., Масич И. С. Эффективные алгоритмы условной оптимизации монотонных псевдобулевых функций//Вестник СибГАУ. 2003. Вып. 4. С. 60-67.
  • Модель логического анализа для решения задачи прогнозирования осложнений инфаркта миокарда/С. Е. Головенкин //Вестник СибГАУ. 2010. Вып. 4(30). С. 68-73.
  • Bache K., Lichman M. UCI Machine Learning Repository. Irvine, CA: University of California, School of Information and Computer Science, 2013. URL: http://archive.ics.uci.edu/ml.
  • Масич И. С. Приближенные алгоритмы поиска граничных точек для задачи условной псевдобулевой оптимизации//Вестник СибГАУ. 2006. 1(8). С. 39-43.
  • Alexe G., Hammer P. L. Spanned patterns for the logical analysis of data//Discrete Appl. Math. 154. 2006. P. 1039-1049.
  • Guoa C., Ryoo H. S. Compact MILP models for optimal and Pareto-optimal LAD patterns//Discrete Applied Mathematics. 160. 2012. P. 2339-2348.
  • Осложнения инфаркта миокарда: база данных для апробации систем распознавания и прогноза/С. Е. Головенкин //Препринт № 6. 1997. Красноярск: Вычислительный центр СО РАН.
  • Waikato Environment for Knowledge Analysis. Weka 3: Data Mining Software in Java. URL: http://www.cs. waikato.ac.nz/ml/weka.
Еще
Статья научная