Опыт бикластеризации данных о сортах сельскохозяйственных культур

Бесплатный доступ

Статья посвящена анализу объектно-признаковых данных в слабо структурированных областях. Конкретно, рассматривается демонстрационный пример бикластеризации подобных данных в области селекции сельскохозяйственных культур. Показывается, какие при этом открываются возможности для систематизации эмпирических данных. Рассматриваемый метод бикластеризации данных - классический анализ формальных понятий - представляет собой прикладную ветвь теории решеток; приведена краткая справка о его математических основах. Исходный материал для демонстрационного примера был заимствован из каталога инновационных разработок Самарского НИИСХ им. Н.М. Тулайкова. В качестве объектов анализа избраны сорта мягкой яровой пшеницы, в качестве признаков - несколько описывающих их свойств. Ряд этих свойств подвергнут шкалированию в соответствии с ГОСТ 9353-2016 для пшеницы. На основе отобранного и скорректированного материала сформирована исходная таблица «объекты-свойства», или формальный контекст для анализа формальных понятий. Для обработки этих данных использован свободно распространяемый программный пакет ConExp, реализующий методический комплекс анализа формальных понятий. Продемонстрированы основные результаты, которые дают эти методы для структуризации эмпирических данных: решетка формальных понятий, импликации и ассоциативные правила на множестве признаков. Кроме того, продемонстрирован результат работы программного комплекса OntoWorker, разрабатываемого в ИПУСС РАН - СамНЦ РАН, заключающийся в трансформациии редукции решетки формальных понятий в специальную таксономию формальных понятий (классов), более удобную для восприятия и интерпретации пользователем. Отмечено, что расширенные методы анализа формальных понятий могут учитывать неполноту исследуемых данных, обусловливаемую множественностью серий измерительных экспериментов с разной степенью достоверности результатов и наличием конкурирующих измерительных процедур с разной степенью доверия к их результатам. Это отражает реалии накопления эмпирической информации и может быть использовано непосредственно при многомерных наблюдениях и измерениях в селекционных испытаниях. Подчеркнуто, что эффективное применение рассмотренных методов возможно лишь при сотрудничестве экспертов предметной области и специалистов в области анализа данных.

Еще

Объектно-признаковые данные, анализ формальных понятий, формальный контекст, решетка формальных понятий, импликации на признаках, сельскохозяйственные культуры, пшеница мягкая яровая, засухоустойчивость, устойчивость к бурой ржавчине

Короткий адрес: https://sciup.org/148314219

IDR: 148314219   |   УДК: 519.711.2

Experience of biclusterization application to data of agricultural crops sorts

The article is devoted to methods for analyzing object-attribute data in low structured areas. Specifically, a demonstrational example of biclusterization of similar data in the field of agricultural crops selection is considered. It is shown what opportunities are appearing for the systematization of empirical data. The data biclusterization method under consideration - a classical formal concept analysis - is an applied branch of lattice theory; a brief reference is given on its mathematical foundations. The source material for the demonstrational example was borrowed from the catalog of innovative developments of the Samara Research Institute of Agricultural Sciences named after N.M. Tulaykov. Sorts of soft spring wheat were chosen as objects, and several properties which are describing them were chosen as attributes. A number of these properties are scaled in accordance with state standard 9353-2016 for wheat. Based on the selected and adjusted material, the initial table “objects-properties”, or a formal context for the formal concept analysis, is formed. To process this data, we used the free software package ConExp, which implements a methodical complex for formal concept analysis. The main results that these methods give for selection data structuring are demonstrated. These results include a lattice of formal concepts, implications and associative rules on a set of attributes. Moreover, the result of the OntoWorker software package being developed at ICCS RAS - SamSC RAS is demonstrated. The outcome consists in transforming and reducing the lattice of formal concepts into a special taxonomy of formal concepts (classes) that is more convenient for the user to perceive and interpret. It is noted that advanced methods of formal concept analysis can take into account the incompleteness of the considered data, determined by the series multiplicity of measurement experiments with different degrees of results reliability, and by the presence of competing measurement procedures with different degrees of confidence in their results. This reflects the realities of the empirical information accumulation directly during multidimensional observations and measurements in selection probations. It was emphasized that the effective application of the considered methods is possible only in cooperation of knowledge data expert and specialists in the field of formal concept analysis.

Еще

Список литературы Опыт бикластеризации данных о сортах сельскохозяйственных культур

  • Ganter B., Wille R. Formal Concept Analysis. Mathematical foundations. - Berlin-Heidelberg: Springer-Verlag, 1999. 290 p.
  • Ignatov D.I. Introduction to Formal Concept Analysis and Its Applications Information Retrieval and Related Fields // In: P. Braslavski, N. Karpov, M. Worring, Y. Volkovich, D.I. Ignatov (Eds.): Information Retrieval. Revised Selected Papers 8th Russian Summer School, 2014 (Nizhniy Novgorod, Russia, August 18-22, 2014). Springer International Publishing, 2015, pp. 42-141.
  • Смирнов С.В. Две методологии вывода формальных понятий: когда и как они должны работать вместе // Знания - Онтологии - Теории: Материалы VII международной конф. (711 октября 2019 г., Новосибирск, Россия). - Новосибирск: Институт математики СО РАН, 2019. С. 355363.
  • Пронина В.А., Шипилина Л.Б. Использование отношений между атрибутами для построения онтологии предметной области // Проблемы управления. 2009. № 1. С.27-32.
  • Zhang Zh. Constructing L-fuzzy concept lattices without fuzzy galois closure operation // Fuzzy Sets and Systems. 2017. pp. 71-86.