Опыт бикластеризации данных о сортах сельскохозяйственных культур
Автор: Семенова Валентина Андреевна
Журнал: Известия Самарского научного центра Российской академии наук @izvestiya-ssc
Рубрика: Информатика, вычислительная техника и управление
Статья в выпуске: 1 т.22, 2020 года.
Бесплатный доступ
Статья посвящена анализу объектно-признаковых данных в слабо структурированных областях. Конкретно, рассматривается демонстрационный пример бикластеризации подобных данных в области селекции сельскохозяйственных культур. Показывается, какие при этом открываются возможности для систематизации эмпирических данных. Рассматриваемый метод бикластеризации данных - классический анализ формальных понятий - представляет собой прикладную ветвь теории решеток; приведена краткая справка о его математических основах. Исходный материал для демонстрационного примера был заимствован из каталога инновационных разработок Самарского НИИСХ им. Н.М. Тулайкова. В качестве объектов анализа избраны сорта мягкой яровой пшеницы, в качестве признаков - несколько описывающих их свойств. Ряд этих свойств подвергнут шкалированию в соответствии с ГОСТ 9353-2016 для пшеницы. На основе отобранного и скорректированного материала сформирована исходная таблица «объекты-свойства», или формальный контекст для анализа формальных понятий. Для обработки этих данных использован свободно распространяемый программный пакет ConExp, реализующий методический комплекс анализа формальных понятий. Продемонстрированы основные результаты, которые дают эти методы для структуризации эмпирических данных: решетка формальных понятий, импликации и ассоциативные правила на множестве признаков. Кроме того, продемонстрирован результат работы программного комплекса OntoWorker, разрабатываемого в ИПУСС РАН - СамНЦ РАН, заключающийся в трансформациии редукции решетки формальных понятий в специальную таксономию формальных понятий (классов), более удобную для восприятия и интерпретации пользователем. Отмечено, что расширенные методы анализа формальных понятий могут учитывать неполноту исследуемых данных, обусловливаемую множественностью серий измерительных экспериментов с разной степенью достоверности результатов и наличием конкурирующих измерительных процедур с разной степенью доверия к их результатам. Это отражает реалии накопления эмпирической информации и может быть использовано непосредственно при многомерных наблюдениях и измерениях в селекционных испытаниях. Подчеркнуто, что эффективное применение рассмотренных методов возможно лишь при сотрудничестве экспертов предметной области и специалистов в области анализа данных.
Объектно-признаковые данные, анализ формальных понятий, формальный контекст, решетка формальных понятий, импликации на признаках, сельскохозяйственные культуры, пшеница мягкая яровая, засухоустойчивость, устойчивость к бурой ржавчине
Короткий адрес: https://sciup.org/148314219
IDR: 148314219
Список литературы Опыт бикластеризации данных о сортах сельскохозяйственных культур
- Ganter B., Wille R. Formal Concept Analysis. Mathematical foundations. - Berlin-Heidelberg: Springer-Verlag, 1999. 290 p.
- Ignatov D.I. Introduction to Formal Concept Analysis and Its Applications Information Retrieval and Related Fields // In: P. Braslavski, N. Karpov, M. Worring, Y. Volkovich, D.I. Ignatov (Eds.): Information Retrieval. Revised Selected Papers 8th Russian Summer School, 2014 (Nizhniy Novgorod, Russia, August 18-22, 2014). Springer International Publishing, 2015, pp. 42-141.
- Смирнов С.В. Две методологии вывода формальных понятий: когда и как они должны работать вместе // Знания - Онтологии - Теории: Материалы VII международной конф. (711 октября 2019 г., Новосибирск, Россия). - Новосибирск: Институт математики СО РАН, 2019. С. 355363.
- Пронина В.А., Шипилина Л.Б. Использование отношений между атрибутами для построения онтологии предметной области // Проблемы управления. 2009. № 1. С.27-32.
- Zhang Zh. Constructing L-fuzzy concept lattices without fuzzy galois closure operation // Fuzzy Sets and Systems. 2017. pp. 71-86.