О методах выявления экспертного знания для создания прикладных консультационных и обучающих систем
Автор: Подлипский О.К.
Журнал: Труды Московского физико-технического института @trudy-mipt
Статья в выпуске: 1 (9) т.3, 2011 года.
Бесплатный доступ
Короткий адрес: https://sciup.org/142185711
IDR: 142185711
Текст статьи О методах выявления экспертного знания для создания прикладных консультационных и обучающих систем
Традиционно различаются два. вида, знания — декларативное и процедуральное. Декларативное знание представляет собой теории, факты, сведения. Процедуральное знание — это умение применять декларативное знание на практике. В медицине типичной является задача, постановки диагноза. на. основе проведенных обследований, то есть требуется либо определить конкретный вид заболевания, либо установить, что пациент здоров. Наиболее важная характеристика, таких задач принятия решений — их повторяемость: люди решают данные задачи многократно, вырабатывая навыки наиболее успешного, эффективного решения. Данная область профессиональной деятельности имеет дело с крайне сложными объектами с недостаточно изученными свойствами, внутренней структурой и зависимостями между параметрами. Это не позволяет найти точные и однозначные формальные правила, решения задач классификации. Вместо этого люди вырабатывают своп практические навыки решения таких задач [1]. Совершенно очевидно, чтобы стать хорошим специалистом, людям требуется достаточно длительная практика. Специалиста, достигшего высшего уровня мастерства, в своей профессиональной области, принято называть экспертом. Как показали исследования в когнитивной психологии, путь от новичка, до эксперта, занимает не менее 10 лет интенсивной практики. За. эти годы созревает умение эксперта, быстро и эффективно решать свои профессиональные задачи, на основе метода, проб и ошибок он вырабатывает правила, принятия успешных решений [2].
Длительность формирования экспертных навыков определяет актуальность задачи сокращения этого времени путем создания новых компьютерных технологий, способных не только создавать в компьютере копии экспертных знаний (модель эксперта), по и эффективно обучать моло дых специалистов. Основной проблемой при создании таких систем является то, что процеду-ральные знания эксперта, не могут быть вербализованы, то есть эксперт не может объяснить, как он решает задачу. Например, опытный врач легко ставит диагноз по совокупности симптомов, но он не может объяснить ход мыслей, приведший его к решению.
Разработаны методики, позволяющие в короткие сроки создавать полные и непротиворечивые базы экспертных знаний, полностью отражающие предпочтения эксперта, основанные па. его опыте и интуиции [3]. Предложенный автором метод построения баз экспертных знаний был использован для построения баз экспертных знаний в задачах диагностики острого инфаркта, миокарда, расслаивающей аневризмы аорты [4], [5] и быстроп-рогресспрующего гломерулонефрита. Полученные базы знаний стали основой разработанных компьютерных обучающих и консультационных систем [6], [7].
В данной статье мы рассмотрим методы построения баз экспертных данных, а. также приведем формальное описание полученной модели эксперта. по быстропрогрессирующему гломерулонефриту.
Экспертная классификация альтернатив
Многие важные практические задачи, ежедневно решаемые экспертами в различных областях, представляют собой задачи классификации. Примером такой задачи является задача, медицинской диагностики, в которой объектом исследования является пациент, чье состояние описывается некоторым набором записей из его истории болезни, а. классами решений являются возможные заболевания. Предполагается, что классы решений упорядочены по степени выраженности некоторого свойства, (наличие и степень тяжести забо-
Работа выполнена при поддержке гранта Президента РФ МК-1512.2010.9, АВЦП «Развитие научного потенциала высшей школы», ФЦП «Научные и научно-педагогические кадры инновационной России»
левания пациента, и т. и.). Объекты (или альтернативы), подлежащие классификации, описываются, как правило, оценками по различным критериям, которые могут иметь как качественный, так и количественный характер.
Для решения задач классификации в Институте системного анализа. РАН была, разработана, методология вербального анализа, решений (ВАР). В соответствии с принципами ВАР, для работы с широким кругом задач принятия решений под руководством О.И. Ларичева, было создано семейство методов, успешно применяющихся для решения практических задач [8], [9].
Применяемая нами методика, извлечения экспертных знаний состоит в следующем. Извлечение знаний происходит в диалоге с экспертом.
На первом этапе производится структуризация предметной области. Например, применительно к медицине фиксируются основные признаки заболевания, симптомы (значения признаков) и степени развития заболевания. В результате все возможные пациенты будут описываться одним из сочетаний симптомов по всем признакам. Для построения базы экспертных знаний в рассматриваемой области эксперт должен указать заболевание для каждого сочетания симптомов. То есть он должен отнести каждый объект к одному из указанных классов.
Второй этап методики выявления знаний — экспертная классификация — состоит в предъявлении эксперту последовательности сочетаний значений признаков. Этот этап является довольно длительной процедурой, поскольку число всевозможных сочетаний признаков обычно весьма, велико. Долгая рутинная работа, по диагностике сочетаний может снижать внимание эксперта, и приводить к ошибкам. Методика, предусматривает выделение из исходной задачи классификации упрощенных задач, которые получаются из исходной переходом только к двум значениям по каждому признаку [10]. Решение упрощенных задач производится гораздо быстрее, что позволяет получить более падежные результаты. Правила, полученные в результате решения упрощенных задач, вводятся в систему, и эксперт решает задачу в полном пространстве.
Третий этап методики — проверка, границ классов. Дело с том, что эксперт тоже человек и может ошибаться. Вместе с тем границы классов — это ключевые элементы в определении классификации. Поэтому необходимо проверить назначенный им класс, для чего каждый граничный элемент повторно предъявляется эксперту.
На четвертом этапе полученные границы классов преобразуются в экспертные решающие правила. специального вида. Выявленные правила, соответствуют неявным экспертным знаниям. Исследования показали, что граничные объекты классов могут быть достаточно точно описаны сравнительно небольшим числом правил, имеющих структуру двухуровневого дерева, корню которого соответствует конъюнкция значений некоторых наиболее важных (основных) критериев, а. концевым вершинам — сочетания характерных для рассматриваемого класса, оценок по менее важным (дополнительным) критериям [11], [12].
В результате применения описанной методики получается полная и непротиворечивая база, экспертных знаний в заданной области.
Построение баз знаний группой экспертов
Как показали исследования, при решении сложных задач, в которых граница, класса, решений описывается большим числом правил, а. также при решении сложных задач, с которыми эксперт ранее не встречался в своей практике, возможны случаи, когда, эксперт затрудняется отнести ситуацию к тому или иному классу [13]. При этом для построения базы знаний эксперт должен классифицировать все объекты. Поэтому более полную информацию о задаче классификации можно получить, привлекая к ее решению нескольких экспертов [14], [15].
Базы знаний, построенные группой экспертов, более качественно описывают задачу классификации и могут быть использованы при построении как консультационных, так и обучающих систем. В случае консультационных систем появится характеристика, отражающая степень уверенности в диагнозе. В случае обучающих систем упростится отбор ситуаций, которые нужно оставить для обучения. Опрос эксперта. — трудоемкий процесс, состоящий иногда из тысяч вопросов к эксперту. Новые методы, разработанные в последние годы, позволили строить полные и непротиворечивые классификации в пространствах векторных описаний объектов с произвольными количествами классов и градаций на. шкалах критериев в задачах большой размерности. Можно рассматривать решение задачи классификации группой из Z экспертов как решение Z отдельных задач. В этом случае трудозатраты по построению баз знаний возрастут в точности в Z раз. Однако знания экспертов в одной области при решении одной задачи не должны сильно различаться. На большую часть задач (простого и среднего уровня) они обязаны давать одинаковые ответы. Различие может наступить лишь при решении наиболее сложных задач. Также отметим, что при любом опросе эксперт обязан решить все задачи, отвечающие «граничным» ситуациям. Количество граничных элементов достаточно мало по сравнению с общим количеством альтернатив, подлежащих классификации. Например, в [10] показано, что в бинарных задачах с N шкалами критериев суммарное число граничных элементов на. границе, разделяющей два. соседних класса, не превышает N/ 2 N/ 2 — 1
в случае четного N величины о = cn + cn , а в случае нечетного N величины S = 2CNN/2]. А общее количество вопросов, задаваемое эксперту, может в десятки раз превышать количество граничных ситуаций.
Таким образом, чтобы существенно сократить суммарное время работы инженера-когнитолога. и группы экспертов по построению баз знаний, предложена. следующая методика. [15]. На этапе экспертной классификации все эксперты сначала, решают упрощенные задачи, после чего один из экспертов решает задачу в полном пространстве. Для построенной им базы знаний выделяются границы классов решений, затем каждый из оставшихся экспертов начинает работу в полном пространстве с решения задач, отвечающих границам классов решений первого эксперта. Предполагается, что границы классов решений для каждого эксперта, будут «лишь немного» отличаться друг от друга. Поэтому предложенная методика, может дать существенный выигрыш по сравнению с независимым построением баз знаний экспертами. Также возможна, вариация методики, предполагающая использование результатов первого эксперта, еще на. этапе решения упрощенных задач.
Построение формальной модели эксперта по быстропрогрессирующему гломерулонефриту
Быстропрогрессирующий гломерулонефрит (БПГН) [16] — аутоиммунное поражение почек, характеризующееся при естественном течении крайне быстрым прогрессированием почечной недостаточности — удвоение исходного уровня креатинина. крови происходит за. 2 месяца, и менее. В результате при отсутствии лечения пациент за. несколько месяцев может достигнуть терминальной почечной недостаточности, требующей лечения диализом. Кроме того, больные БПГН характеризуются высокой смертностью из-за осложнений тяжелой артериальной гипертонии, легочных кровотечений (при БПГН в рамках системных васкулитов) и др. В то же время разработанные методы иммуносупрессивной терапии позволяют остановить прогрессирование болезни, а. во многих случаях добиться полной нормализации функции почек. Основным условием успешного лечения является его своевременное начало, однако из-за. трудностей дифференциальной диагностики, недостаточного опыта, врачей, а. также того, что биопсия почки, па. данных которой строится диагноз, не всегда, доступна, и может быть противопо-казапа из-за. тяжести состояния больного, нередко БПГН не распознается и приводит к неблагоприятному исходу. Навыки диагностики БПГН необ ходимы не только нефрологам, по также терапевтам, врачам отделений интенсивной терапии, ревматологам, кардиологам, пульмонологам и другим представителям терапевтических специальностей, которые сталкиваются с данным заболеванием в своей практике. Совместно с экспертами Московской медицинской академии имени И.М. Сеченова, была, построена, полная и непротиворечивая база, знаний по быстропрогрессирующему гломерулонефриту, которая легла, в основу созданной прикладной консультационной системы.
Задача, диагностики БПГН рассматривалась как задача, порядковой классификации в многомерном пространстве. Было выделено 2 класса, решений, 8 признаков, 6912 объектов для классификации. В результате опроса, эксперта, была, построена. полная п непротиворечивая база, знаний по БПГН. В класс решений C 1 («БПГН вероятен, по нужны дополнительные исследования») попало 3710 альтернатив, а в класс решений C 2 («БПГН маловероятен») попало 3202 альтернативы. Границы классов суммарно содержат 28 элементов.
Опишем формально модель эксперта, по БПГН.
-
• G — свойство, отвечающее целевому критерию задачи, — заболевание БПГН.
-
• K = {K 1, K 2, ..., K 8 } — множество критериев (признаков), по которым оценивается каждый объект исследования.
-
• Sq = {kq. kq.....k^qq} д,ля q = 1.....8 — мно
жество оценок по критерию Kq; wq — число градаций на шкале критерия Kq; оценки в Sq упорядочены по убыванию характерности для свойства G. То есть на каждом множество Sq определено отношение Qq такое, что kqQqkj ^ i < j.
-
• Y = S 1 x S 2 x ... x S 8 — декартово произведение шкал критериев определяет пространство состояний объектов (альтернатив), подлежащих классификации. L = |Y| = 8
= П ш q = 6912 — мопнюсть множества. Y. q =1
-
• C = {C 1 , C 2 } — множество классов решений, упорядоченных по убыванию выраженности свойства. G. То есть на. множестве C определено отношение Q c такое, что CiQcCj ^ ^ i < j.
Выделенные классы решений: «БПГН вероятен, по нужны дополнительные исследования» ( C 1) и «БПГН мгктовероятеи» C 2.
Каждый объект множества Y описывается набором оценок по критериям K 1, ...,K8 и представляется в виде векторной оценки у Е Е Y. где у = (у 1. у2 у8). yq равно номеру оценки из множества Sq. Полагаем, что нумерация начинается с 0, то есть объект с наибольшей выраженностью свойства G представляется вектором (0; 0;...; 0), а объект с наименьшей выраженностью свойства. G представляется вектором (ш 1 — 1: ш2 — 1: ...: ш8 — 1). На множестве Y введено бинарное отношение строгого доминирования Р: (Vx,y G Y)xPy ^ {Vq = 1 8 : xq > yq II 3 q0 G {1.....8} : xq0 > yq0 }.
База, знаний эксперта. — отображение F : Y ^ {Y4}, i = 1 , 2. такое к что Y = Y S Y2: Yi П Y 2 = 0 ( Y — множество векторных оценок, принадлежащих классу Ci ), удовлетворяющее свойству непротиворечивости: Vx,y G Y : x G Y ,y G Y,xPy ^ i > 3- Получены множества Yl ,Y 2 : | Y | =
= 3710 , |Y 2 | = 3202.
Границы множества Y 1: верхняя — 00000000, нижняя — 11122421, 11120202, 11021202, 10121202, 01122422, 01122303, 11111403, 01022403, 00122403, 00022313, 11122023, 11111223, 01122223, 01121423, 01112423.
Границы множества Y >:
верхняя — 00030000, 00000500, 11121102, 10002102, 10020302, 10020112, 10000312, 10020103, 01122403, 01022313, 00122313, 00022413, 00022323, нижняя — 11132523.
Границы были преобразованы в правила, специального вида.
Приведем пример сложного правила:
Если ситуация характеризуется следующими (или более типичными для класса C 1) оценками
«Есть клинические признаки системного васкулита. или системной красной волчанки»,
«Протеинурия менее 1 г/сут»,
«Эритроцитурия»,
«Креатинин больше нормы. Динамика: снижение»,
«Размеры почек по данным УЗИ — увеличены, признаки отека, паренхимы», то для отнесения ситуации к классу C 1 достаточно выполнения хотя бы одного из условий:
«Есть артериальная гипертония» или «Анемия есть».
Построение прикладных консультационных и обучающих систем
Одним из основных направлений в искусственном интеллекте является создание компьютерных систем, имитирующих искусство эксперта. Подобные системы позволяют сохранить знание опытного профессионала, сделать его бессмертным и применимым одновременно во многих местах. Основой таких систем являются базы экспертных знаний. А после нахождения способа, компактного представления знаний эксперта, становится возможным решение проблемы эффективного обучения искусству диагностики. Цель обучения — создание в долговременной памяти молодого специалиста. подсознательных правил, позволяющих принимать решения так же, как это делает эксперт.
Базы знаний, построенные группой экспертов, более полно описывают задачу классификации и могут быть использованы при построении прикладных консультационных и обучающих систем. В случае консультационных систем появится характеристика, отражающая степень уверенности в диагнозе [14], [15]. В случае обучающих систем упростится отбор ситуаций, которые нужно оставить для обучения [17].
Развитие методов построения баз знаний группой экспертов может существенно улучшить качество создаваемых прикладных систем.
Список литературы О методах выявления экспертного знания для создания прикладных консультационных и обучающих систем
- Schmidt H.G. On acquiring expertise in medicine/H.G. Schmidt, H.P.A. Boshuizen//Educational Psychology Review. { 1993. { N 5. { P. 1{17.
- Ericsson K.A. The Acquisition of Expert Performance: An Introduction to Some of the Issues//The Road to Excellence: The Acquisition of Expert Performance in the Art and Sciences, Sports and Games/Ed. K.A. Ericsson Hillsdale. N.J.: Lawrence Erlbaum Associates