Фрактальный подход к структурированию знаний и примеры его применения

Автор: Массель Л.В.

Журнал: Онтология проектирования @ontology-of-designing

Рубрика: Инжиниринг онтологий

Статья в выпуске: 2 (20) т.6, 2016 года.

Бесплатный доступ

Статья описывает предложенный автором фрактальный подход к структурированию знаний, активно используемый для разработки онтологического пространства знаний, в первую очередь, в области энергетики. Вводится методологическое понятие фрактального информационного пространства и понятие фрактальной стратифицированной модели. Приводятся математическое описание этой модели и пример определения её фрактальной размерности. Рассматриваются примеры применения фрактального подхода и фрактальной стратифицированной модели в работах, выполненных под руководством автора.

Фрактальный подход, фрактальная стратифицированная модель, инвариант, онтологическое пространство знаний

Короткий адрес: https://sciup.org/170178716

IDR: 170178716   |   DOI: 10.18287/2223-9537-2016-6-2-149-161

Текст научной статьи Фрактальный подход к структурированию знаний и примеры его применения

Фрактальный подход был предложен автором в девяностых годах прошлого века [1], и развит в монографии [2]. Следует заметить, что в своё время этот подход вызывал непонимание, тем не менее, он прошёл испытание временем и сейчас получает новое звучание, в частности, в связи с возможностью его применения для обоснования целесообразности введения мета-мета-.. .уровней при проектировании онтологического пространства знаний различных предметных областей, что будет показано ниже на примерах, связанных с энергетикой.

  • 1    Понятие фрактал ьности

    В 90-е годы прошлого столетия в разных областях знания активно осознавалось, что многие изучаемые системы, объекты и процессы имеют фрактальную структуру [3-5]. Понятие « фрактал », впервые введённое Мандельбротом в 1975 году, обозначает широкий класс естественных и искусственных топологических форм, главной особенностью которых является самоподобная иерархически организованная структура [6]. Самоподобие , или масштабная инвариантность, является характерным свойством фрактальных структур. Математически фрактал определяют как множество с нецелой , или дробной , размерностью (последняя характеризует скорость увеличения (или уменьшения) элементов фрактала с увеличением (или уменьшением) интервала масштабов, на котором фрактал рассматривается). В качестве математического аппарата предлагается использовать обобщение дифференциального и интегрального исчисления на дробные (включая комплексные) порядки производной и кратности интеграла, с введением для него нового наименования «фрактальное исчисление» [7].

Математический смысл фрактальности, связываемый с дробной или нецелой размерностью, довольно абстрактен, зато геометрический смысл фрактальности более нагляден и прост. Его можно трактовать (используя свойство самоподобия фракталов) как бесконечную (вверх и вниз) - пирамиду единообразно изменяющихся ступеней, причём такая «лестница» масштабов может быть не только иерархически-геометрической, но и скрытой во временном поведении системы. Физический смысл фрактала иллюстрируют ставшими уже хрестоматийными примерами кроны дерева, ветви ели, листа папоротника. Примерами фрактальности в пространстве могут быть модель солнечной системы и планетарная модель атома; фрактальности во времени - клонирование или развитие растения из семени.

В [4] говорится о том, что фрактальность - это свойство не самого объекта, а свойство, которое помогает лучше понять природу объекта. В нашем случае фрактальность используется не в математическом, а в философском смысле, как методологическое свойство, позволяющее одновременное рассмотрение разномасштабных объектов и процессов с сохранением инварианта при изменении масштаба.

  • 2    Методологическое понятие фрактального информационного пространства

Скорость обнаружения фрактальных структур в разных областях знания (в физике, геологии, биологии [4-5] и др.) позволила сделать предположение, что знаниям также присуще свойство фрактальности. Проблема структурирования знаний наиболее активно рассматривается в рамках научного направления, условно называемого «искусственный интеллект». Несмотря на то, что теоретики этого направления стараются не использовать понятие «информация», фактически этот термин трактуется не в смысле энтропийной меры неопределённости Шеннона, а как мера приращения знаний либо синоним понятия «знания о предметной области» [8]. В качестве рабочего понятия в теории искусственного интеллекта берётся определение знаний как основных закономерностей предметной области (ПрО), позволяющих человеку решать конкретные производственные, научные и другие задачи, т.е. знания интерпретируются как факты, понятия, взаимосвязи, оценки, правила, эвристики (фактические знания), а также стратегии принятия решения в этой области (стратегические знания) [9].

Предложенная концептуальная модель структурирования знаний основана на представлении разных форм (видов) знаний как объектов расслоенного (стратифицированного) пространства [1, 2].

Информационное пространство определяется как пространство, в которое отображается вся доступная нам информация о жизнедеятельности живых и функционировании технических объектов - известная нам часть знаний о картине мира. Под объектом в этом информационном пространстве будем понимать некоторую совокупность свойств, проявляющихся в виде реального объекта или процесса. Сущность объекта - это инвариант, совокупность существенных и неизменяющихся свойств объекта. Тогда информация - это совокупность описания сущностей и отношений между ними (последние порождают изменяющиеся свойства объектов). В информационном пространстве можно представить сущность как дискретную точку - «свёртку» полной информации об объекте, а отношения - как векторы.

Предлагаемая концептуальная модель названа стратифицированной фрактальной моделью (или ФС-моделью ). При построении ФС-модели вводится понятие информационных миров - подпространств, объединяющих однотипные информационные объекты, т.е. объекты, определяемые совокупностью свойств, являющихся существенными в этом рассмотрении (координат данного подпространства).

ФС-модель определяется как совокупность непересекающихся слоёв (информационных миров) и их отображений в информационном пространстве. Каждому уровню соответствует свой слой (страта) этого пространства, и, следовательно, свой информационный мир; последовательность отображений отражает процесс познания. Графически ФС-модель удобно представлять в виде совокупности вложенных сферических оболочек. Информационный объект, обозначаемый условно точкой на одной из сфер, в свою очередь, может быть расслоен при необходимости более детального его рассмотрения (возвращаясь к аналогии с «частично-волновым дуализмом», в одном случае может быть удобно рассматривать сложный объект как точку, а в другом - перейти к более детальному рассмотрению выбранного объекта при сохранении «точечного» представления других).

Поскольку знания любого исследователя не всеобъемлющи, каждый практически работает со своим «фракталом» знаний - «вырезкой» из информационного пространства, которую можно представить в виде конуса или пирамиды, что соответствует, например, выделению дисциплин при изучении реального мира. Тогда наша сфера оказывается состоящей из множества пирамид «конусов», что согласуется с «пирамидами знаний» в когнитологии [9].

Ответ на часто задаваемый вопрос при обсуждении фрактального подхода: «Почему фрактальность, а не рекурсия?», состоит в том, что мы считаем рекурсию частным случаем проявления фрактальности. Более того, фрактальный подход может рассматриваться как обобщение объектного подхода к проектированию программных и информационных систем.

  • 3    Формализованное описание фрактальной стратифицированной модели

Ниже формулируются, с использованием обозначений теоретико-множественного описания ФС-модели, основные принципы предлагаемого методического подхода к структурированию знаний ПрО [2].

Вся существующая информация о ПрО (знания о реальных объектах и процессах) может быть отображена в информационное пространство L , состоящее из информационных объектов l i :

L = { l , } , i = 1, и .

Информационный объект l i представляется в виде совокупности свойств P j , отражающих реальный объект или процесс:

  • l i = { P j } , j = 1, m .

Знания некоторой ПрО могут быть структурированы с помощью ФС-модели, определяемой тройкой ( S , F , G ) и представляющей пространство L в виде слоёв (информационных миров) однотипных объектов l i , если:

  • 1)    каждый информационный мир S может быть расслоен;

  • 2)    информационный объект l i - совокупность элементарных или сложных свойств;

  • 3)    заданы разбиения S на слои однотипных объектов

S = { s i } , i = 1, и ,

( и si = S , si П sj =0 , i * j )

такие, что слой S i в свою очередь может быть расслоен;

  • 4)    задано множество отображений F (из любого слоя в каждый)

F = { F j : S i ^ s , } , F j = { f k : kt ^ l„ } ,

(si,sj)e S, lk e s, l„ e sj, таких, что сохраняются инварианты (существенные свойства любого li или всех li e Sj);

  • 5)    задано множество инвариантов G (инвариант задаётся логической функцией (предикатом), принимающей значение «истина» или «ложь»), определяемое тройкой

G , ( S , ) - «истина», если ( g i ( 1 1 ) &  g 2( 1 2 ) ... &  gm ( 1m )) - «истина».

На рисунке 1 показан фрагмент ФС-модели (для разбиения S), где выделен конус (соот ветствующий, например, ПрО), в котором показаны слои S. и возможные отображения pi.

Рисунок 1 - Пример графического представления фрактальной стратифицированной модели

  • 4    Один из подходов к определению размерности ФС-модели

При информационном моделировании или извлечении знаний об объекте можно условно поместить в центр ФС-модели изучаемый объект, считая, что его сущность окружена «слоями» информации, каждый из которых характеризует какой-то аспект (функциональную совокупность аспектов) жизнедеятельности объекта.

Тогда внешняя поверхность сферы есть пространство данных, причем нам известны, как правило, только некоторые точки этой поверхности. Внутренние слои - слои знаний об объекте, и они тем «концентрированнее», или агрегированнее, чем «ближе» к сущности объекта (или чем точнее описывают объект). Отображения слоёв можно сопоставить с переходами от фактов - к понятиям, далее - к правилам, закономерностям, законам. В связи с этим, отталкиваясь от понятий «область знаний» и «глубина знаний», можно рассмотреть один из подходов к определению фрактальной размерности ФС-модели.

Применим формальный метод, который позволит получить как степенной закон, так и выразить степенной показатель через фрактальную размерность.

Пусть гипотетическая область знаний имеет «длину» L (рисунок 2a), где некоторая часть (образно говоря, «рассекающая» гипотетическую область знания) нам неизвестна - см. рису- нок 26. В каждой области знаний все равно остаются неизведанные области (рисунок 2в). Тогда процесс получения новых знаний можно проиллюстрировать рисунком 3.

(a)

Рисунок 2 - Соотношение известного и неизвестного в гипотетической области знания

Рисунок 3 - Образная картина процесса получения знаний

Получаемая в итоге структура (см. рисунок 3) называется канторовским множеством, которое имеет фрактальную размерность:

(1)                             D = 1п 2 / In 3

Введём понятие «глубина знаний» H , которая, очевидно, будет зависеть от размера области знаний, т.е. H = H ( L ).

Согласно концептуальному рассуждению, которое фиксирует рисунок 3, увеличение глубины знаний в 2 раза сопровождается уменьшением размера области знаний в 3 раза. Отсюда следует функциональное уравнение:

2 - H = H ( L / 3).

Его решение:

H ( L ) ~ L 1п 2 / 1п 3.

Отождествляя 1п 2 / 1п 3 с фрактальной размерностью D (1), находим

H ( L ) ~ L ~ D .

В таком виде формула имеет общий характер. Таким образом:

глубина знаний = ( область знаний ) ~ D .

  • 5    Примеры применения фрактального подхода

    • 5.1    Фрактальный подход к построению информационных технологий

В соответствии с классической традиционной цепочкой решения задачи в области информационных технологий (задача - модель - алгоритм - программа - данные - программный продукт) можно выделить основные базовые слои или миры: мир математических моделей, мир алгоритмов, мир программ, мир моделей данных, мир моделей знаний. Учитывая последние тенденции, их можно дополнить миром онтологий.

Переход от «слоя» к «миру» обусловлен тем, что графически после расслоения информационного пространства мы можем представить любой слой в виде совокупности вложенных сферических оболочек.

При использовании фрактального подхода мы можем представить любую информационную технологию (ИТ) как совокупность информационных слоёв и их отображений. Процесс построения информационной технологии в таком случае заключается в разработке способов описания информационных слоёв (или объектов) и способов отображений из любого слоя в каждый, а реализация этих способов даёт инструментальные средства поддержки конкретной информационной технологии [2].

Фрактальность здесь проявляется, в частности, в том, что предлагаемый подход работает при построении разномасштабных информационных технологий: например, от проектирования ИТ системных исследований в энергетике (ИТ «в большом») до реализации конкретных информационно-программных систем (ИТ «в малом»).

Использование ФС-модели при построении ИТ позволяет:

  •    концептуально объединить разные способы структурирования знаний, применяемые в различных областях знаний, необходимых для решения поставленной задачи;

  •    применять различные способы выделения и упорядочивания слоёв (миров) в зависимости от поставленной цели;

  •    акцентировать внимание на актуальных мирах, являющихся предметом конкретной работы, отдавая должное значимости других миров;

  •    обеспечить последовательное осуществление стратегии построения информационной технологии (что достигается введением инварианта), независимо от глубины расслоения отдельных миров.

  • 5.2    Фрактальный подход к созданию ИТ-инфраструктуры

В частности, применение фрактального подхода для разработки инструментальных средств и языка ситуационного управления рассмотрено в [10].

системных исследований в энергетике

В Институт систем энергетики им. Л.А. Мелентьева (ИСЭМ) СО РАН под руководством автора выполнен проект по созданию ИТ-инфраструктуры системных исследований в энергетике с использованием фрактального подхода.

Под ИТ-инфраструктурой понимается телекоммуникационная распределённая информационно-вычислительная инфраструктура, а именно, совокупность технических и программных средств, телекоммуникаций и информационной базы научных исследований, технологий их разработки и использования, стандартов (как внутренних, так и внешних) для разработки информационных и программных продуктов в области исследований в энергетике, обмена ими и их представления на информационный рынок [11].

В составе ИТ-инфраструктуры выделяются: распределённая вычислительная, информационная и телекоммуникационная инфраструктуры (последняя связана с техническими аспектами создания ИТ-инфраструктуры). В последнее время она дополнена интеллектуальной инфраструктурой, включающей базы знаний, онтологии и интеллектуальные системы. Концепция создания ИТ-инфраструктуры методологически обосновывается с помощью ФС-модели, представленной на рисунке 4.

ФС-модель ИТ-инфраструктуры графически представляется в виде совокупности вложенных сферических оболочек (слоёв), определяемой тройкой (S, F, G), где S - множество слоёв, F - множество отображений, G - множество инвариантов. ИТ-инфраструктура S, согласно фрактальной методологии, расслаивается (стратифицируется) на интеграционную информационную инфраструктуру (SI), распределённую вычислительную инфраструктуру (SC ) и телекоммуникационную инфраструктуру ( ST). В свою очередь, SI расслаивается на слои данных и метаданных (SID , SIM); SC - на слои программ и метаописаний программ (SCP , SCM ). Вводятся отображения слоёв: F£ : SI ^ SC, F^ : SI ^ ST, FC : SC ^ ST . Инвариантами (G) являются цели системных исследований в энергетике, которые детализируются для каждого слоя. Для описания метаслоёв разработаны информационные модели, модели данных и онтологии; для реализации средств поддержки отображений - соответствующие Web-сервисы.

Рисунок 4 - Фрактальная стратифицированная модель ИТ-инфраструктуры системных исследований в энергетике

  • 5.3    Применение фрактального подхода при построении информационных систем и систем поддержки принятия решений

Фрактальный подход был применён при разработке ряда информационных систем, например, информационной системы для социологических исследований [12], в которой выделялись слои социологии, математической статистики и программной реализации. ФС-модель была успешно использована при разработке информационных структур, предназначенных для хранения закономерностей и объектов, описывающих группы анкет, отобранных по каким-либо признакам.

При разработке информационной системы мониторинга углеводородного сырья в ФС-модели выделялись четыре основных информационных подпространства (слоя): описание ПрО, метаслой (хранилище метаданных или Репозитарий), информационный слой (база данных) и пользовательский (интерфейс). Одна из работ связана с применением фрактального подхода для обоснования и поддержки принятия решений [13].

Для работы с информационным пространством данных и знаний создаётся единая информационная среда I E , которая объединяет описание данных и знаний{ D } и инструментальных средств работы с ними{ T }: I E = { D } и { T }.

Информационное пространство данных и знаний для принятия решений можно представить как:

D = { D e , D b , D y , D g , D r }, где De - слой исходных данных и знаний, DB - слой данных и знаний для обоснования решений, Dy - слой геоданных для визуализации решений, D g - слой данных и знаний для выработки решений, Dr - слой данных и знаний для реализации решений (рисунок 5).

D r - Реализация решения

D G - Выработка решения

Dy - Визуализация решения

DB - Обоснование решения

De - Сбор данных и знаний

Рисунок 5 - Слои информационного пространства, выделяемые при поддержке принятия решений

Согласно концепции ФС-модели, можно построить отображения из любого слоя в каждый.

В нашем случае используются 8 типов отображений:

  •    FBe : D e ^ DB - отображение из слоя исходных данных и знаний в слой данных и знаний для обоснования решений;

  •    F yC : De ^ Dy - отображение из слоя исходных данных и знаний в слой данных для визуализации;

  •    F gc : D e ^ D g - отображение из слоя исходных данных и знаний в слой данных и знаний для выработки решений;

  •    F gb : DB ^ D g - отображение из слоя исходных данных и знаний для обоснования решений в слой данных и знаний для выработки решений;

  •    FyB : DB ^ Dy - отображение из слоя исходных данных и знаний для обоснования решений в слой данных для визуализации;

  •    F g V : Dy ^ D g - отображение из слоя исходных данных для визуализации в слой данных и знаний для выработки решений;

  •    Frg : Dg ^ Dr - отображение из слоя данных и знаний для выработки решений в слой данных и знаний для реализации решений;

  •    FRy : Dy ^ Dr - отображение из слоя данных для визуализации в слой данных и знаний для реализации решений.

  • 5.4    Фрактальный подход к построению

Отображения поддерживаются инструментальными средствами:

T = { T y , T it , T ie }, , где Ty -инструментальные средства визуализации (геокомпонент), TIT -инструментальные средства интеллектуальной ИТ-среды, TIE - инструментальные средства единой информационной среды (ИТ-инфраструктуры).

В свою очередь, информационное пространство данных и знаний для принятия решений D может быть расслоено: D = { Dk } и { Zk }, где Dk - слой данных, Zk - слой знаний.

онтологического пространства знаний в энергетике

Для поддержки системных исследований в энергетике необходимо создание единого онтологического пространства знаний в области энергетики, что обусловлено следующим.

Системные исследования энергетики предусматривают комплексное рассмотрение исследуемых проблем и интегрируют исследования систем энергетики (электроэнергетических, тепло-, газо-, нефте-, нефтепродуктоснабжения), энергетической безопасности России, региональных проблем энергетики, взаимосвязей энергетики и экономики, перспективных энергетических источников и систем, прикладной математики и информатики [11].

Иными словами, выполняются исследования развития и функционирования как отраслевых систем энергетики (электроэнергетических, газо-, нефте- и нефтепродуктоснабжающих, теплоснабжающих и др.), так и топливно-энергетического комплекса (ТЭК) в целом. Исследования выполняются для России, её регионов и СНГ. Результаты исследований отраслевых систем энергетики зачастую являются исходными данными для исследований ТЭК, а результаты исследований направлений развития ТЭК должны учитываться при исследованиях развития отраслевых систем энергетики. Таким образом, для проведения системных исследований энергетики необходимы координация и согласование исходной и результирующей информации для получения обоснованных выводов и рекомендаций, которые готовятся для внешних организаций, а для этого необходимо создание интегрированной информационной и вычислительной среды исследований, включающей онтологическое пространство знаний.

Необходимость создания единого онтологического пространства знаний в энергетике обусловлена актуальностью проблемы сохранения уникальных знаний учёных старшего поколения, связанной с тем, что в 90-х годах прошлого века произошел отток научных кадров из институтов Академии наук, в связи с чем в ИСЭМ СО РАН, как и во многих других институтах, наблюдается возрастной разрыв (недостаточное количество учёных среднего возраста при наличии большого контингента молодых учёных и аспирантов).

На рисунках 6-8 приведены построенные в CMapTools примеры онтологий, иллюстрирующие применение фрактального подхода при построении онтологического пространства знаний в энергетике.

Метаонтология, в которой определены базовые понятия ТЭК, приведена на рисунке 6. Значок в блоке «Электроэнергетические системы» обозначает возможность перехода на следующий уровень - к метаонтологии электроэнергетических систем (рисунок 7), а из неё - к уровню детальных или комбинированных онтологий. На рисунке 8 приведена одна из детальных онтологий - онтология транспорта электроэнергии, которая, в свою очередь, может рассматриваться как метаонтология или комбинированная онтология, если возникнет необходимость детализации входящих в неё понятий (например, понятия «сетевые компании»).

Для наполнения онтологического пространства знаний разработан ряд онтологий, описанных, например, в [14-16], выполнен онтологический инжиниринг проблемы ситуационного управления в энергетике [17].

Заключение

В статье рассмотрен фрактальный подход к структурированию знаний. Предложена фрактальная стратифицированная модель информационного пространства, приведено её формализованное описание, рассмотрен один из подходов к определению фрактальной размерности.

Приведены примеры применения фрактального подхода для построения информационных технологий, при разработке ИТ-инфраструктуры системных исследований в энергетике, при построении информационных систем и систем поддержки принятия решений; при построении онтологического пространства знаний в энергетике.

Следует заметить, что научные направления, связанные с использованием фракталов, продолжают активно развиваться [18-20].

Рисунок 6 - Метаонтология топливно-энергетического комплекса

Рисунок 7 - Метаонтология электроэнергетических систем

Рисунок 8 - Онтология транспорта электроэнергии

Автор благодарит сотрудников лаборатории Информационных технологий ИСЭМ СО РАН, совместная работа с которыми и обсуждение научных проблем способствовали формулировке результатов, представленных в статье. Кроме того, автор выражает благодарность энтузиасту «фрактальных вычислений» Балханову В.К. за предложенный подход к определению фрактальной размерности ФС-модели.

Результаты, изложенные в статье, получены при частичной финансовой поддержке грантов РФФИ № 16-07-00474 и № 16-07-00569, а также гранта Программы Президиума РАН №229 (2015-2017).

Список литературы Фрактальный подход к структурированию знаний и примеры его применения

  • Массель, Л.В. Фрактальная модель структурирования знаний / Л.В. Массель // Сб. науч. трудов Национальной конференции с международным участием "Искусственный интеллект-94". Т. 1 - Рыбинск, 1994. - С. 46-49.
  • Массель, Л.В. Фрактальный подход к построению информационных технологий / В кн.: Криворуцкий Л.Д., Массель Л.В. Информационная технология исследований развития энергетики. - Новосибирск: «Наука», Изд. фирма РАН, 1995. - С. 40-67.
  • Федер, Е. Фракталы / Е. Федер. - М.: Мир, 1991. - 176 с.
  • Фракталы в физике / Труды IV Международного симпозиума по фракталам в физике. - М.: Мир, 1988. - 682 с.
  • Урицкий, В.М., Музалевская, Н.И. Фрактальные структуры и процессы в биологии / В.М. Урицкий, Н.И. Музалевская // В сб. трудов «Биомедицинская информатика и эниология (проблемы, результаты, перспективы)» / Под ред. Р.И. Полонникова, К.Г. Короткова - Санкт-Петербург: "Ольга", 1995. - С. 84-129.
Статья научная