Алгоритм коррекции связей между фрагментами слабо формализованной информации в хранилище и генерации новой информации

Автор: Копыльцов Антон Александрович

Журнал: Вестник Нижневартовского государственного университета @vestnik-nvsu

Статья в выпуске: 3, 2014 года.

Бесплатный доступ

Разработан алгоритм коррекции связей между фрагментами слабо формализованной информации, поступающей от технических систем. Предполагается, что информация поступает в хранилище и характеризуется некоторым конечным набором показателей. Осуществляется свертка этих показателей, которая представляет собой взвешенную сумму с весовыми коэффициентами. Далее осуществляется сравнение полученной свертки со свертками фрагментов ранее поступивших фрагментов информации в хранилище. Если евклидово расстояние между свертками меньше некоторого заранее заданного числа ε, то считается, что эти фрагменты информации между собой связаны. В хранилище рассматриваются связи между фрагментами информации, и осуществляется их коррекция, т.е. выявление фрагментов информации, находящейся в хранилище, которые между собой связаны с точностью до ε, до 2 ε, до 3 ε и т.д. Таким образом, вводится уровень связности первого, второго, третьего и других порядков. Информация о том, что некоторые фрагменты информация между собой связаны, можно рассматривать как новую информацию, и эта новая информация определяется множеством показателей, которое представляет объединение показателей, которыми определяются первоначальные фрагменты информации...

Еще

Информация, обработка информации, технические системы

Короткий адрес: https://sciup.org/14116836

IDR: 14116836

Текст научной статьи Алгоритм коррекции связей между фрагментами слабо формализованной информации в хранилище и генерации новой информации

В последние годы много внимания уделяется обработке слабо формализованной информации, поступающей от технических систем [3—11]. Под слабо формализованной информацией обычно понимают информацию, которая поступает от технических систем в непрерывном или дискретном виде с видео, аудио, температурных, ионных и других датчиков. Такая разнообразная информация, поступающая в больших объемах, плохо поддается обработке. Поэтому из слабо формализованной информации стараются получить формализованную путем, например, представления непрерывной информации в дискретном виде, а дискретную информацию можно, например, записать в таблицу в определенном, заранее выбранном, формате. Однако это не всегда возможно [2]. Часто поступающие от технических систем фрагменты информации взаимосвязаны. Однако эта взаимосвязь не очевидна, и трудно определить, какая информация следует из другой информации. Поэтому предлагается алгоритм коррекции связей между фрагментами слабо формализованной информации, находящимися в хранилище, который позволяет установить степень взаимосвязи различных фрагментов информации. Эту взаимосвязь фрагментов информации можно рассматривать как новую информацию и подвергать дальнейшей обработке.

Обработка информации, поступающей в хранилище.

Предполагается, что информация в хранилище характеризуется некоторым конечным набором показателей. При поступлении новой информации в хранилище осуществляется свертка ее показателей ( C N — результат свертки) [1; 3; 5; 12; 13] и сравнение со свертками ( C 1 , C 2 , …, C k ) ранее полученных фрагментов информации, находящихся в хранилище, следующим образом. Если δ Ni = |C N —C i | < ε для некоторого i {1, 2, …, k } и некоторого >0 , то считаем, что новая информация с номером N и старая информация с номером i между собой связаны.

Пусть фрагменты информации поступают в хранилище. Считаем соответствующие им свертки С 1 , С 2 , …, С n . Рассмотрим δ ij = |C i – C j |, где i, j = 1, 2, …, n и i ≠ j. Если δ ij ε для некоторого ε > 0, то считаем, что эти фрагменты информации взаимосвязаны и образуют устойчивую группу взаимосвязанных фрагментов информации.

Коррекция связей в хранилище и генерация новой информации.

Рассмотрим сеть связей в хранилище для устойчивой группы взаимосвязанных фрагментов информации, состоящей из n элементов, i = 1, … , n . Если между информацией с номером i и информацией с номером j имеется С ij связей и С ij > C* , где C* — некоторое число, то считаем, что информация с номером i и информация с номером j связаны непосредственно (уровень связности С ij ) (рис. 1).

Информацию о том, что информация с номером I i и информация с номером I j связаны, можно рассматривать как новую информацию с номером I k . Это означает, что если информация с номером I i определяется показателями i 1 , i 2 , …, i i1 , а информация с номером I j — показателями j 1 , j 2 , …, j j1 , то информация с номером I k = I i j определяется показателями i 1 , i 2 , …, i i1 , j 1 , j 2 , …, j j1 , представляющими собой объединение показателей, которыми определяется информация с номерами I i и I j . Это означает, что свертка в дальнейшем делается по показателям i 1 , i 2 , …, i i1 , j 1 , j 2 , …, j j1 .

A

B

X

Рис. 1. Уровни связности между точками

Если число связей второго порядка больше или равно двум (например, между точками А и В (сплошные линии)), то считаем, что точки А и В связаны непосредственно (уровень связности между точками А и В больше или равен 2, т.е. С АВ ≥ 2, пунктирная линия)

В некоторых случаях можно между информацией с номером I i и информацией с номером I j ввести отношение порядка, т.е. определить, какая из них предшествующая, а какая последующая, или какая из какой следует.

Это можно сделать следующим образом. Если информация с номером Ii определяется показателями i1, i2, …, ii1, а информация с номером Ij — показателями j1, j2, …, jj1 , и если все показатели i1, i2, …, ii1 характеризуются более ранними временными характеристиками, чем все показатели j1, j2, …, jj1, то информация с номером Ii предшествует информации с номером Ij . Однако это не позволяет сделать заключение о том, что информация с номером Ij следует из информации с номером Ii, или наоборот.

Для того, чтобы информация с номером I i , определяемая показателями i 1 , i 2 , …, i i1 , следовала из информации с номером I j , определяемой показателями j 1 , j 2 , …, j j1 , нужно, чтобы информация с номером I i уже содержалась в информации с номером I j , т.е. { i 1 , i 2 , …, i i1 } { j 1 , j 2 , …, j j1 }. Это означает, что в информации с номером I j уже содержится информация с номером I i , и поэтому из I j можно получить I i , т.е. I i следует из I j .

Пусть дан фрагмент информации с номером I j , определяемый показателями i 1 , i 2 , …, i k . Тогда из этого фрагмента информации следуют фрагменты информации, каждый из которых определяется некоторым подмножеством множества { i 1 , i 2 , …, i k }, т.е.

{i 1 } {i1, i2, …, ik},

{i 2 } {i1, i2, …, ik},

{i 3 } {i1, i2, …, ik},

{i1, i2} ⊂ {i1, i2, …, ik}, {i1, i3} ⊂ {i1, i2, …, ik}, {i1, i4} ⊂ {i1, i2, …, ik}, и т.д.

Например, пусть дан фрагмент информации с номером I, определяемый показателями i1, i2, i3,, i4. Тогда

{i1} {i1, i2, i3,, i4}, или I1 I1234 ,

{i2} {i1, i2, i3,, i4}, или I2 I1234 ,

{i3} {i1, i2, i3,, i4}, или I3 I1234 ,

{i4} {i1, i2, i3,, i4}, или I4 I1234 ,

{i1, i2}

{i1, i2, i3,, i4}, или I12

I1234 ,

{i1, i3}

{i1, i2, i3,, i4}, или I13

I1234 ,

{i1, i4}

{i1, i2, i3,, i4}, или I14

I1234 ,

{i2, i3}

{i1, i2, i3,, i4}, или I23

I1234 ,

{i2, i4}

{i1, i2, i3,, i4}, или I24

I1234 ,

{i3, i4}

{i1, i2, i3,, i4}, или I34

I1234 ,

{i1, i2, i3}

{i1, i2, i3,, i4}, или I123 I1234

{i1, i2, i4}

{i1, i2, i3,, i4}, или I124 I1234

{i1, i3, i4}

{i1, i2, i3,, i4}, или I134 I1234

{i2, i3, i4}

{i1, i2, i3,, i4}, или I234 I1234

Аналогично можно получить для {i1, i2, i3}:

{i1} {i1, i2, i3}, или I1 I123 ,

{i2} {i1, i2, i3}, или I2 I123 ,

{i3} {i1, i2, i3}, или I3 I123 ,

{i1, i2} {i1, i2, i3}, или I12 I123 ,

{i1, i3} {i1, i2, i3}, или I13 I123 ,

{i2, i3} ⊂ {i1, i2, i3}, или I23 ⊂ I123, для {i1, i2, i4}:

{i1} {i1, i2, i4}, или I1 I124 ,

{i2} {i1, i2, i4}, или I2 I124,

{i3} {i1, i2, i4}, или I3 I124 ,

{i1, i2} ⊂ {i1, i2, i4}, или I12 ⊂ I124 , {i1, i4} ⊂ {i1, i2, i4}, или I14 ⊂ I124 , {i2, i4} ⊂ {i1, i2, i4}, или I24 ⊂ I124, для {i2, i3,, i4}:

{i2} {i2,, i3,, i4}, или I2 I234 ,

{i3} {i2,, i3,, i4}, или I3 I234 ,

{i4} {i2,, i3,, i4}, или I4 I234 ,

{i2,, i3} ⊂ {i2,, i3,, i4}, или I23 ⊂ I234 , {i2 , i4} ⊂ {i2,, i3,, i4}, или I24 ⊂ I234 , {i3,, i4} ⊂ {i2,, i3,, i4}, или I34 ⊂ I234, для {i1, i2}:

{i1} {i1, i2}, или I1 I12 ,

{i2} ⊂ {i1, i2}, или I2 ⊂ I12 , для {i1, i3}:

{i1} ⊂ {i1, i3}, или I1 ⊂ I13,

{i3} ⊂ {i1, i3}, или I3 ⊂ I13, для {i1, i4}:

{i1} ⊂ {i1, i4}, или I1 ⊂ I14,

{i4} ⊂ {i1, i4}, или I4 ⊂ I14, для {i2, i3}:

{i2} {i2,, i3}, или I2 I23 ,

{i3} ⊂ {i2,, i3}, или I3 ⊂ I23 , для {i2,, i4}:

{i2} ⊂ {i2,, i4}, или I2 ⊂

{i4} ⊂ {i2,, i4}, или I4 ⊂ для {i3,, i4}:

{i3} ⊂ {i3,, i4}, или I3 ⊂

{i4} ⊂ {i3,, i4}, или I4 ⊂

На рисунке 2 приведена схема сети связности для фрагментов информации с номерами i-123 (определяется показателями i1, i2, i3), i-12 (определяется показателями i1, i2), i-13 (определяется показателями i1, i3), i-23 (определяется показателями i2, i3), i-1 (определяется показателем i1), i-2 (определяется показателем i2), i-3 (определяется показателем i3). Стрелками обозначены отношения порядка (следования).

Рис. 2. Схема сети связности

Из рисунка 2 видно, что:

  • -    из фрагмента информации с номером i-123 следуют фрагменты информации с номерами i-12, i-13, i-23, i-1, i-2, i-3;

  • -    из фрагмента информации i-12 следуют фрагменты информации с номерами i-1 и i-2;

  • -    из фрагмента информации i-13 следуют фрагменты информации с номерами i-1 и i-3;

  • -    из фрагмента информации i-23 следуют фрагменты информации с номерами i-2 и i-3.

Заключение

Таким образом, разработан алгоритм, который позволяет установить степень взаимосвязи различных фрагментов информации, находящихся в хранилище, и эту взаимосвязь можно рассматривать как новую информацию, которая в дальнейшем может быть подвергнута дальнейшей обработке.

Список литературы Алгоритм коррекции связей между фрагментами слабо формализованной информации в хранилище и генерации новой информации

  • Воробьев В.И., Копыльцов А.В., Пальчун Б.П., Юсупов Р.М. Методы и модели оценивания качества программного обеспечения. СПб., 1992.
  • Воройский Ф.С. Информатика. Энциклопедический словарь-справочник: введение в современные информационные и телекоммуникационные технологии в терминах и фактах. М., 2011.
  • Копыльцов А.А. Модель классификации информации и алгоритм ее предварительной обработки для статических и динамических объектов // Известия СПбГЭТУ «ЛЭТИ». Серия «Информатика, управление и компьютерные технологии». 2013. № 6.
  • Копыльцов А.А. Обработка информации в живых и технических системах // Материалы ХIII Санкт-Петербургской международной конференции «Региональная информатика - 2012» (24-26 октября 2012 г.). СПб., 2012.
  • Копыльцов А.А. Обработка слабо формализованной информации в живых и технических системах // Материалы Всероссийской научно-практической конференции студентов, магистров, аспирантов «Современное программирование» (16-17 апреля 2014 г.). Нижневартовск, 2014.
  • Копыльцов А.А. Обработка слабо формализованной информации при недостатке информации // Материалы ХIII Санкт-Петербургской международной конференции «Региональная информатика - 2012» (24-26 октября 2012 г.). СПб., 2012.
  • Копыльцов А.А. Сохранение конфиденциальности данных при поддержке принятия решений на основе извлекаемой специальным образом информации // Материалы VIII Санкт-Петербургской межрегиональной конференции «Информационная безопасность регионов России» (23-25 октября 2013 г.). СПб., 2013.
  • Копыльцов А.А., Копыльцов А.В. Алгоритм обработки слабо формализованной информации, поступающей от технических систем // Известия СПбГЭТУ «ЛЭТИ». Серия «Информатика, управление и компьютерные технологии». 2012. № 8.
  • Копыльцов А.А., Копыльцов А.В. Обработка слабо формализованной информации, поступающей от технических систем // Вестник Нижневартовского государственного гуманитарного университета. 2013. № 1.
  • Копыльцов А.А., Копыльцов А.В. Технические системы и слабо формализованная информация // Материалы ХIII Санкт-Петербургской международной конференции «Региональная информатика - 2012» (24-26 октября 2012 г.). СПб., 2012.
  • Копыльцов А.А., Нечитайленко Р.А. Кластерное атрибутирование объектов информационной обработки по понятийным частным и интегральным признакам // Материалы ХII Санкт-Петербургской международной конференции «Региональная информатика - 2010» (20-22 октября 2010 г.). СПб., 2010.
  • Копыльцов А.В. Об оценке качества программных продуктов // Проблемы информатизации (теоретический и научно-практический журнал). 1994. Вып. 3-4.
  • Хованов Н.В. Статистические модели теории квалиметрических шкал. Л., 1986.
Еще
Статья научная