Алгоритм коррекции связей между фрагментами слабо формализованной информации в хранилище и генерации новой информации
Автор: Копыльцов Антон Александрович
Журнал: Вестник Нижневартовского государственного университета @vestnik-nvsu
Статья в выпуске: 3, 2014 года.
Бесплатный доступ
Разработан алгоритм коррекции связей между фрагментами слабо формализованной информации, поступающей от технических систем. Предполагается, что информация поступает в хранилище и характеризуется некоторым конечным набором показателей. Осуществляется свертка этих показателей, которая представляет собой взвешенную сумму с весовыми коэффициентами. Далее осуществляется сравнение полученной свертки со свертками фрагментов ранее поступивших фрагментов информации в хранилище. Если евклидово расстояние между свертками меньше некоторого заранее заданного числа ε, то считается, что эти фрагменты информации между собой связаны. В хранилище рассматриваются связи между фрагментами информации, и осуществляется их коррекция, т.е. выявление фрагментов информации, находящейся в хранилище, которые между собой связаны с точностью до ε, до 2 ε, до 3 ε и т.д. Таким образом, вводится уровень связности первого, второго, третьего и других порядков. Информация о том, что некоторые фрагменты информация между собой связаны, можно рассматривать как новую информацию, и эта новая информация определяется множеством показателей, которое представляет объединение показателей, которыми определяются первоначальные фрагменты информации...
Информация, обработка информации, технические системы
Короткий адрес: https://sciup.org/14116836
IDR: 14116836
Текст научной статьи Алгоритм коррекции связей между фрагментами слабо формализованной информации в хранилище и генерации новой информации
В последние годы много внимания уделяется обработке слабо формализованной информации, поступающей от технических систем [3—11]. Под слабо формализованной информацией обычно понимают информацию, которая поступает от технических систем в непрерывном или дискретном виде с видео, аудио, температурных, ионных и других датчиков. Такая разнообразная информация, поступающая в больших объемах, плохо поддается обработке. Поэтому из слабо формализованной информации стараются получить формализованную путем, например, представления непрерывной информации в дискретном виде, а дискретную информацию можно, например, записать в таблицу в определенном, заранее выбранном, формате. Однако это не всегда возможно [2]. Часто поступающие от технических систем фрагменты информации взаимосвязаны. Однако эта взаимосвязь не очевидна, и трудно определить, какая информация следует из другой информации. Поэтому предлагается алгоритм коррекции связей между фрагментами слабо формализованной информации, находящимися в хранилище, который позволяет установить степень взаимосвязи различных фрагментов информации. Эту взаимосвязь фрагментов информации можно рассматривать как новую информацию и подвергать дальнейшей обработке.
Обработка информации, поступающей в хранилище.
Предполагается, что информация в хранилище характеризуется некоторым конечным набором показателей. При поступлении новой информации в хранилище осуществляется свертка ее показателей ( C N — результат свертки) [1; 3; 5; 12; 13] и сравнение со свертками ( C 1 , C 2 , …, C k ) ранее полученных фрагментов информации, находящихся в хранилище, следующим образом. Если δ Ni = |C N —C i | < ε для некоторого i ∈ {1, 2, …, k } и некоторого >0 , то считаем, что новая информация с номером N и старая информация с номером i между собой связаны.
Пусть фрагменты информации поступают в хранилище. Считаем соответствующие им свертки С 1 , С 2 , …, С n . Рассмотрим δ ij = |C i – C j |, где i, j = 1, 2, …, n и i ≠ j. Если δ ij < ε для некоторого ε > 0, то считаем, что эти фрагменты информации взаимосвязаны и образуют устойчивую группу взаимосвязанных фрагментов информации.
Коррекция связей в хранилище и генерация новой информации.
Рассмотрим сеть связей в хранилище для устойчивой группы взаимосвязанных фрагментов информации, состоящей из n элементов, i = 1, … , n . Если между информацией с номером i и информацией с номером j имеется С ij связей и С ij > C* , где C* — некоторое число, то считаем, что информация с номером i и информация с номером j связаны непосредственно (уровень связности С ij ) (рис. 1).
Информацию о том, что информация с номером I i и информация с номером I j связаны, можно рассматривать как новую информацию с номером I k . Это означает, что если информация с номером I i определяется показателями i 1 , i 2 , …, i i1 , а информация с номером I j — показателями j 1 , j 2 , …, j j1 , то информация с номером I k = I i ∪ j определяется показателями i 1 , i 2 , …, i i1 , j 1 , j 2 , …, j j1 , представляющими собой объединение показателей, которыми определяется информация с номерами I i и I j . Это означает, что свертка в дальнейшем делается по показателям i 1 , i 2 , …, i i1 , j 1 , j 2 , …, j j1 .
A
B
X
Рис. 1. Уровни связности между точками
Если число связей второго порядка больше или равно двум (например, между точками А и В (сплошные линии)), то считаем, что точки А и В связаны непосредственно (уровень связности между точками А и В больше или равен 2, т.е. С АВ ≥ 2, пунктирная линия)
В некоторых случаях можно между информацией с номером I i и информацией с номером I j ввести отношение порядка, т.е. определить, какая из них предшествующая, а какая последующая, или какая из какой следует.
Это можно сделать следующим образом. Если информация с номером Ii определяется показателями i1, i2, …, ii1, а информация с номером Ij — показателями j1, j2, …, jj1 , и если все показатели i1, i2, …, ii1 характеризуются более ранними временными характеристиками, чем все показатели j1, j2, …, jj1, то информация с номером Ii предшествует информации с номером Ij . Однако это не позволяет сделать заключение о том, что информация с номером Ij следует из информации с номером Ii, или наоборот.
Для того, чтобы информация с номером I i , определяемая показателями i 1 , i 2 , …, i i1 , следовала из информации с номером I j , определяемой показателями j 1 , j 2 , …, j j1 , нужно, чтобы информация с номером I i уже содержалась в информации с номером I j , т.е. { i 1 , i 2 , …, i i1 } ⊂ { j 1 , j 2 , …, j j1 }. Это означает, что в информации с номером I j уже содержится информация с номером I i , и поэтому из I j можно получить I i , т.е. I i следует из I j .
Пусть дан фрагмент информации с номером I j , определяемый показателями i 1 , i 2 , …, i k . Тогда из этого фрагмента информации следуют фрагменты информации, каждый из которых определяется некоторым подмножеством множества { i 1 , i 2 , …, i k }, т.е.
{i 1 } ⊂ {i1, i2, …, ik},
{i 2 } ⊂ {i1, i2, …, ik},
{i 3 } ⊂ {i1, i2, …, ik},
{i1, i2} ⊂ {i1, i2, …, ik}, {i1, i3} ⊂ {i1, i2, …, ik}, {i1, i4} ⊂ {i1, i2, …, ik}, и т.д.
Например, пусть дан фрагмент информации с номером I, определяемый показателями i1, i2, i3,, i4. Тогда
{i1} ⊂ {i1, i2, i3,, i4}, или I1 ⊂ I1234 ,
{i2} ⊂ {i1, i2, i3,, i4}, или I2 ⊂ I1234 ,
{i3} ⊂ {i1, i2, i3,, i4}, или I3 ⊂ I1234 ,
{i4} ⊂ {i1, i2, i3,, i4}, или I4 ⊂ I1234 ,
{i1, i2} |
⊂ |
{i1, i2, i3,, i4}, или I12 ⊂ |
I1234 , |
{i1, i3} |
⊂ |
{i1, i2, i3,, i4}, или I13 ⊂ |
I1234 , |
{i1, i4} |
⊂ |
{i1, i2, i3,, i4}, или I14 ⊂ |
I1234 , |
{i2, i3} |
⊂ |
{i1, i2, i3,, i4}, или I23 ⊂ |
I1234 , |
{i2, i4} |
⊂ |
{i1, i2, i3,, i4}, или I24 ⊂ |
I1234 , |
{i3, i4} |
⊂ |
{i1, i2, i3,, i4}, или I34 ⊂ |
I1234 , |
{i1, i2, i3} |
⊂ {i1, i2, i3,, i4}, или I123 ⊂ I1234 |
||
{i1, i2, i4} |
⊂ {i1, i2, i3,, i4}, или I124 ⊂ I1234 |
||
{i1, i3, i4} |
⊂ {i1, i2, i3,, i4}, или I134 ⊂ I1234 |
||
{i2, i3, i4} |
⊂ {i1, i2, i3,, i4}, или I234 ⊂ I1234 |
Аналогично можно получить для {i1, i2, i3}:
{i1} ⊂ {i1, i2, i3}, или I1 ⊂ I123 ,
{i2} ⊂ {i1, i2, i3}, или I2 ⊂ I123 ,
{i3} ⊂ {i1, i2, i3}, или I3 ⊂ I123 ,
{i1, i2} ⊂ {i1, i2, i3}, или I12 ⊂ I123 ,
{i1, i3} ⊂ {i1, i2, i3}, или I13 ⊂ I123 ,
{i2, i3} ⊂ {i1, i2, i3}, или I23 ⊂ I123, для {i1, i2, i4}:
{i1} ⊂ {i1, i2, i4}, или I1 ⊂ I124 ,
{i2} ⊂ {i1, i2, i4}, или I2 ⊂ I124,
{i3} ⊂ {i1, i2, i4}, или I3 ⊂ I124 ,
{i1, i2} ⊂ {i1, i2, i4}, или I12 ⊂ I124 , {i1, i4} ⊂ {i1, i2, i4}, или I14 ⊂ I124 , {i2, i4} ⊂ {i1, i2, i4}, или I24 ⊂ I124, для {i2, i3,, i4}:
{i2} ⊂ {i2,, i3,, i4}, или I2 ⊂ I234 ,
{i3} ⊂ {i2,, i3,, i4}, или I3 ⊂ I234 ,
{i4} ⊂ {i2,, i3,, i4}, или I4 ⊂ I234 ,
{i2,, i3} ⊂ {i2,, i3,, i4}, или I23 ⊂ I234 , {i2 , i4} ⊂ {i2,, i3,, i4}, или I24 ⊂ I234 , {i3,, i4} ⊂ {i2,, i3,, i4}, или I34 ⊂ I234, для {i1, i2}:
{i1} ⊂ {i1, i2}, или I1 ⊂ I12 ,
{i2} ⊂ {i1, i2}, или I2 ⊂ I12 , для {i1, i3}:
{i1} ⊂ {i1, i3}, или I1 ⊂ I13,
{i3} ⊂ {i1, i3}, или I3 ⊂ I13, для {i1, i4}:
{i1} ⊂ {i1, i4}, или I1 ⊂ I14,
{i4} ⊂ {i1, i4}, или I4 ⊂ I14, для {i2, i3}:
{i2} ⊂ {i2,, i3}, или I2 ⊂ I23 ,
{i3} ⊂ {i2,, i3}, или I3 ⊂ I23 , для {i2,, i4}:
{i2} ⊂ {i2,, i4}, или I2 ⊂
{i4} ⊂ {i2,, i4}, или I4 ⊂ для {i3,, i4}:
{i3} ⊂ {i3,, i4}, или I3 ⊂
{i4} ⊂ {i3,, i4}, или I4 ⊂
На рисунке 2 приведена схема сети связности для фрагментов информации с номерами i-123 (определяется показателями i1, i2, i3), i-12 (определяется показателями i1, i2), i-13 (определяется показателями i1, i3), i-23 (определяется показателями i2, i3), i-1 (определяется показателем i1), i-2 (определяется показателем i2), i-3 (определяется показателем i3). Стрелками обозначены отношения порядка (следования).

Рис. 2. Схема сети связности
Из рисунка 2 видно, что:
-
- из фрагмента информации с номером i-123 следуют фрагменты информации с номерами i-12, i-13, i-23, i-1, i-2, i-3;
-
- из фрагмента информации i-12 следуют фрагменты информации с номерами i-1 и i-2;
-
- из фрагмента информации i-13 следуют фрагменты информации с номерами i-1 и i-3;
-
- из фрагмента информации i-23 следуют фрагменты информации с номерами i-2 и i-3.
Заключение
Таким образом, разработан алгоритм, который позволяет установить степень взаимосвязи различных фрагментов информации, находящихся в хранилище, и эту взаимосвязь можно рассматривать как новую информацию, которая в дальнейшем может быть подвергнута дальнейшей обработке.
Список литературы Алгоритм коррекции связей между фрагментами слабо формализованной информации в хранилище и генерации новой информации
- Воробьев В.И., Копыльцов А.В., Пальчун Б.П., Юсупов Р.М. Методы и модели оценивания качества программного обеспечения. СПб., 1992.
- Воройский Ф.С. Информатика. Энциклопедический словарь-справочник: введение в современные информационные и телекоммуникационные технологии в терминах и фактах. М., 2011.
- Копыльцов А.А. Модель классификации информации и алгоритм ее предварительной обработки для статических и динамических объектов // Известия СПбГЭТУ «ЛЭТИ». Серия «Информатика, управление и компьютерные технологии». 2013. № 6.
- Копыльцов А.А. Обработка информации в живых и технических системах // Материалы ХIII Санкт-Петербургской международной конференции «Региональная информатика - 2012» (24-26 октября 2012 г.). СПб., 2012.
- Копыльцов А.А. Обработка слабо формализованной информации в живых и технических системах // Материалы Всероссийской научно-практической конференции студентов, магистров, аспирантов «Современное программирование» (16-17 апреля 2014 г.). Нижневартовск, 2014.
- Копыльцов А.А. Обработка слабо формализованной информации при недостатке информации // Материалы ХIII Санкт-Петербургской международной конференции «Региональная информатика - 2012» (24-26 октября 2012 г.). СПб., 2012.
- Копыльцов А.А. Сохранение конфиденциальности данных при поддержке принятия решений на основе извлекаемой специальным образом информации // Материалы VIII Санкт-Петербургской межрегиональной конференции «Информационная безопасность регионов России» (23-25 октября 2013 г.). СПб., 2013.
- Копыльцов А.А., Копыльцов А.В. Алгоритм обработки слабо формализованной информации, поступающей от технических систем // Известия СПбГЭТУ «ЛЭТИ». Серия «Информатика, управление и компьютерные технологии». 2012. № 8.
- Копыльцов А.А., Копыльцов А.В. Обработка слабо формализованной информации, поступающей от технических систем // Вестник Нижневартовского государственного гуманитарного университета. 2013. № 1.
- Копыльцов А.А., Копыльцов А.В. Технические системы и слабо формализованная информация // Материалы ХIII Санкт-Петербургской международной конференции «Региональная информатика - 2012» (24-26 октября 2012 г.). СПб., 2012.
- Копыльцов А.А., Нечитайленко Р.А. Кластерное атрибутирование объектов информационной обработки по понятийным частным и интегральным признакам // Материалы ХII Санкт-Петербургской международной конференции «Региональная информатика - 2010» (20-22 октября 2010 г.). СПб., 2010.
- Копыльцов А.В. Об оценке качества программных продуктов // Проблемы информатизации (теоретический и научно-практический журнал). 1994. Вып. 3-4.
- Хованов Н.В. Статистические модели теории квалиметрических шкал. Л., 1986.