Анализ и визуализация взаимосвязей нормативно-правовых документов в справочно-правовых системах
Автор: Масюк Максим Анатольевич
Журнал: Сибирский аэрокосмический журнал @vestnik-sibsau
Рубрика: Математика, механика, информатика
Статья в выпуске: 2 (35), 2011 года.
Бесплатный доступ
Рассмотрена сложившаяся в Российской Федерации ситуация, связанная со стремительным ростом количества принимаемых документов законотворческого характера, значительная часть которых носит поправочный характер, т. е. содержит в себе ссылки на другие акты. Анализ множества документов с их взаимосвязями является сложным, но при этом рутинным занятием, которое требует наличия высококвалифицированных специалистов. Автором предложен комплексный подход к совершенствованию справочно-правовых систем и электронных баз данных путем интеграции в них системы, реализующей визуальное отображение взаимосвязей документов и их анализ на соответствие нормам законотворчества.
Нормативно-правовой документ, анализ, визуализация
Короткий адрес: https://sciup.org/148176566
IDR: 148176566
Текст научной статьи Анализ и визуализация взаимосвязей нормативно-правовых документов в справочно-правовых системах
В последние годы в Российской Федерации и ее субъектах наблюдается стремительный рост законотворческой деятельности, который, однако, не свидетельствует о высоком качестве правового регулирования [1]. С развитием законодательной базы существенно возрастает количество производных нормативно-правовых актов: законов, постановлений, указов, значительная часть которых носит поправочный характер, т. е. содержит в себе ссылки на другие документы с описанием вносимых в текст поправок или отменой ранее действующих документов. Такие ссылки одних документов на другие образуют единую связанную структуру – ориентированный граф, который можно рассматривать на множестве документов какой-либо электронной базы данных или справочно- правовой системы в рамках законодательства Российской Федерации или ее отдельного субъекта. Однако представление общей картины путем анализа текстов является трудоемкой процедурой. Кроме того, существует вероятность возникновения противоречий с формальными правилами и нормами законодательного процесса, закрепленными в виде специальных документов [2; 3].
Автором предлагается комплексный подход к совершенствованию справочно-правовых систем и электронных баз данных путем интеграции в них системы, реализующей визуальное отображение взаимосвязей нормативно-правовых документов и их автоматический анализ на предмет соответствия нормам законотворчества. Рассматриваемый подход облегчает про- цедуры кодификации и мониторинга законодательной базы, способствует повышению эффективности работы экспертов, юристов, а также качества принимаемых законов в целом. Практическое значение может иметь как анализ уже существующей законодательной базы, так и потоковый анализ всех принимаемых законодательных актов.
Математическая модель и теоретическое обоснование. Для формализации предметной области предлагается следующая математическая модель взаимосвязей документов. Задан массив (база данных) документов 5 = { s 1 , 5 2 ,...,sN } , где s i - i -й документ массива, здесь i = 1,..., N , N - общее число документов в массиве.
Структура документа s i представляет собой упорядоченный набор атрибутов ai 1, ai 2, ..., aiki , Ri , где ai 1, ai 2, ..., aik – информационные атрибуты i -го документа (такие как название, номер, дата принятия); R i – специальный атрибут для связи с другими документами из множества S .
Документы множества S упорядочены по одному из своих атрибутов – дате принятия.
Между документами S существует система связей L = { I j , i , j = 1,..., N , i * j } , где l ij - связь документа s i с документом S j , !ц e Л = { X 0 , X 1 , X 2 , X 3 } , т. е. l ij принимает значения из множества Λ типов связей, причем:
-
- l ij = X0 тогда и только тогда, когда документ s i
не имеет в своем тексте ссылки на документ s j , т. е. λ 0 – нулевая связь;
-
- l ij = X 1 тогда и только тогда, когда в тексте документа s i содержатся указания о внесении изменений в документ s j , т. е. λ1 – изменяющая связь;
-
- l j = X 2 тогда и только тогда, когда в тексте документа si содержатся указания о признании утратившим силу документа s j , т. е. λ 2 – отменяющая связь;
-
- I jj = X 3 тогда и только тогда, когда документ s i
имеет в своем тексте упоминание о документе s j , но семантическое значение этого упоминания не соответствует ни λ 1 , ни λ 2 , т. е. λ 3 – связь произвольного типа.
Определение окрестности документа. Окрестностью первого уровня Ki 1 документа si называется подмножество документов множества S , имеющих ссылку на документ si (стоковая часть окрестности), в объединении со множеством документов, на которые имеется ссылка в документе si (истоковая часть окрестности):
K = K? и K^, где
N
K^= K 1 + ( s i ) = U s j\ l ji *X o ;
j = 1
N
K * - = K 1 - ( s i ) = U s^ *X o , i = 1,..., N .
j = 1
Окрестностью второго уровня Ki 2 документа s i называется множество
NNN
K^ = K* иUK1 |sj e Ki = Ki иU Jsk \lkj * Xo I sj e j=1 j=1V k=1
N r. N\ e Ki иUIUskl ■■ * Xo I|se Ki = j=1 V k=1
= K i 1 и K 2+u K , i = 1,..., N .
Окрестностью n-го уровня называется множество
Kin = Ki1 и Ki2 и... и Ki”-1 и UK1 |sj. e Kin-1 = j =1
= K1+ и K1 и K2+ и K2" и... и Ki”+ и Ki”-,
i = 1,..., N .
Определение потенциально опасных с точки зрения несоблюдения норм законотворчества связей и документов. Выделим L 1 , L 2 ,..., LA – подмножества множества L и C = { C 1? C 2,..., C A } - систему условий (критериев). Связь l ij является потенциально опасной и принадлежит L a , a = 1,..., A , тогда и только тогда, когда она удовлетворяет критерию C a :
ly e La О Ca (ly) = 1, где La c L; Ca e C, a = 1,..., A.
Аналогично для документов: S 1 , S 2 , ..., SB – подмножества множества 5 и C ' = { C 1 ' , C 2 ,..., C B } - система условий (критериев). Документ s i является потенциально опасным и принадлежит 5b , b = 1,..., B , тогда и только тогда, когда он удовлетворяет критерию C b :
sie 5b О Cb(si) = 1, где 5b c 5; Cb e C',b = 1,...,B.
Для формального описания критериев потенциально опасных ситуаций предлагается логический аппарат метаправил, причем эволюция норм и правил законотворчества влечет добавление или изменение метаправил и, как следствие, расширение возможностей системы, но не изменение ее алгоритма работы.
Примерами связей, потенциально опасных с точки зрения противоречия нормам законотворчества, могут служить:
– ссылки любого из трех типов на документ, который был отменен ранее. Этим ссылкам соответствует критерий
C 1 ( l x, ) = [a l y, | l yi = X 2 , x > y , i , x , y = 1,..., N ];
– ссылки типа «внесение изменений» на документ, от которого исходит ссылка того же типа. В реальной ситуации это означает, что вносятся изменения в закон, который сам вносит изменения в другой закон, что недопустимо [2, п. 57]. Этим ссылкам соответствует критерий
C 2 ( кд = [ l x =1 2 ,3 l y = 1 2 , i , X , y = 1,..., N ].
Практическая реализация системы. Разработанная автором система анализа и визуализации нормативно-правовых документов включает в себя три функциональных модуля:
– подсистему расстановки гиперссылок документов;
– подсистему автоматического анализа связанной структуры на наличие связей, некорректных с точки зрения норм законотворчества;
– подсистему визуализации окрестностей нормативно-правовых документов.
Подсистема расстановки гиперссылок документов. В основе этой подсистемы лежит лингвистический анализатор, выполняющий автоматическую расстановку гиперссылок одних документов на другие в рамках электронной базы данных (БД). Способ реализации подсистемы гиперссылок может варьироваться в зависимости от особенностей электронной БД и клиентского приложения.
Выделяются два принципиально разных подхода к расстановке гиперссылок в документах:
– предварительная обработка документов с добавлением к ним метаданных, содержащих информацию об имеющихся ссылках на другие документы окрестности;
– потоковая обработка документов по запросу пользователя или других подсистем без редактирования документов.
Первый способ является более предпочтительным, так как он не нуждается в повторяющихся вычислениях, но требует редактирования данных родительской СУБД. Еще одно преимущество первого подхода состоит в том, что он позволяет улучшить качество взаимодействия системы с пользователем путем организации перехода от документа к документу посредством использования гиперссылки, что может быть реализовано при условии доработки клиентского приложения.
Для организации гиперссылок в системе применяется лингвистический анализатор, выполняющий следующие функции:
– корректного распознавания наличия ссылок в тексте документа;
– автоматического распознавания типа ссылки (отмена документа, внесение поправок в текст и др.);
– анализа наличия документов, на которые выявлена ссылка, в рассматриваемой электронной базе данных;
– добавления в документ метаданных о ссылках (для способа предварительной обработки документа).
Подсистема автоматического анализа связанной структуры. Множество взаимосвязанных нормативно-правовых документов образуют единую связанную структуру, или взвешенный ориентированный граф, ребра которого имеют три возможных значения веса 11,12,13. Вершины графа также имеют различный тип в зависимости от соответствующего им документа и его функциональной направленности (например, о внесении изменений, о признании законов утратившими силу и т. д.).
Назначение этой подсистемы состоит в автоматическом анализе окрестностей исследуемого документа и обнаружении потенциально опасных с точки зрения норм законотворчества ситуаций. На данном этапе развития системы практический интерес представляет анализ окрестностей не более чем второго уровня, так как визуальное восприятие более широких окрестностей затруднительно, а используемые критерии не оперируют узлами, расположенными от исследуемого на большем расстоянии.
Для решения задачи обнаружения потенциально опасных связей нормативно-правовых документов в подсистеме автоматического анализа применена технология интеллектуальных агентов [4]. По запросу пользователя либо при выполнении автоматического фонового анализа законодательной базы на вход интеллектуального агента последовательно передаются исследуемые документы. Затем агент, используя доступную базу знаний – критериев потенциальной опасности, анализирует окрестность входного документа и принимает решение о наличии или отсутствии возможных противоречий в его входящих и исходящих связях.
Графическое построение окрестности нормативноправового документа и последующий анализ осуществляются обходом графа, т. е. систематическим перемещением по ребрам и посещением всех вершин, удаленных от начальной на заданное расстояние [5]. В настоящее время существуют два алгоритма обхода графа, известные под названиями «Обход в глубину» (Depth First Search, DFS) (рис. 1) и «Обход в ширину» (Breadth First Search, BFS) (рис. 2) . Оба алгоритма широко распространены и служат основой для многих алгоритмов исследования структуры графа: поиска циклов в графе, топологической сортировки вершин, поиска компонент связности и сильной связности в графе, укладки графа, алгоритма Прима и алгоритма Дейкстры [6].

Рис. 1. Обход графа в глубину
Оба алгоритма имеют одинаковую сложность 9 ( V + E ) [ 5 ] и приблизительно одинаковую скорость работы, однако применительно к решению задачи анализа и визуализации связей нормативно-правовых документов более предпочтительным является алгоритм BFS, т. е. алгоритм обхода в ширину.

Рис. 2. Обход графа в ширину
Пусть глубина построения окрестности равна 2, а вершина Y построена по алгоритму DFS (рис. 1), тогда связанные с ней вершины Y 1 , Y 2 , Y 3 не будут содержаться на схеме связей несмотря на то, что в них имеется ссылка на Y , а значит потенциально они представляют интерес для пользователя. Схема связей, построенная по алгоритму BFS, который подразумевает первоочередное посещение наименее удаленных от начала обхода вершин (см. рис. 2), свободна от этого недостатка.
Подсистема визуализации взаимосвязей нормативно-правовых документов. Подсистема визуализации выполняет графическое отображение окрестности рассматриваемого документа заданной ширины. В основе ее реализации лежит классический алгоритм обхода графа в ширину [ 7 ] , причем в результате его работы все ребра связного графа оказываются разбитыми на два класса: древесные, по которым осуществлялись переходы из посещенных вершин в непосещен-ные, и ребра касания, замыкающие циклы. Частичный граф, порожденный древесными ребрами, называется деревом поиска в глубину , который также является каркасом графа, или остовным деревом [8]. Для удобства визуального восприятия схемы связей позиционирование узлов и выбор интервала между ними выполняются с учетом первичности расположения и выделения дерева поиска с последующим построением ребер касания, а построение стоковых и истоковых ветвей осуществляется соответственно вверх и вниз относительно рассматриваемой вершины (рис. 3).

Рис. 3. Каркас графа и ребра касания (обозначены пунктиром)
Подсистема визуализации тесно связана с подсистемой автоматического анализа: для каждого строящегося узла в режиме реального времени программный агент осуществляет его проверку. Узел или смежные ему связи, удовлетворяющие критериям потенциальной опасности, имеют особое цветовое окрашивание.
Заложенный в этой подсистеме алгоритм дополнительно решает задачи обработки ситуаций с повто- ряющимися узлами: построения циклов, расположения и масштабирования структуры на плоскости.
Подсистема визуализации имеет следующие особенности, повышающие ее гибкость и удобство использования:
– выделение цветом отдельных компонент графа;
– хронологически упорядоченное расположение вершин по горизонтали слева направо;
– наличие фильтров, ограничивающих множество отображаемых документов по их типам;
– возможность масштабирования изображения на экране компьютера и при печати;
– вывод всплывающих подсказок, содержащих более подробную информацию о документах и результатах работы подсистемы автоматического анализа.
Пример практического применения системы. Рассмотрим сгенерированную описываемой системой схему связей закона Красноярского края № 9-584 от 24 декабря 1999 г. «О внесении дополнения в Закон Красноярского края «О зоне благоприятного инвестиционного климата „Красноярск“» (рис. 4).

Рис. 4. Пример схемы связей нормативно-правового документа:
1 – основной рассматриваемый документ; 2 – документы исто-ковой части графа; 3 – документы стоковой части графа; 4 – отсутствие связи между документами, которое система распознала как потенциально опасное с точки зрения норм законотворчества; 5 – связи, которые система распознала как потенциально опасные с точки зрения норм законотворчества
Такое графическое представление позволяет специалисту, имеющему дело с данным законом, обнаружить и заострить внимание как минимум на двух обозначенных системой потенциально опасных ситуациях в его окрестности:
– изображенные на схеме законы Красноярского края № 6-979 от 22 апреля 2003 г. и № 9-3705 от 8 октября 2009 г. признают утратившими силу ряд законов, т. е. по своей сути являются отменяющими. Но в то же время они оба ссылаются на закон № 9-584 от 24 декабря 1999 г., что дает риск дублирования его отмены, а также нарушения правила, приведенного в п. 80 [2] и п. 98 [3], говорящего о том, что в случае если закон утрачивает силу, то отдельными позициями указываются все законодательные акты, которыми в его текст ранее вносились изменения. На основании этих критериев система выдала предупреждение о возможно недостающей связи ( 4 на рис. 4);
– сам закон № 9-584 является изменяющим, поскольку п. 57 [2] и п. 75 [3] гласят, что изменения все- гда вносятся только в основной законодательный акт, а вносить изменения в основной законодательный акт путем внесения изменений в изменяющий его законодательный акт недопустимо. Основываясь на этом критерии, система выделила две потенциально опасные связи (5 на рис. 4).
Технологии и инструменты, реализующие систему. В Законодательном собрании Красноярского края в режиме опытной эксплуатации функционирует прототип системы анализа и визуализации связей нормативно-правовых документов, интегрированный в автоматизированную систему обеспечения законодательной деятельности.
В основе реализации системы лежит продукт корпорации IBM Lotus Notes/Domino [9], представляющий собой объектно-ориентированную платформу типа «клиент–сервер», служащую для разработки, размещения и использования прикладных программ группового обеспечения. Платформа обладает рядом существенных преимуществ перед реляционными СУБД при обработке неструктурированных данных. В рамках описываемой системы нормативно-правовые документы представляют собой неделимые информационные единицы, содержащие основную и служебную информацию в произвольных форматах. Такая специфика информационной среды определяет выбор платформы Lotus Notes/Domino в качестве наиболее подходящей.
Функциональным ядром подсистемы автоматического анализа служит интеллектуальный программный агент, написанный на языке программирования Lotus Script (диалект Visual Basic), использующий собственную библиотеку критериев потенциально опасных ситуаций и автономно работающий на той же платформе.
Еще одним преимуществом Lotus Notes/Domino является наличие встроенного веб-сервера, позволяющего использовать протокол HTTP для взаимодействия с пользователями системы. Визуализация схемы связей осуществляется в браузере Microsoft Internet Explorer с использованием технологии VML (Vector Markup Language) [10]. Возможна реализация и любыми другими подобными средствами, например более гибким средством Flash.
Таким образом, автором разработаны методика и реализующая ее система, которые позволят повысить качество принимаемых нормативно-правовых актов и эффективность анализа существующей законодательной базы за счет сокращения количества возможных ошибок и неточностей, связанных с соблюдением закрепленных норм законотворчества, и существенного уменьшения времени, затрачиваемого на разработку и экспертную оценку новых законопроектов.
Отличительными особенностями данной системы являются:
– использование элементов искусственного интеллекта при поиске потенциально опасных с точки зрения норм законотворчества ситуаций;
– графическое представление окрестности нормативно-правового документа, позволяющее пользова- телю идентифицировать такие ситуации и лучше понять их специфику.
Применение технологий автоматического анализа и графической интерпретации в исследуемой области – взаимосвязанной структуре нормативно-правовых документов – не имеет аналогов в известных программных продуктах и открытых публикациях, что подтверждено соответствующими патентными исследованиями [11].
Прототип системы анализа и визуализации связей нормативно-правовых документов вызвал заинтересованность со стороны специалистов и руководителей Законодательного собрания Красноярского края. В дальнейшем планируется совершенствование системы в следующих направлениях:
– наращивания функциональных возможностей и доработки интерфейса пользователя;
– расширения возможностей интеллектуального агента в поиске потенциально опасных ситуаций путем применения онтологии соответствующей предметной области.