Алгоритм поиска точечных подмножеств и его применение для анализа атомной структуры модельных кластеров
Автор: Крупянский Дмитрий Сергеевич, Фофанов Анатолий Дмитриевич
Рубрика: Математическое моделирование
Статья в выпуске: 2 т.7, 2014 года.
Бесплатный доступ
В настоящей статье представлены результаты по разработке метода исследования атомной структуры кластеров, формируемых при компьютерном моделировании. Данный метод основан на поиске координационных многогранников в исследуемых кластерах и построении графа, описывающего их взаимное расположение. Далее метод предполагает расчет ряда топологических индексов для полученного графа с целью их дальнейшего сопоставления с физико-химическими свойствами соответствующих кластеров. Для нахождения координационных многогранников предложен алгоритм поиска подмножеств в конечных точечных множествах по шаблону. В ходе работы было исследовано несколько различных по форме, структуре и составу кластеров. Также было предложено несколько простейших инвариантов графа, отражающих особенности структуры исследуемых кластеров. Представленный алгоритм реализован в компьютерной программе, позволяющей производить поиск координационных многогранников, строить соответствующий граф и рассчитывать предложенные инварианты.
Поиск точечных подмножеств, моделирование атомной структуры, анализ структуры
Короткий адрес: https://sciup.org/147159263
IDR: 147159263 | DOI: 10.14529/mmp140204
Текст научной статьи Алгоритм поиска точечных подмножеств и его применение для анализа атомной структуры модельных кластеров
В задачах структурного анализа, атомную структуру вещества, часто интерпретируют как множество точек трехмерного пространства. Также с каждой точкой такого множества, сопоставлено некоторое целое число t , соответствующее типу атома или иона. При таком подходе модель структуры вещества описывается множеством наборов вида {ti, xi, yi, zi}, где ti - тип частицы, a Xi, yi и zi - ее координаты. Временную эволюцию такой системы можно отследить с помощью молекулярно-динамического эксперимента, в результате проведения которого будут известны не только термодинамические параметры этой системы, но и координаты всех составляющих ее частиц.
Для оценки степени упорядоченности проэволюционировавшей системы необходимы алгоритмы, позволяющие найти в этой системе координационные многогранники и получить данные об их взаимном расположении такие, как информация о соседствующих многогранниках и об объединении таких многогранников в группы. Под соседством в данном случае понимается наличие у двух многогранников общей вершины, ребра, или грани. В зависимости от количества, соседей можно выделить несколько типов координационных многогранников. В частности, для описания структуры силикатных расплавов и стекол в настоящее время широко используют [1, 2] структурные единицы Qn - кремниево-кислородные тетраэдры SO 4, г де n - число мостиковых(принадлежащих двум атомам кремния) атомов кислорода. Такой подход может быть распространен на. любые типы координационных многогранников. В соответствии с этим, многогранники, не имеющие соседей, будем называть многогранниками типа Q 0, имеющие одного соседа - Q 1, двух со седей - Q 2 и так далее.
В данной статье представлен результат исследования по разработке метода, анализа, атомной структуры кластеров, формируемых при компьютерном моделировании неупорядоченных систем. Данный метод основывается на. анализе информации о взаимном расположении координационных многогранников, описываемых конечным набором точек. Для поиска этих многогранников предложен алгоритм, позволяющий в произвольном конечном множестве точек выявить подмножества, которые совпадают при наложении с некоторым заранее определенным набором точек (шаблоном). При этом поиск производится с учетом заданного допустимого отклонения расстояний между точками. Также рассмотрены простейшие способы анализа результатов поиска, в основе которых лежит рассмотрение графа, вершины которого соответствуют найденным координационным многогранникам, а ребра – их соединениям посредством общих вершин, ребер, граней.
Реализованная программа позволяет производить поиск координационных многогранников в компьютерной модели атомной структуры кластера, строить соответствующий граф и рассчитывать численные параметры, характеризующие его структуру. Программа состоит из двух модулей: модуля поиска точечных подмножеств и модуля анализа результатов поиска.
1. Существующие методы анализа структуры вещества
Решению задачи исследования структуры компьютерных моделей систем атомов посвящено множество работ. В работе [3] описан алгоритм сопоставления точечных множеств, позволяющий выявить степени различия или подобия упорядоченных структур. Для анализа неупорядоченных систем часто используется функция радиального распределения атомов g(r), определяющая плотность вероятности нахождения какой-либо частицы на расстоянии r от некоторой исходной частицы. Однако, для аморфных тел функция g ( r ) затухает при некоторых значениях r k , называемых дальностью корреляции, и поэтому удобна для описания только ближнего порядка. В работах [4, 5] для исследования компьютерных моделей жидкости и аморфных тел применялась разностная радиальная функция распределения, позволяющая оценить характер дальних осцилляций.
Также удачным средством для исследования структуры жидкостей оказался подход, основанный на геометрических методах Вороного-Делоне [6]. Многогранник Вороного является непосредственным геометрическим образом ближайшего окружения атома, вершины этого многогранника являются центрами симплексов Делоне, заполняющих пространство без зазоров и наложений. При использовании этих методов для анализа структуры рассматриваются различные метрические характеристики многогранников Вороного и симплексов Делоне. В работе [7] в качестве количественной характеристики формы симплекса используется длина его самого длинного ребра; в работах [5, 8] используются индексы тетраэдрич-ности и октаэдричности, характеризующие форму симлекса; в монографии [6] в качестве метрических характеристик многогранника предлагается использовать его объем, площадь поверхности и коэффициент сферичности.
В теоретической химии для изучения молекулярной структуры применяются такие математические теории, как топология и теория графов. С формальной точки зрения структура молекулы интерпретируется как граф, вершины которого соответствуют атомам, а ребра - связям. Различные инварианты (топологические индексы) этого графа зависят от структуры, поэтому производятся попытки увязать их значения с теми или иными физикохимическими свойствами различных веществ [9, 10].
2. Постановка задачи
Формально задача поиска точечных подмножеств состоит в следующем.
Пусть в n-мерном евклидовом пространстве En заданы два конечных множества точек X и Y , также задано некоторое конечное множество натуральных чисел M ⊂ N. Причем каждой точке множеств X, Y поставлено в соответствие некоторое натуральное число t ∈ M , обозначающее тип этой точки. Множество Y будем называть шаблоном поиска. Задача состоит в том, чтобы найти все такие подмножества X G X, равномощные с Y, чтобы при наложении друг на друга множества X и Y совпадали с точностью до некоторого заранее заданного положительного вещественного числа ε. При этом, будем считать равномощные множества X и Y совпадающими с точностью до ε, если из элементов множества X можно составить последовательность {Xi}, а из элементов множества Y - последовательность {yi}, так, чтобы t-i = tyi, а Ip^X^xj) — p(yi,yj)| < Е для любых допустимых i, j.
3. Поиск точечных подмножеств
Решение поставленной задачи представляет собой некоторый набор искомых подмножеств исходного точечного множества. Расположение этих подмножеств в пространстве может быть произвольным: они могут иметь общие точки, либо не пересекаться. Однако, для поиска коорднационных многогранников требуются дополнительные ограничения на взаимное расположение найденных подмножеств в пространстве. Например, для этой задачи недопустимо их перекрывание (рис. 1, г), т.к. в этом случае возникает неопределенность в том, какое из найденных подмножеств является координационным многогранником.
Определение 1. Будем говорить, что два точечных подмножества X, Y С E n перекрываются, если пересечение относительных внутренностей их выпуклых оболочек не пусто, то есть riConvX П riConvY = 0.



б
г
Рис. 1. Варианты взаимного расположения точечных множеств на плоскости
На рис. 1 представлены некоторые варианты взаимного расположения двух точечных множеств X и Y на плоскости: (а) - множества X = { a, b, c} и Y = {d, e, f } не пересекаются; (б) – множества X и Y и их выпуклые оболочки C onvX и ConvY пересекаются в точке b ; (в) – множества X и Y имеют две общие точки a и c , а их выпуклые оболочки - отрезок [ a, c ] ; (г) - множества X и Y не пересекаются, но перекрываются в смысле определения 1.
Частично решить проблему перекрывающихся подмножеств можно путем введения некоторого условия, позволяющего выделить из всех перекрывающихся подмножеств одно, ≪ наиболее подходящее ≫ . Например, при поиске треугольников на плоскости таким критерием может служить радиус описанной окружности. Так, если будет найдено несколько пересекающихся треугольников, то в соответствии с этим критерием выбрать нужно будет тот, радиус описанной окружности которого наиболее близок к радиусу описанной окружности шаблонного треугольника. Для точечных множеств более сложной конфигурации вместо радиуса описанной окружности, например, можно использовать диаметр множества, определяемый как supx,yEM p(x,y), где M С E n .
Алгоритм поиска .
Входные данные: массив X , содержащий координаты и тип точек, среди которых будет производиться поиск; массив Y , содержащий координаты и тип точек, составляющих шаблон поиска; вещественное число ε , определяющее допустимое отклонение расстояний между точками.
Выходные данные: двумерный массив R , каждая строка которого содержит номера точек входного массива X , совпадающих с шаблоном поиска с максимальным отклонением расстояний ε .
Шаг 1. Формируем матрицу расстояний (rij ) , где rij - расстояние между i -ой и j -ой точками массива Y , и определяем пустой массив R для хранения результатов поиска;
Шаг 2. Выбираем из массива Y первую точку yk ;
Шаг 3. Выбираем из массива X первую точку xi ;
Шаг 4. Если тип точки xi совпадает с типом точки yk , переходим на Шаг 6;
Шаг 5. Выбираем из массива X следующую точку xi и переходим на Шаг 4;
Шаг 6. Формируем массив F , содержащий один элемент – индекс точки xi в массиве X ;
Шаг 7. Выбираем из массива Y следующую точку yk ;
Шаг 8. Выбираем из массива X все точки xj , такие, что: индекс точки xj не содержится в массиве F , тип xj совпадает с типом yk , а расстояния от точки xj до всех точек из X , номера которых содержатся в F , совпадают с соответствующими элементами матрицы расстояний ( r ij) с точностью до е ;
Шаг 9. Если таких точек нет, переходим к Шагу 5. Иначе для каждой точки x j формируем новый массив F j ′ , содержащий все индексы точек из массива F , а также индекс точки x j в массиве X ;
Шаг 10. Если все точки из массива Y были выбраны, то в массивах F j ′ содержатся результаты поиска – записываем номера точек из каждого массива F j ′ в конец массива R и переходим к Шагу 11. Иначе, последовательно обозначая каждый из получившихся массивов F j ′ за F , продолжаем выполнение алгоритма с Шага 7;
Шаг 11. Выводим содержимое массива R и завершаем выполнение алгоритма.
Предложенный алгоритм разработан на основе алгоритма сопоставления точечных множеств [3] и реализован в программе, предназначенной для анализа атомной структуры кластеров, формируемых при компьютерном моделировании. Атомные кластеры и координационные многогранники описываются наборами точек в трехмерном пространстве, поэтому разработанный алгоритм может быть применен к решению данной задачи.
4. Реализация
Для применения предложенного алгоритма к задаче исследования структуры кластеров была разработана программа, состоящая из двух модулей: модуля поиска точечных подмножеств и модуля анализа результатов.
Модуль поиска точечных подмножеств .
Данный модуль предназначен для поиска в массиве, описывающем некоторую систему атомов, заранее определенных структур. В большинстве проводимых экспериментов такими структурами являлись координационные многогранники.
Входные параметры: массив координат и типов атомов, в котором будет осуществляться поиск; массив координат и типов атомов, описывающий шаблон поиска; положительное вещественное число ε , определяющее допустимые отклонения расстояний.
Суть работы модуля заключается в рекурсивном построении подсистем атомов исходного массива, совмещаемых с системой атомов, определяемой шаблоном поиска, операциями параллельного переноса, поворота и зеркального отражения, в соответствии с алгоритмом, изложенным выше.

аб
Рис. 2. Результаты поиска: (а) – кобальт-кислородных октаэдров в структуре оксида кобальта; (б) – кремниево-кислородных тетраэдров в структуре α -кварца
Результатом работы модуля является двумерный массив, каждая строка которого содержит номера атомов, образующих одно из найденных подмножеств. На рис. 2 представлена визуализация результата работы программы. В данном случае производился поиск: (а) – кобальт-кислородных октаэдров в упорядоченной структуре оксида кобальта (CoO); (б) – кремниево-кислородных тетраэдров в кристалле α -кварца. Также работоспособность реализованного алгоритма была проверена на некристаллических структурах (Рис. 3).
В ходе отладки была проведена проверка результатов поиска на корректность. Также оценивалось время выполнения алгоритма в зависимости от размеров обрабатываемых массивов и наличие перекрываемости оболочек найденных подмножеств в зависимости от значения параметра ε .
Оптимальное значение параметра ε определяется целью поиска. Так, например, при меньших значениях параметра можно обнаружить структуры, наиболее близкие к идеальному шаблону, при б´ольших – более деформированные и зачастую перекрывающиеся.
На рис. 3 приведен результат поиска кремниево-кислородных тетраэдров (SiO 4 ): (а) – в структуре жидкого стекла легированного кобальтом Na 2 Si 4 O 10 Co; (б) – в структуре аморфного оксида кремния (SiO 2 ). Длина ребра (связь O –O ) идеального тетраэдра (шаблона) составляет ∼ 2 , 66 ˚ A, а значение параметра ε принято за 0 , 5 ˚ A. При таком значении параметра ε лишь незначительная часть найденных тетраэдров перекрывают друг друга, при этом сравнение радиусов описанных сфер перекрывающихся тетраэдров с радиусом описанной сферы шаблонного тетраэдра позволяет отбросить ≪ лишние ≫ тетраэдры и получить более полную информацию о структуре системы атомов по сравнению с информацией, полученной при меньшем значении ε .
Модуль анализа результатов
Данный модуль предназначен для построения графа, описывающего структуру исходной системы атомов на уровне найденных подмножеств (координационных многогранников), а также для расчета инвариантов этого графа, которые, по нашему мнению, могут быть использованы для количественного описания структуры кластеров, формируемых при компьютерном моделировании. Вершины этого графа соответствуют найденным подмножествам, а каждое его ребро – одной общей точке двух пересекающихся подмножеств.

б а
Рис. 3. Результат поиска кремниево-кислородных тетраэдров: (а) – в структуре жидкого стекла, легированного кобальтом; (б) – в структуре аморфного оксида кремния
В общем случае полученную с помощью модуля поиска систему подмножеств можно описать некоторым несвязным мультиграфом. Анализ структуры этого графа с учетом дополнительной информации о найденных подмножествах (например, индекс тетраэдрично-сти [5, 7] для четырехточечных подмножеств), а также расчет различных топологических индексов может быть использован для поиска аналитических соотношений типа структура– свойство.
Входные данные: массив координат и типов атомов, в котором производился поиск (необходим для определения степени искаженности); двумерный массив результатов поиска, полученный с помощью модуля поиска.
Основным результатом работы модуля является массив вершин графа и массив его ребер. На основе этих массивов формируется двумерный массив, описывающий компоненты связности полученного графа. Выводится информация о количестве компонент связности, их средней и максимальной длине. Также для многогранников выводятся данные об их распределении по типам Q 0 - Q n [1].
В таблице приведены характеристики четырех исследуемых кластеров ( α -кварца, жидкого стекла, легированного кобальтом ( Na2Si4O10Co ), аморфного оксида кремния ( SiO2 ) и кристаллического оксида кобальта ( CoO )) и результаты их анализа, полученные с помощью данного программного модуля. Из таблицы видно, что численные характеристики такие как, количество компонент связности и среднее количество вершин в компоненте, сильно разнятся для кластеров в кристаллическом и аморфном состоянии. Для кластеров в кристаллическом состоянии характерно наличие у соответствующего графа только одной компоненты связности, поэтому среднее количество вершин в компоненте совпадает с общим количеством вершин. Графы неупорядоченных кластеров имеют множество компонент связности, многие из которых состоят из одной изолированной вершины. Таким образом, даже простейшие численные характеристики графа, построенного на основе информации о взаимном расположении координационных многогранников, отражают особенности атомной структуры кластера. Расчет и объединение подобных характеристик в более сложные интегральные топологические индексы может быть использован для построения корреляций типа структура-свойство.
Таблица
Результаты анализа различных кластеров
а -кварц |
Na 2 Si 4 O 10 Co |
SiO 2 |
CoO |
|
Количество частиц в кластере |
1125 |
1190 |
1200 |
1000 |
Форма кластера |
паралл-д |
шар |
шар |
куб |
Диаметр кластера, А |
45,6 |
35,3 |
33,6 |
33,1 |
Площадь поверхности класте-pa, 1000А2 |
3,2 |
3,1 |
2,6 |
2,2 |
Объем кластера, ЮООА3 |
14,1 |
17,0 |
11,2 |
6,6 |
Доля атомов в поверхностном слое толщиной 2,5А, % |
59,4 |
45,3 |
53,0 |
78,4 |
Тип координационного многогранника |
тетраэдр |
тетраэдр |
тетраэдр |
октаэдр |
Отклонение расстояний в , А |
0,4 |
0,4 |
0,4 |
0,5 |
Количество найденных многогранников |
280 |
186 |
185 |
256 |
Среднее количество смежных вершин по всем вершинам |
3,20 |
1,80 |
1,83 |
9,19 |
Количество компонент связности |
1 |
33 |
29 |
1 |
Среднее количество вершин в компоненте |
280,00 |
5,64 |
6,38 |
256,00 |
Количество изолированных вершин ( Q 0) |
0 |
16 |
20 |
0 |
Порядок наибольшей компоненты связности |
280 |
43 |
140 |
256 |
Заключение
В результате данной работы предложен метод исследования атомной структуры кластеров, формируемых при компьютерном моделировании, основанный на анализе взаимного расположения координационных многогранников. Также предложен алгоритм поиска подмножеств в конечных точечных множествах, лежащий в основе данного метода. Он описан в самом общем виде и может быть использован для решения широкого круга задач. Проверка программной реализации этого алгоритма была выполнена на кластерах различной формы, структуры и состава. Анализ результатов работы программы показал, что предложенный метод может быть использован для исследования неупорядоченных атомных систем.
Работа выполнена при поддерэюке Программы стратегического развития (ПСР) ПетрГУ в рамках реализации комплекса мероприятий по развитию научноисследовательской деятельности на 2012 - 2016 гг.
Список литературы Алгоритм поиска точечных подмножеств и его применение для анализа атомной структуры модельных кластеров
- Анфилогов, В.Н. Силикатные расплавы/В.Н. Анфилогов, В.Н. Быков., А.А. Осипов. -М.: Наука, 2005. -357 с.
- Королева, О.Н. Физико-химическая модель натриевосиликатного расплава и термодинамика -единиц/О.Е. Королева, А.А. Тупицын, В.А. Бычинский//Вестник ЮУрГУ. Серия: Химия. -2012. -№ 36. -С. 39-44.
- Тарачева, И.А. Решение задачи сопоставления точечных множеств для выявления общих подмножеств/И.А. Тарачева, Б.М. Щедрин//Кристаллография. -1994. -Т. 39, № 4. -С. 586-589.
- Волошин, В.П. Радиальные функции рапределения атомов и пустот в больших компьютерных моделях воды/В.П. Волошин, Н.Н. Медведев, Ю.И. Наберухин, А. Гайгер, М. Клене//Журнал структурной химии. -2005. -Т. 46, № 3. -С. 451-458.
- Наберухин, Ю.И. Структура больших некристаллических леннард-джонсовских моделей/Ю.И. Наберухин, В.П. Волошин//Журнал структурной химии. -2006. -Т. 47, № 7. -С. 129-143.
- Медведев, Н.Н. Метод Вороного-Делоне в исследовании структуры некристаллических систем/Н.Н. Медведев. -Новосибирск: Изд-во СО РАН, 2000. -214 с.
- Anikeenko, A.V. Polytetrahedral Nature of the Dense Disordered Packings of Hard Spheres/A.V. Anikeenko, N.N. Medvedev//Physical review letters. -2007. -98(23), 235504.
- Anikeenko, A.V. Shapes of Delaunay Simplixes and Structural Analisis of Hard Sphere Packings/A.V. Anikeenko, M.L. Gavrilova, N.N. Medvedev//in book: Generalized Voronoi Diagram: A Geometry-Based Approach to Computational Intelligence. -2008. -SCI Vol.158 -pp. 13-45.
- Зефиров, Н.С. Применение теории графов в химии/Н.С. Зефиров, С.И. Кучанов. -Новосибирск: Наука, 1988. -306 с.
- Кинг Р. Химические приложения топологии и теории графов/Р. Кинг. -Москва: Мир, 1987. -560 с.