Применение алгоритма Isolation Forest для обоснования уникальности водоемов в группе карстовых озер
Автор: Расулова А. М., Измайлова А. В.
Журнал: Бюллетень науки и практики @bulletennauki
Рубрика: Науки о земле
Статья в выпуске: 11 т.7, 2021 года.
Бесплатный доступ
Совершенствование научных основ развития и расширения сети особо охраняемых природных территорий требует поиска алгоритмов, которые можно было бы использовать для выявления уникальных экосистем. Алгоритмизация процесса идентификации аномалий предоставляет возможность не только обрабатывать большие массивы данных, но и приводит к получению объективных и сопоставимых между собой оценок. Целью настоящего исследования является выявление наиболее оптимальных механизмов для идентификации аномальных значений среди морфометрических характеристик карстовых озер, которые могут свидетельствовать об уникальности всей озерной экосистемы. В рамках данной статьи исследование проводилось на основе математического анализа выборок, построенных по различным признакам на основе базы данных WORLDLAKE. В качестве методов анализа были использованы статистические методы и алгоритм машинного обучения «Изолированный лес» (Isolation Forest (iForest)). В результате применения алгоритма iForest к выборке морфометрических параметров карстовых озер, состоящей из 738 объектов, были выявлены 43 аномальных водоема. Экспертная оценка итогового набора озер на предмет уникальности их экосистем показала, что выбранный метод идентификации аномальных значений хорошо подходит для поставленной задачи. Многие озера с индексом аномальности выше 60% могут быть признаны уникальными благодаря необычности своих абиотических характеристик, ряд обладает и своеобразной биотой. В аномальные объекты попали такие хорошо известные озера, как Церик-Кель, Чрвено, Салда, Трихонис, Вегоритис, Петрон и др. При этом для большинства из них аномалии были выявлены сразу для нескольких параметров. Таким образом примененный алгоритм для выявления аномальных морфометрических характеристик озерных котловин, позволил получить интересные выборки для дальнейшего экспертного анализа всей озерной экосистемы на предмет ее уникальности.
Озерная экосистема, уникальные озера, идентификация аномалий, карстовые озера, изолированный лес, дерево решений.
Короткий адрес: https://sciup.org/14121225
IDR: 14121225 | DOI: 10.33619/2414-2948/72/08
Текст научной статьи Применение алгоритма Isolation Forest для обоснования уникальности водоемов в группе карстовых озер
Бюллетень науки и практики / Bulletin of Science and Practice
УДК [556.555:574.5]:51-7
В настоящее время крайне актуален вопрос поиска объективных критериев обоснования уникальности какого-либо объекта (в нашем случае – озера) с целью рассмотрения возможности придания ему охранного статуса. Антропогенное загрязнение водных объектов на значительной территории страны достигло столь значимых масштабов, что сохранность наиболее ценных из них может обеспечиваться только в случае закрепления за ними режима охраняемых территорий различного уровня. При этом уровень охраны должен определяться не только эстетической, культурной и рекреационной значимостью водоема, но и сложностью и уникальностью его экосистемы. Оценка последней требует научного подхода, тщательного изучения особенностей функционирования конкретного озера. Согласно последней оценке [1], в России дешифрируется около 3,8 млн. водоемов естественного происхождения. Лимнологическая изученность страны остается достаточно низкой. В этой связи использование математических подходов для первичного выделения водоемов – претендентов на охранный статус — на основе аномальности их характеристик представляется крайне перспективным.
Как указывалось [2], среди всех параметров, характеризующих озерную экосистему, наиболее легко определяются абиотические, и, прежде всего, – морфометрические.
Определение последних возможно не только благодаря полевым исследованиям, но и с помощью геоинформационных систем (ГИС) и спутниковых снимков. К настоящему времени нами накоплен большой объем данных по озерам мира, содержащий сведения о различных морфометрических характеристиках озерных котловин, их происхождении. В этой связи первичная оценка озер на предмет уникальности их экосистем возможна именно с применением выборок различных морфометрических характеристик. Генетическая принадлежность озерных котловин и их морфометрические особенности в значительной степени предопределяют протекающие в них процессы и трансформацию устойчивости лимносистем [3, 4]. В то же время, как отмечалось в работе [5], в силу взаимной обусловленности происходящих в озерах процессов, если водная экосистема отлична от остальных на определенной территории по одному признаку, то она может выделяться и по ряду других признаков. То есть при идентификации выбросов по разным параметрам, они часто будут выявлены для одних и тех же объектов, что позволяет изначально ориентироваться на наиболее изученные характеристики.
В статье [2] на примере анализа морфометрических параметров озер вулканического происхождения нами была удачно продемонстрирована возможность применения различных статистических критериев идентификации выбросов, которые могут характеризовать водный объект как претендент на звание «уникального». В рамках настоящей статьи аналогичное исследование проводится на примере выборки озер карстового происхождения.
Необходимо отметить, что в силу геологических особенностей, для значительной части России характерно широкое распространение озер карстового происхождения, в том числе в наиболее освоенных регионах. Чаще всего это небольшие по площади водоемы, крайне уязвимые к антропогенному вмешательству. Значительная часть из них уже имеет охранный статус. Среди 1113 ООПТ России, в которых озера являются объектом охраны, на долю карстовых озер приходится 8%.
В ходе исследования на основе классических статистических методов проведено описание исходной выборки морфометрических параметров карстовых озер. Показано что, применение статистических критериев выявления выбросов, как было сделано нами для озер вулканического происхождения, оказалось неоптимальным для карстовых озер. Для идентификации аномальных озер в рамках данной работы применялся алгоритм машинного обучения «Изолированный лес» (Isolation Forest, далее i Forest). Выявленные в результате работы алгоритма аномальные значения показали хорошее согласие с экспертной оценкой.
Карстовые водоемы и их распространение
К карстовым водоемам обычно относят озера, образованные подземными и поверхностными водами путем растворения веществ, выноса тонких частиц и появления в результате этой деятельности подземных пустот, впоследствии заполненных водой. Такие пустоты могут располагаться как непосредственно в растворимых породах, так и в покрывающие их (иногда – прилегающих к ним) толщах нерастворимых пород. Чаще всего карстовые озера имеют небольшой размер, округлую, овально-вытянутую или лопастную форму. Для многих из них характерна значительная глубина. Формы озерных котловин изменяются от конусообразной до полусферической [6] (показатель емкости конуса – 0,33, а полусферы – 0,67).
К карстовым котловинам, в силу схожести происходящих процессов, ряд лимнологов относят и заполненные водой углубления в земле, образованные в зонах вечной мерзлоты в результате таяния подземных пластов льда, так называемые термокарстовые озера. Однако, в силу заведомых различий в формировании экосистем в водоемах зоны вечной мерзлоты, термокарстовые озера нами в выборку включены не были. Кроме того, как было показано в [7], характер поведения морфометрических параметров озерных котловин карстовых и термокарстовых озер несколько отличен. Б.Б. Богословский [8] считал, что по действующему фактору образования термокарстовые водоемы наиболее близки к ледниковым. В то же время нами рассматривались некоторые водоемы смешанного происхождения, расположенные в карстовых регионах, так как предполагалось, что их экосистемы будут характеризоваться схожим функционированием.
В Российской Федерации озера карстового происхождения имеют обширное распространение на Онежско-Двинском водоразделе, в центральной части Русской равнины, особенно в Поволжье, на юге Западной Сибири; их наибольшая концентрация характерна для плоских равнинных участков, где достаточно увлажненно и распространены карбонатные породы. Наиболее глубокие карстовые водоемы встречаются в горных областях – на Северном Кавказе, Южном Урале и Приуралье, в Приангарье. В зарубежной Европе карстовые озера наиболее распространены на Балканском полуострове, однако небольшие группы встречаются и в других регионах Европы. Согласно недавним картографическим оценкам, 21,6% поверхности суши в Европе характеризуется карбонатными породами [9]. Карстовые озера распространены и еще в целом ряде регионов мира. В зарубежной Азии они прежде всего встречаются на полуострове Малая Азия, на Большом и Малом Кавказе, а также, единичные водоемы – в различных частях Южной, Юго-Восточной, Восточной и Средней Азии. В Северной Америке обилие карстовых озер обнаруживается во Флориде, Юкатане и в Кордильерах.
К сожалению, в рамках настоящего исследования мы были ограничены имеющимися у нас базой данных (далее БД). Доступные данные охватывают далеко не все карстовые озера мира, однако по России они включают практически все водоемы, происхождение которых в литературе указывается как карстовое. Изначально БД включала только батиметрически измеренные водоемы, по всем карстовым озерам мы сочли необходимым дополнить ее морфометрическими характеристиками, полученными с использованием спутниковых снимков.
Методика исследования
Проведенный в ходе исследования математический анализ исходной выборки, опирался на морфометрические характеристики озер (Таблица 1). Для выбора методов идентификации аномалий была проведена предварительная статистическая проверка на нормальность распределения по указанным морфометрическим параметрам, результаты которой приведены в табл. 2. Выборка карстовых озер состояла из 738 объектов, однако не все из них имели полный набор данных (некоторые морфометрические характеристики не были определены). Минимальное количество валидных объектов в выборке содержится по параметру C (площади водосбора озера) и составляет 248 озеро. Максимальное — для длины L , ширины W , коэффициента сжатия k s , показателя удлиненности 1/k s — 738 объектов. Таким образом для любого из параметров по размеру выборки можно говорить о статистически значимых результатах.
Бюллетень науки и практики / Bulletin of Science and Practice Т. 7. №11. 2021 Таблица 1 МОРФОМЕТРИЧЕСКИЕ ПАРАМЕТРЫ, СОДЕРЖАЩИЕСЯ В БД WORDLAKE Обозначение Характеристика и единицы измерения L Длина озера (км) W Ширина озера (км) S Площадь зеркала озера (км2) ℓ Длина береговой линии озера (км) Havg Средняя глубина озера (м) Hmax Максимальна глубина озера (м) V Объем озера (км3) C Площадь водосбора (км2) ks Коэффициент сжатия зеркала озера: k = W sL 1/ks Показатель удлиненности, обратно пропорциональный к коэффициенту сжатия k c H Коэффициент формы озерной котловины (коэффициент емкости) c =---- Hmax H*avg Безразмерная средняя глубина (по отношению к средней глубине озера Байкал Hav=7 740 м) H * = Hg avg avg H avgB H*max Безразмерная максимальная глубина (по отношению к максимальной глубине озера Байкал Hmax 1650 м) Hтса = max max max B S* Безразмерная площадь озера (относительно площади Каспийского моря S^ = 3, 86-105 км2) S ^ = — KS SKS * Безразмерный объем озера (относительно объема Каспийского моря VKS = 7,87'10 . V км3) V *= — V KS H** Относительная глубина, равная отношению между максимальным вертикальным тт П"3 H max масштабом и площадью зеркала н = 10 S Показатель открытости, равный отношению площади озера к средней глубине Havg α H Коэффициент «глубинности» озера а = 1/3 S1/3 φ Широта (в градусах) λ Долгота (в градусах) Zasl Высота озера над уровнем моря (м) N Количество валидных объектов в выборке
S « & Sc ^ s^ * § 3 s * s о 0 ° s-hq Г) S cq § g g i U a г' &0 ^g'St G 1 s 1 fn ^ |
oo о 40 о о о ?—< ОО ОО 04^ ОО ОО ОО ci W со МП о о W МП МП о о 40 04 04^ ОО |
ОО о МП СО 40 04 40 о ?—< ОО ОО 04^ ОО 40 40 40 40 МП о со я о ?—< ^ч МП о о СО о о о 40 04 04^ oi ?—< ОО |
ОО о 40 СО 04^ О О ?—< МП о oi 04 Ю. 04 40 04 40 МП МП СП 40 СО w w О ОО °\ МП 40 О О ?—( W МП 40 Со |
о сч о 04 ОО О ( о о о 04 О 40 04 40 СЧ 40 МП О со 40 40 СО СО О ?—< О о 04 МП СО СО мп мп мп |
04 СО сч о 04 МП о 40 СО^ ci W со ci 04 го МП 40^ о со со^ 40 МП со МП со^ о МП СО |
о со^ о 04 СО^ ос' МП о о ОО МП МП 40 ?—( МП 04 МП СО МП о о МП ?—( ОО со о МП о МП 40 ОО со о 04 МП |
Rs о со W МП ?—( 40 О МП о о W ( ОО о о ОО о 04 со^ ^ со о 40 со 40 |
ОО СП о МП ?—( о МП МП о МП о oi о ?—( МП МП ?—( 04 ОО МП 40 МП о МП со 04 МП ci о со о МП о о oi о МП ОО со |
ОО о W ?—( о ?—( ОС ОО ос' МП со^ о 40 40 ОО со^ о о W 40 oi МП 40 МП о о со ОС °\ со ОО |
ОО о W о ОС о W ОС ОО °\ ОС ОО МП со 04 го со ОО МП W о W ОС МП 40 СП со W о W ОО |
W со^ о 04 ОО oi О w СО о 40^ о W МП о со^ о о ?—( ОО W ?—( го о Rs о °0. МП 04 го ОО о о |
04 СО со^ о о 04 МП о 40 СО^ ci W О МП о W ОО ?—( о о го ОС о со ОО ОС ?—( о ^ о ?—( ОС ?—( о |
о со^ о 04 СО^ ОС МП о о ОО МП МП 40 о ?—( ОО со о W 04 W о ?—( ОС ОО о 40 О ОС oi о ^ о о о 04 МП Q 5 * |
ОО о со 40 04^ О о ?—( МП о о 04 о МП 40 ( Ок о R 40 О w ОС °\ о °\ со" о W ?—( R W ?—( ОО 40 о ?—( МП го со о ОО 40 ?—( * Со |
R о МП ?—( 40 о со о МП о о 04 МП о со 40 со^ со о W ?—< о о ?—( ОО W о о МП о ОО ОО МП о ?—( 40 * |
о со^ о со МП W ?—( о о 40 о о со о о ?—< МП о ?—< 40 °0, oi 40 ю~ МП о 04 МП 40 ^ МП о 04 МП * * Й5 |
04 СО о МП о МП о ОО о со ОО мп ci МП 40 со со о ?—< 40 со о о о W W о Со |
04 СО о ОО 40 СО МП о °\ о о ?—< МП о МП о со со R 40 ОО о о R 4О" ОО |
04 О О ОО °^ МП о о о о ОО ?—< R о МП ^ о ОС 40 МП 04 МП °1 со МП |
04 О о МП о о 04 О ^ ?—< 04 МП 40 ?—< R о W 40 О ^ 40 СО 40 ^ ОС 40 ?—< R со со МП |
°1 о со °0. 04 о о со ОО о со" о R о о 40 с 40 со 40 04 СО о о ГП o' 04 СО о МП ts |
Анализ Таблицы 2 и сравнение результатов с полученными для вулканических озер [2], показывает, что для карстовых водоемов средние характеристики площади и глубины существенно меньше. Среднее значение коэффициента формы озерной котловины, равное 0,481, говорит, что такие озера по большей части имеют параболоидную форму котловины. Для описания формы зеркала озера обычно используют показатель удлиненности. Согласно [10], для водоемов с формой зеркала, близкой к округлой, показатель удлиненности составляет 1,5-3,0. Увеличение показателя удлиненности соответствует вытягиванию формы зеркала озера. В горизонтальной плоскости карстовые озера имеют округлую форму, так как среднее значение их показателя удлиненности 1/k s =2,306, однако при этом могут встречаться и озера с сильно вытянутой эллипсоидальной формой зеркала (максимальное 1/k s =11,47). То есть, большинство озер карстового типа имеют небольшие по площади, неглубокие озерные котловины параболоидной или конусообразной формы.
При идентификации аномалий статистическими методами и выборе критериев обработки выбросов необходимо знать вид распределения. Приблизительная форма распределения видна из Таблицы 2. Поскольку статистическими методами наиболее просто идентифицировать выбросы для нормального распределения, то охарактеризуем распределение параметров с точки зрения их приближенности к нормальному распределению. Как видно из значений эксцесса ( E ), приведенного в Таблице 2, для всех параметров распределение имеет «островершинный» вид, по краям которого находится больше значений, чем вокруг среднего. Для нормального распределения значения -3≤ E ≤3 (для мягкого критерия) или -1≤ E ≤1 (для жесткого). Значения асимметрии ( A ) для морфометрических параметров карстовых озер показывает, что распределение сильно сдвинуто в сторону меньших значений, т. е. имеет сильную левую асимметрию, за исключением коэффициента емкости, значение которого подпадает под нормальное распределение. Более точная проверка на нормальность с помощью критерия Колмагорова-Смирнова ( p =0,05), показала, что нулевая гипотеза не принимается. Привести все остальные распределения к нормальному виду с помощью преобразования Бокса-Кокса [11], что было возможно для вулканических озер [2], для карстовых водоемов не удалось. Таким образом, при работе с выборкой по карстовым озерам применение статистических критериев идентификации выбросов в случае нормального распределения, оказалось невозможным. Подбор других форм распределения (экспоненциального и Вейбула) к морфометрическим параметрам карстовых озер не показал эффективности. Следовательно, применение классических критериев поиска выбросов в данном случае оказалось неоптимальным.
В качестве альтернативы статистическим методам поиска выбросов, в рамках данной работы, была выбрана идентификация аномальных значений с помощью алгоритма машинного обучения i Forest, основанного на теории графов. Алгоритм i Forest предложен в 2008 г. Fei Tony Liu, Kai Ming Ting, and Zhi-Hua Zhou [12–14]. Данный подход к обнаружению аномалий, базируется на изоляции экземпляров (в нашем случае озер) исследуемой выборки без привлечения меры расстояний или плотности (таких как расстояние Махаланобиса или метод k-ближайших соседей). Метод i Forest основывается на свойствах аномалий:
-
1) аномальных значений всегда мало по сравнению с размером выборки;
-
2) значения атрибутов аномальных экземпляров всегда разнообразно и резко отличаются от нормальных.
Метод iForest основан на построении множества нескольких непересекающихся неориентированных бинарных деревьев решений (или деревьев изоляции, Isolation Tree, далее iTree), так называемый ансамбль деревьев решений. В свою очередь дерево решений представляет собой граф такой, что: между любой парой вершин имеется только один маршрут, и он не содержит ни одного цикла. Т.е. дерево решений является связным ациклическим графом.
Схематическое представление ансамбля деревьев решений представлено на Рисунке. Дерево состоит из «листьев» (концевые узлы), «веток» (ребра графа), узлов ветвления (вероятностных узлов) и иногда «корня». В машинном обучении «листья» представляют собой целевую функцию, а признаки, от которых она зависит, - ребра, «корень» описывает все пространство признаков. Движение при принятии решения происходит от «корня» к «листьям».
Дадим определение дерева принятия решений ( i Tree). Пусть T — узел дерева, такой что T — либо концевой узел без дочерних узлов, либо внутренний узел принятия решения с двумя дочерними узлами ( T l , T r ). Деревом принятия решений называется такое дерево, что принятие решения на узле T состоит из атрибута q и значения разделения p , так что принятие решения q < p определяет переход либо к T l либо к T r .
Изоляционное дерево строится следующим образом: пусть X={x 1 , ... x n } — набор данных из n точек с количеством вариационных атрибутов d . Для построения i Tree используется подвыборка из ψ-экземпляров, таких что X′⊂ X. X′ делится рекурсивно, случайным образом выбирается атрибут q и значение разделения p пока: 1) узел имеет только один экземпляр или 2) все данные на узле не принимают одинаковые значение. i Tree считается полностью выросшим если все экземпляры разные и каждый из них изолирован от «листа». Полное дерево решений имеет ψ — внешних, ψ-1 — внутренних и 2ψ-1 — общего количества узлов. Аномалией признается экземпляр, который наиболее просто изолировать.

Рисунок. Структура ансамбля решающих деревьев. Обозначения: квадраты - узлы принятия решений, кружки - вероятностные узлы, треугольники – концевые узлы
Мерой восприимчивости к изоляции экземпляра считают длину пути от «корня» до «листа». Или более в строгом математическом определении: длиной пути h(x) точки данных x называется количество ребер, используемых в пути по дереву решений от корневого узла до внешнего узла. Если длина пути h(x) короткая, то восприимчивость к изоляции высокая, т.е. экземпляр с минимальным h(x) является аномальным. Следовательно, конечный узел (лист) желтого цвета на Рисунке является аномальным.
Оценка аномалий, как уже было сказано выше, основана на h(x). Однако, расчет длины пути затруднительны из-за разницы в скорости роста средней высоты iTree, которая имеет порядок log ψ, и максимально возможной высоты, которая увеличивается в линейном порядке ψ. Поэтому невозможно напрямую сравнить h(x) для подвыборок различного значения. Для нормализации используется оценка среднего h(x) взятая аналогично неудачному поиску внешних узлов в двоичном дереве поиска [15]. Согласно нему средняя длина неудачных поисков в двоичном дереве поиска имеет вид:
E ( h ( x )) s ( x , щ ) = 2 c ( ^ )
где E(h(x)) — среднее значение h(x) из ансамбля i Tree. Рассмотрим предельные случаи оценки аномальности экземпляра согласно (1):
-
1. Если E(h(x)) →0, то s →1
-
2. Если E(h(x)) →ψ-1, то s →0
-
3. Если E(h(x)) →c(ψ), то s →0,5
Отсюда следует следующие критерии признания экземпляра аномальным:
-
1. Если s →1, то такой экземпляр можно с уверенностью признать аномальным,
-
2. Если s <<0,5, то такой экземпляр можно считать нормальным,
-
3. Если оценка аномальности дает для всех значений s ≈0,5, то выборка не имеет аномалий.
Liu F. T., Ting K. M., Zhou Z. H. эмпирическим путем нашли, что размера подвыборки ψ =28=256 обычно достаточно для обнаружения аномалий. В этой же работе было показано как размер подвыборки влияет на производительность идентификации аномалий и достигает своего оптимального значения при размере 28 и нечувствителен к дальнейшему увеличению размера [14].
Результаты исследования
При поиске аномалий с помощью алгоритма i Forest в выборке морфометрических характеристик карстовых озер размер подвыбоки ψ равнялся 256. Предполагаемое количество аномалий было ограничено только размером выборки, т.е. 738 экземплярами. Поскольку выборка имеет пропуски данных и не обладает высокоточным значениями, аномальными признавались значения с s>0,6 . Результаты работы алгоритма по идентификации аномалий показаны в Таблице 3.
В Таблице 3 приведены озера с аномальными значениями более чем у двух морфометрических параметров.
Таблица 3
ОЗЕРА С АНОМАЛИЯМИ МОРФОМЕТРИЧЕСКИХ ХАРАКТЕРИСТИК, ВЫЯВЛЕННЫХ НА ОСНОВЕ МЕТОДА I FOREST
44012 |
Beyşehir (Kiriligol) |
Бейшехир |
Турция |
82,94% |
8 |
21369 |
Kush-Murun |
Кушмурун |
Казахстан |
81,39% |
9 |
13772 |
Tsrveno (Crveno) |
Чрвено (Красное) |
Хорватия |
81,14% |
7 |
53083 |
Salda Lake |
Салда |
Турция |
79,20% |
11 |
31493 |
Dukhovoye |
Духовое |
Россия |
78,83% |
3 |
30650 |
Bisericii |
Бисеричи |
Румыния |
78,71% |
5 |
53064 |
Tserik-Kol' |
Церик-Кель (Нижнее Голубое) |
Россия |
78,60% |
6 |
16 |
Band-i-Haibat |
Хайбат |
Афганистан |
78,60% |
6 |
5174 |
Livanjsko polje |
Бушко Блато |
Босния и Герцеговина |
78,31% |
9 |
24905 |
Sumiyn nuur |
Сумийнуур |
Монголия |
77,75% |
6 |
46205 |
George |
Джордж |
США |
74,96% |
5 |
18443 |
Parishan |
Паришан |
Иран |
74,95% |
8 |
17594 |
Vegoritida |
Вегоритис |
Греция |
72,80% |
10 |
46049 |
Crescent |
Кресент |
США |
72,60% |
9 |
17352 |
Spiekeroog |
Спикеруг |
Германия |
72,41% |
4 |
15463 |
Girotte |
Жиротт |
Франция |
72,36% |
5 |
46831 |
Tsala Apopka |
Тсала Апока |
США |
71,52% |
3 |
17589 |
Trihonida |
Трихонис |
Греция |
71,41% |
7 |
30647 |
Baia Verde I |
Бая Верде I |
Румыния |
71,36% |
2 |
39734 |
Uguy |
Угуй |
Россия |
71,24% |
6 |
1311 |
Luner See |
Лунерзее |
Австрия |
70,87% |
5 |
30649 |
Baia Verde III |
Бая Верде III |
Румыния |
70,51% |
2 |
39744 |
Yarkul' |
Яркуль |
Россия |
70,37% |
6 |
18294 |
Danau Anggi Giti |
Данау Ангги Гити |
Индонезия |
69,77% |
9 |
18293 |
Danau Anggi Gigi |
Данау Ангги Гиги |
Индонезия |
69,59% |
7 |
13731 |
Vransko |
Вранско |
Хорватия |
69,38% |
6 |
17585 |
Limni Tsivlou |
Цивлос |
Греция |
69,22% |
5 |
43458 |
Murtensee |
Мютензее |
Швейцария |
68,35% |
7 |
15532 |
Mont Cenis |
Мон-Сени |
Франция/Италия |
67,56% |
2 |
46331 |
Jackson |
Джэксон |
США |
67,55% |
5 |
17588 |
Ozeros |
Озерос |
Греция |
67,40% |
3 |
44007 |
Karaviran |
Каравиран |
Турция |
67,21% |
7 |
39922 |
Chusovskoye |
Чусовское |
Россия |
66,88% |
4 |
45345 |
Chandler |
Чандлер |
США |
65,45% |
2 |
53150 |
Svitiaz |
Свитязь |
Украина |
65,36% |
8 |
46305 |
Iamonia |
Чмония |
США |
65,25% |
5 |
46864 |
Weir |
Вейр |
США |
65,20% |
5 |
^ О О § § § |
53 50 СИ |
53 |
s £ s о § Si |
50 |
и ж § s 50 |
О st ^ 1 at 53 |
g at СП 53 ^ |
1 1 & st |
|
31697 |
Kaldy |
Калды |
Россия |
65,17% |
3 |
||||
175941 |
Petron |
Петрон |
Греция |
64,97% |
4 |
||||
30648 |
Baia Verde II |
Бая Верде II |
Румыния |
64,73% |
2 |
||||
17402 |
Arendsee |
Арендзее |
Германия |
64,57% |
4 |
||||
40790 |
Serebryanka |
Серебрянка |
Россия |
62,19% |
2 |
||||
19 |
Band-i-Paner |
Панир |
Афганистан |
61,17% |
4 |
Как видно из Таблицы 3 аномалиями было признано 43 озера. Для всех водоемов выбросы были выявлены одновременно по ряду параметров, характеризующих глубину (средняя, максимальные и относительная глубины, коэффициент глубинности и коэффициент формы). Также было выявлено от 1 до 23 озера (в зависимости от конкретного морфометрического параметра) с индексами аномальности от 60,01% до 67,57% только по одному морфометрическому параметру, которые не вошли в выборку Таблицы 3.
Обсуждение
Экспертная оценка полученного набора озер свидетельствует, что в него попали многие водоемы, интересные не только своими аномальными морфометрическими характеристиками, но и обладающие уникальными экосистемами. Последнее, отчасти может быть обусловлено своеобразием строения их котловин, а также особенностью питания озера. Среди водоемов с наиболее высокими, множественными аномалиями – оз. Чрвено, Церик-Кель, Салда, Хайбат, Жирот и др.
Известно, что самым глубоким карстовым озером считается Чрвено (Красное), одно из Имотских озер Хорватии, глубина которого оценивается в 287 м [16]. Озеро лежит в глубокой карстовой воронке, имеющей глубину 530 м, и сформированной в результате разрушения подземной пещеры. Соседнее с ним оз. Модро занимает воронку поменьше и имеет глубину 91 м. Вода оз. Чрвено темно-синего цвета. Размеры составляют около 150 х 180 м, в зависимости от уровня воды [17]. В озере обитает эндемичная рыба Delminichthys adspersus, в сухое время года встречающаяся также и в окрестных реках и озерах, что предполагает наличие между ними подземных проток. Согласно проведенному исследованию, индекс аномальности s для оз. Чрвено по параметрам, характеризующим глубину и форму котловины, превысил 81%, для оз. Модра — около 60%.
Чуть меньшая глубина зафиксирована для оз. Церик-Кель, входящего в группу Голубых озер, расположенных в Черекском районе Кабардино-Балкарии на северном склоне Скалистого хребта. Площадь озера 0,0216 км², глубина — 279 м [18]. Озеро представляет собой одновременно карстовую шахту (пропасть) и карстовый источник. Оно относится к коррозионным водоемам, образованным напорными водами зоны вертикальной восходящей циркуляции [19]. Поверхностный приток отсутствует. Вода озера зеленовато-голубого цвета, имеет преимущественно сульфатно-кальциевый состав, содержит растворенный сероводород, наличие которого, согласно [20], обусловлено развитием в водоносном горизонте анаэробных бактериальных процессов. В отличие от других озер, входящих в группу Голубых, оз. Церик-Кель характеризуется отсутствием ихтиофауны. Согласно [18], в нем обнаружен рачок гаммарус, небольшое количество пиявок вблизи берегов, бокоплавов и водяных жуков около текущего из озера ручья. Индекс аномальности для оз. Церик-Кель по параметрам, характеризующим глубину, превысил 78%.
Среди карстовых водоемов аномальностью не только по глубине ( s ∼ 75%), но и по форме чаши ( s >68%) характеризуется оз. Салда в Турции (максимальный индекс аномальности выявлен по объему воды – 79,2%). Это солоноватоводное карстовое озеро площадью около 44 км2 глубиной 184 м с бирюзовой водой. Вода жесткая и высокощелочная [21]. Поверхностный сток отсутствует. Оз. Салда — одно из наиболее глубоких и чистых озер Турции, объявленное особой природоохранной зоной, согласно постановлению Президента от 14.03.2019 №824. Среди эндемиков, обитающих в озере — яровой гольян Бурдур (Pseudophoxinus burduricus) семейства карповых. В зимние месяцы на озере селятся редкие представители семейства утиных — белоглазый нырок (Aythya nyroca) и савка (Oxyura leucocephala), благодаря чему оно отнесено к водно-болотным угодьям мирового значения.
Среди озер со значительной площадью водного зеркала аномальные характеристики выявлены и для оз. Трихонис (Трихонида), расположенного в Западной Греции, в районе с широким развитием карста. наибольший выявленный индекс аномальности s >71%. Площадь озера Трихонис составляет 98,6 км2, глубина 58 м. Происхождение водоема смешанное. Возраст древний. Озеро имеет охранный статус (входит в сеть охранных участков «Натура 2000»). Его биота характеризуется высоким разнообразием. В озере обитает 25 видов рыб, 11 из которых являются эндемичными для Греции. Карликовый бычок трихонис (Economidichthys trichonis) встречается только в данном озере [22].
Среди озер Греции аномалии выявлены и для таких известных озер как Вегоритис и Петрон, расположенных в 2 км друг от друга на севере Греции. Наибольший индекс аномалии для оз. Вегоритис составляет s >72%, а для оз. Петрон s >65%. Оз. Вегоритис имеет площадь зеркала 54 км2, оз. Петрон — 12 км2, глубина обоих составляет около 70 м. На берегах озер встречаются 162 вида птиц, из которых гнездятся 87. На озерах зимуют утки и гуси, воспроизводятся белоглазый нырок и малый баклан [23]. Благодаря богатству орнитофауны западное побережье озера Вегоритис и область озера Петрон также внесены в сеть охранных участков «Натура 2000».
Известным и достаточно глубоким карстовым озером является оз. Свитязь (площадь зеркала 26,2 км2, макс. глубина 58,4 м), расположенное на Украине и, наряду с другими водоемами из группы Шацких озер, входящее в состав Шацкого природного национального парка. Вода в озере гидрокарбонатно-кальциевая, минерализация около 200 мг/дм³ [24]. Наибольший выявленный индекс аномальности составляет s >65%.
С максимальным индексом аномальности s > 78% в список уникальных водоемов попало и искусственное озеро Бушко Блато, расположенное на территории Боснии и Герцеговины в карстовом Ливанском поле, характеризующимся множеством уникальных природных явлений и карстовых особенностей.
Большое место в итоговом списке аномалий занимают озера, расположенные на территории нашей страны. Среди них, наряду с уже упомянутом оз. Церик-Кель, такие достаточно крупные озера, в образовании котловин которых принимали участие карстовые процессы, как оз. Чусовское, Духовое, Калды, Угуй. Оз. Чусовское (площадь зеркала 27,8 км2) находится в Пермском крае и включено в ООПТ «Озеро Чусовское». Наибольший выявленный индекс аномальности s >66%. Озеро расположено на дне заболоченной эрозионно-карстовой котловины. Вода гидрокарбонатно-хлоридно-натриевая, минерализация от 33 до 347 мг/л, богата органикой, имеет желто-коричневый цвет [25]. Озеро является местом скоплений водоплавающих и околоводных птиц во время весенних и осенних миграций. Гнездятся виды, занесенные в Красную книгу, такие как скопа и чернозобая гагара. Оз. Духовое (6,16 км2) расположено в Бурятии и включено в ООПТ местного значения «Баргузинское побережье Байкала». Наибольший выявленный индекс аномальности составляет s >78%. Озеро Угуй (24,3 км2) находится в Новосибирской области. Наибольший индекс аномальности s >71%. У южного берега озера утвержден памятник природы «Мирнинский рям», площадью 476 га, представляющий собой изолированный островной участок таежно-болотной растительности, расположенный среди лесостепного ландшафта на берегу озера, сохранившийся в малоизмененном виде на протяжении тысяч лет. Оз. Калды (16,7 км2) находится в Челябинской области и считается одним из самых ее теплых водоемов. Наибольший выявленный индекс аномалии >65%.
Исходя из полученной нами выборки, можно сделать вывод, что при индексе аномальности морфометрических характеристик, превышающем 60%, озеро с высокой вероятностью может быть признано уникальным и еще по целому ряду параметров. При этом, при поиске уникальных карстовых озер, характеристики формы чаши (прежде всего показатели глубины), более интересны, нежели характеристики, описывающие форму зеркала.
Проведенное исследование также показало, что аномальные значения морфометрических характеристик нередко были выявлены для озер смешанного происхождения. Это объясняется наличием у них нетипичной чаши и свидетельствует о том, что предложенный аппарат достаточно хорошо определяет выбросы, в нашем случае – котловины иной формы.
Необходимо отметить, что в полученной нами итоговой выборке большинство озер имеют охранный статус, некоторые (например оз. Салда) включены в состав Рамсарских угодий. В то же время, многие водоемы, признанные памятниками природы регионального значения, не были идентифицированы. Это объясняется тем, что присуждение таким озерам охранного статуса связано не с их аномальными морфометрическими характеристиками, а с обитанием в них редких краснокнижных видов растений и животных, или с их эстетической, культурной и рекреационной значимостью. Последнее представляется крайне важным, однако может обосновываться только экспертными оценками. С другой стороны, включение в итоговый список озер, по которым была выявлена только одна аномалия по какому-либо параметру, позволяет получить более широкую выборку для ее дальнейшего экспертного анализа. В такой выборке могут быть представлены озера – претенденты на присуждение им охранного статуса. Однако, при их поиске необходимо наряду с морфометрическими параметрами рассматривать и другие характеристики среды обитания. Для конкретной территории в этом случае могут быть учтены параметры, описывающие геохимию ландшафта. При этом идентификация аномалий с использованием проверенного в данном исследовании с помощью алгоритма машинного обучения Isolation Forest представляется оправданным.
Выводы
Как показывают, проводимые исследования, использование алгоритма машинного обучения i Forest для выделения водоемов с уникальными свойствами дает хорошие результаты. Многие озера из полученного в ходе анализа итогового списка отличаются не только аномалиями своих морфометрических параметров, но и обладают своеобразием других абиотических характеристик, а подчас – характеризуются уникальной биотой.
Существенным достоинством примененного в настоящем исследовании алгоритма i Forest является скорость его выполнения и меньшая трудоемкость в сравнении с анализом, построенным с учетом статистических критериев.
В то же время, необходимо признать, что при анализе различных типов озер мы не смогли применить единый математический аппарат поиска выбросов. В случае с озерами вулканического происхождения предварительный анализ исходных выборок свидетельствовал о возможности применения классических статистических критериев выявления выбросов. На примере озер карстового происхождения нами была продемонстрирована допустимость применения алгоритма машинного обучения i Forest, в случае, когда распределение не относится к распределениям Гаусса, Вейбула или экспоненциальному (или его нельзя привести к нормальному). В этой связи надо отметить, что в каждом конкретном случае возможность применения различных математических методов при поиске аномалий должна быть надежно обоснована на этапе предварительного анализа выборки.
Таким образом, выбор оптимального метода идентификации аномалий основывается на предварительном анализе выборки и ее принадлежности к той или иной области исследований. Надежность выбранного математического метода достигается путем верификации полученных результатов экспертом.
Финансирование: Работа выполнена в рамках проекта РФФИ 20-05-00303\20.
Список литературы Применение алгоритма Isolation Forest для обоснования уникальности водоемов в группе карстовых озер
- Измайлова А. В. Водные ресурсы озер России // География и природные ресурсы. 2016. №4. С. 5 14.
- Измайлова А. В. Расулова А. М., Шмакова В. Ю. Выделение озер, обладающих уникальными свойствами, статистическими методами // Гидрометеорология и экология. 2021. № 62. С. 27 51.
- Драбкова В. Г., Сорокин И. Н. Озеро и его водосбор единая природная система. Л.: Наука. Ленингр. отд ние, 1979. 196 с.
- Мякишева Н. В. Многокритериальная классификация озер. СПб.: Изд во РГГМУ, 2009. 160 с.
- Поздняков Ш. Р., Измайлова А. В., Расулова А. М. Уникальные озера как объект научного интереса // Известия РГО. 2020. Т. 152. №3. С. 17 31.
- Bajkiewicz Grabowska E., Magnuszewski A., Mikulski Z. Hydrometria. PWN, Warszawa, 1993. 313 P.
- Ахмедова Н. С. Особенности морфометрического строения различных типов карстовых озер // География: проблемы науки и образования. LXIII Герценовские чтения. Материалы ежегодной Всероссийской научно методической конференции. СПб.: Полиграф Ресурс, 2010. С. 360 362.
- Богословский Б. Б. Озероведение. Изд во МГУ. 1960. 336 с.
- Chen Z., Auler A. S., Bakalowicz M., Drew D., Griger F., Hartmann J., Jiang G., et al. The World Karst Aquifer Mapping project: concept, mapping procedure and map of Europe // Hydrogeology J., 2017. No 25 (3). P. 771 785. doi: 10.1007/s10040 016 1519 3
- Григорьев C. B. О гидрологических типах водоемах // Труды V научной конференции по изучению внутренних водоемов Прибалтики. Минск, 1959. С.46 55.
- Box G. E. P., Cox D. R. An analysis of transformations // Journal of the Royal Statistical Society: Series B (Methodological). 1964. V. 26. №2. P. 211 243. https://doi.org/10.1111/j.25176161.1964.tb00553.x
- Liu F. T., Ting K. M., Zhou Z. H. Isolation forest //2008 eighth ieee international conference on data mining. IEEE, 2008. P. 413 422. https://doi.org/10.1109/ICDM.2008.17
- Tan S. C., Ting K. M., Liu T. F. Fast anomaly detection for streaming data //Twenty Second International Joint Conference on Artificial Intelligence. 2011.
- Liu F. T., Ting K. M., Zhou Z. H. Isolation based anomaly detection // ACM Transactions on Knowledge Discovery from Data (TKDD). 2012. V. 6. №1. P. 1 39. https://doi.org/10.1145/2133360.2133363
- Preiss B. R. Data structures and algorithms with object oriented design patterns in C++. John Wiley & Sons, 2008.
- Ozimec R., Jalžić B., Jelić D. Preliminarni izvještaj prirodoslovnih istraživanja u okviru Speleoronilačke ekspedicije Crveno jezero 2017 // Subterranea Croatica. 2017. V. 15. №2. P. 34 41.
- Garasic M. Crveno jezero the biggest sinkhole in Dinaric Karst (Croatia) // Abbasi, A. et Giesen, N., éditeurs: EGU General Assembly Conference Abstracts. 2012. V. 14. P. 7132.
- Ефремов Ю. В. Голубое ожерелье Кавказа. Л.: Гидрометеоиздат, 1988. 160 с.
- Максимович Н. Г., Мещерякова О. Ю., Деменев А. Д. Уникальность карстового озера Церик Кель (Голубое озеро) в Кабардино Балкарии // Озера Евразии: проблемы и пути решения. Петрозаводск, 2017. С. 92 98.
- Хмурчик В. Т. Микробиологические исследования оз. Черик Кель (Кабардино Балкарская Республика) // Известия Высших учебных заведений. Северо Кавказский регион. Сер. Естественные Науки, 2013. №3 (175). С. 60 62.
- Kazanci N., Girgin S., Dügel M. On the limnology of Salda Lake, a large and deep soda lake in southwestern Turkey: future management proposals // Aquatic Conservation: Marine and Freshwater Ecosystems. 2004. V. 14. №2. P. 151 162. https://doi.org/10.1002/aqc.609
- LIMNES TRICHONIDA KAI LYSIMACHEIA GR2310009 Natura 2000. https://natura2000.eea.europa.eu/Natura2000/SDF.aspx?site=GR2310009
- LIMNI PETRON N2K GR1340007 dataforms. Natura 2000. https://natura2000.eea.europa.eu/Natura2000/SDF.aspx?site=GR1340007
- Хільчевський В. К. Перші комплексні гідрохімічні дослідження Шацьких озер на Волині у 1975 р. // Гідрологія, гідрохімія і гідроекологія. 2015. Т. 4(39). С. 64 71.
- Кадастровый отчет по ООПТ охраняемый природный ландшафт регионального значения «Чусовское озеро» // ООПТ России. http://oopt.info/