Оценка загрязненности осадков в заброшенном шламохранилище и их стратификация с использованием алгоритмов машинного обучения

Автор: Белкин П.А., Дробинина Е.В., Храмова С.И.

Журнал: Вестник Пермского университета. Геология @geology-vestnik-psu

Рубрика: Геоэкология

Статья в выпуске: 4 т.24, 2025 года.

Бесплатный доступ

Целями данного исследования являются оценка загрязненности толщи осадков, накопленных в заброшенном шламохранилище, а также разработка и апробация автоматизированного подхода к стратификации осадков. Оценка загрязненности произведена на основе данных о химическом составе осадков с применением интегральных индексов нагрузки тяжелыми металлами: суммарный показатель загрязнения Zс и индекс потенциального экологического риска RI. Согласно расчету, накопленные осадки характеризуются преимущественно высоким уровнем загрязнения в соответствии с оценочными критериями. Автоматизированный подход к стратификации осадков реализован с применением алгоритмов машинно-го обучения. В работе представлено описание алгоритма, реализованного на языке Python, приведены результаты его тестирования на примере осадков техногенного водоема. При кластеризации в изучаемых осадках выделено 5 слоев, значимо отличающихся по химическому составу. Построенные разрезы визуализируют неоднородное строение толщи осадков и в высокой степени согласуются с разрезами по значениям интегральных индексов, построенными ручными методами. Наилучшие результаты получены с применением метода кубической интерполяции.

Еще

Промышленные отходы, осадки сточных вод, донные осадки, шламохранилище, интегральная оценка загрязненности, машинное обучение, кластеризация

Короткий адрес: https://sciup.org/147253109

IDR: 147253109   |   УДК: 504.064   |   DOI: 10.17072/psu.geol.24.4.376

Evaluation of Sediment Pollution in an Abandoned Alkaline Slurry Pond and Its Stratification Using the Machine Learning Techniques

The aim of this study is to characterize the contamination of sediments accumulated in an abandoned sludge storage facility, to develop, and test an automated method for precipitation stratification. The assessment of pol-lution is based on the sludge chemical composition using integral heavy metal indices: the total pollution index (Zc), and the potential environmental risk index (RI). According to the calculations, high level of pond sediments pollution was revealed. An automated approach to sediments stratification has been implemented using machine learning algorithms. This paper describes the Python-based algorithm and presents the results of its testing on sediment samples from a man-made reservoir. During the clustering process, five distinct layers were identified, which differ significantly in their chemical composition. The constructed cross-sections display the heterogeneous structure of the sediment column, and are in good agreement with the sections based on values of integral indices obtained manually. The best results were achieved using the cubic interpolation method.

Еще

Текст научной статьи Оценка загрязненности осадков в заброшенном шламохранилище и их стратификация с использованием алгоритмов машинного обучения

Добыча и переработка полезных ископаемых является наиболее ресурсоемкой отраслью хозяйства. Закономерным следствием этого становится лидирующая позиция отрасли в образовании отходов. Так, согласно сведениям государственной статистической отчетности, в 2024 г. в Российской Федерации было образовано более 8,5 млрд т отходов производства и потребления. При этом, согласно данным справочника ИТС 17-2024 «Размещение отходов производства и потребления», более 90 % объемов образования отходов составляют отходы добычи полезных ископаемых. Размещение колоссального объема горнопромышленных отходов обычно производится в специализированных сооружениях.

Состав и свойства промышленных отходов даже в пределах одного объекта размещения могут характеризоваться существенной неоднородностью. Вариации химического и минерального состава отходов, их гранулометрических свойств, плотности и других характеристик могут быть связаны с особенностями поступающего сырья, модернизацией технологических линий, проявлениями процессов уплотнения отходов, поступления атмосферных вод и других факторов (Целюк, 2019). Достоверное установление изменчивости свойств отходов в местах их складирования является важной задачей на постэксплуатационном этапе объектов размещения, который может предусматривать как консервацию объектов, так и рекультивацию накопленных отходов и их вторичное использование. Вместе с этим накоп-

Работа лицензирована в соответствии с CC BY 4.0. Чтобы просмотреть копию

этой лицензии, посетите

ленные отходы могут содержать токсичные вещества (тяжелые металлы, нефтепродукты, стойкие органические загрязнители), которые представляют потенциальный источник вторичного загрязнения окружающей среды даже после прекращения прямых сбросов (Крупская и др., 2020). Таким образом, ключевым этапом подготовки к рекультивации является достоверное установление специфики и уровня загрязнения отходов. Кроме того, в случае их большой мощности, важной практической задачей является типизация и стратификация толщи на основании неоднородности свойств.

Цель данного исследования – оценка загрязненности толщи техногенных осадков, накопленных в заброшенном шламохрани-лище, а также разработка и апробация автоматизированного подхода к стратификации осадков. Автоматизированный подход реализуется с применением алгоритмов машинного обучения. К ожидаемым преимуществам предлагаемого метода можно отнести точность и объективность выделения слоев осадка и зон загрязнения; возможность выявить скрытые закономерности и корреляции между элементами, неочевидные при ручном анализе данных. Также с применением такого подхода возможно существенно ускорить процесс обработки данных и принятия решений. Создаваемая цифровая модель распределения загрязняющих веществ может являться основой для расчета точных объемов извлечения загрязненных осадков в зависимости от специфики и степени загрязнения, подбора ориентированных методов очистки (например, конкретных реагентов для иммобилизации определенных металлов) и оптимизации всей технологии рекультивации.

Исследуемый объект

Объектом исследования выступил техногенный пруд, расположенный в промышленной зоне г. Березники (Пермский край, Россия, рис. 1).

51° WE 62*1T59"N

Рис. 1. Местоположение территории исследований

Данный пруд был создан в 1960–1970х гг. на территории бывшего завода кальцинированной соды и функционировал как резервный накопитель промышленных отходов (шламохранилище) на период строительства основного шламонакопителя. После ввода последнего в эксплуатацию, исследуемый объект продолжал периодически принимать сточные воды, поступавшие с различных предприятий Березниковского промышленного узла, что обусловило его значительную техногенную нагрузку. В целом территория Березниковско-Соликам-ской агломерации является ярким примером проявления высокой урботехногенной нагрузки (Белкин, 2020; Ушакова и др., 2022). В настоящее время техногенный пруд, долгое время выполнявший функцию шламохранилища, представляет собой изолированную систему. Его питание осуществляется преимущественно за счет атмосферных осадков, так как промышленные сбросы полностью прекращены. За период его существования в ложе пруда сформировалась толща мелкодисперсных осадков мощностью до 5 м.

Исследование состава осадка из техногенного пруда с отбором проб проводилось в сентябре 2024 г. и в марте 2025 г. (Belkin et al., 2025). Места отбора проб техногенного осадка (рис. 1) были выбраны таким образом, чтобы охватить различные участки отстойника по двум перпендикулярным линиям N – S и W – E. Из каждой скважины было отобрано не менее 9 образцов для проведения лабораторных исследований.

Вследствие изменений состава сточных вод на различных этапах его функционирования накопленные осадки имеют слоистое строение и неоднородны по составу и свойствам (Belkin et al., 2025). Вместе с этим для каждого из слоев характерно высокое содержание хлоридов (до 230 г/кг по хлорид-иону в водной вытяжке) и сильнощелочная рН (>10). Несмотря на отсутствие видимой гидравлической связи, близкое расположение (150 м) к р. Каме – ключевой водной артерии региона – создает потенциальные риски загрязнения, актуализируя задачу оценки экологического состояния донных отложений и разработки мер по рекультивации заброшенного объекта.

Оценка состояния и загрязнения осадков

Осадки, формирующиеся в природных и техногенных водных объектах вследствие своих высоких сорбционных свойств, способны накапливать широкий комплекс загрязняющих веществ и служат индикатором техногенной нагрузки. Наряду с высокой соленостью и щелочностью, в исследованных осадках были выявлены высокие концентрации токсичных микроэлементов (медь, хром, свинец, сурьма, мышьяк), относящихся к группе тяжелых металлов.

Тяжелые металлы являются одними из наиболее опасных загрязнителей в донных осадках. При этом утвержденных предельнодопустимых концентраций (ПДК) для донных отложений природных водоемов в РФ не установлено (Коломийцев и др., 2015). В качестве базы сравнения содержания микроэлементов в природных и техногенных донных осадках используются кларки осадочных пород, геохимический фон (Куракина, Шлыгина, 2017).

Для типизации толщи осадков по суммарной нагрузке металлами в данной работе применены интегральные индексы. Наиболее распространенным инструментом для интегральной оценки загрязнения депонирующих сред в РФ является суммарный показатель химического загрязнения Zc . Показатель характеризует степень химического загрязнения вредными веществами различных классов опасности и определяется как сумма коэффициентов концентрации отдельных компонентов. Он рассчитывается по формуле:

n

Zc = (У Kc)-(n- 1), где n – число определяемых компонентов; Kci – коэффициент концентрации i-го загрязняющего компонента, равный кратности превышения содержания данного компонента над фоновым значением.

Ориентировочная шкала оценки загрязнения природных водных объектов по интенсивности накопления химических элементов в донных отложениях следующая: Zc <10 – уровень техногенного загрязнения (УТЗ) слабый; 10–30 – УТЗ средний; 30–100 – УТЗ высокий; 100–300 – УТЗ очень высокий; >300, УТЗ чрезвычайно высокий (табл.) (Янин, 2002).

В зарубежной практике для оценки потенциального экологического риска используют экологический индекс RI, который показывает токсичность, определяемую содержанием тяжелых металлов, и их потенциальное воздействие на экосистему. RI рассчитывается по формуле:

, где RI – мономиальный потенциальный экологический фактор риска; Ti – коэффициент токсичности тяжелых металлов; Ci – практическая концентрация металлов в почве; Bi – фоновое значение для тяжелых металлов. Для интерпретации и оценки потенциального экологического индекса RI применяется следующая шкала: RI ≤ 50 – низкий риск; 50 < RI ≤ 100 – умеренный риск; 100 < RI ≤ 150 – высокий риск; 150 < RI ≤ 200 – очень высокий риск; RI > 200 – крайний риск (табл.). Индексы токсичности Ti приняты по данным (Yang et al., 2014).

Таблица. Цветовая шкала отображения индексов степени загрязнения тяжелыми металлами

Уровень техногенного загрязнения Z c (Янин, 2002)

Потенциальный эко-логическиый риск RI (Yang et al., 2014)

Zc <10 слабый

RI ≤ 50 низкий

10 <  Zc ≤ 30

50 < RI ≤ 75 умеренный

средний

75 < RI ≤ 100 умеренный

30< Zc ≤ 50 высокий

100 < RI ≤ 150

50< Zc ≤ 100 высокий

высокий

100< Zc ≤ 300 очень высокий

150 < RI ≤ 200 очень высокий

Zc > 300 чрезвычайно высокий

RI > 200 крайний

Выбор индексов RI, Zc для оценки загрязненности осадков обоснован их способностью комплексно оценивать уровень загрязнения, учитывать токсичность веществ и сравнивать данные с естественными фоновыми уровнями.

Индекс Zc помогает быстро идентифицировать наиболее опасные компоненты осадков и определить приоритетные направления для мониторинга и очистки. Основным пре- имуществом является нормативное закрепление этого инструмента в практике инженерно-экологических изысканий, что определяет наличие большой базы для сравнения. Преимущество RI заключается в учете токсичности отдельных элементов, что делает его полезным инструментом для оценки угроз при потенциальном взаимодействии с компонентами окружающей среды.

Рассматривая результаты расчета индекса Zc (рис. 2), можно отметить, что преобладающая часть осадка характеризуется высоким уровнем техногенного загрязнения (соответствует интервалу значений Zc 30–100). Верхние слои колонок соответствуют слабому и среднему уровню загрязнения, отдельные слои в средних частях колонок «W», «С», «S» – очень высокому уровню загрязнения металлами.

Анализ результатов расчета индекса RI (рис. 3) позволяет произвести более детализированную характеристику слоев по уровню загрязнения металлами. Массив осадков в средней части разреза характеризуется высоким риском загрязнения (100 <  RI ≤ 150). При этом преобладающая часть осадка по изученному разрезу характеризуется меньшей степенью загрязнения, соответствующей умеренному риску по RI (50 <  RI ≤ 100). К областям с низким риском загрязнения металлами принадлежат осадки верхних и нижних слоев изученных скважин.

При сопоставлении результатов использования двух вариантов интегральных индексов (Zc и RI) следует отметить большую избирательность и информативность второго. В совокупности с учетом того, что при его расчете учитываются показатели токсичности каждого элемента, в результате проведенных исследований следует рекомендовать результаты расчета индекса RI для оценки опасности загрязнения техногенных осадков тяжелыми металлами.

Методика автоматизированного выделения границ слоев

Сегодня стратификация осадочных толщ базируется на визуальном описании керна, данных геофизических исследований скважин (ГИС), ручном выделении слоев по набору определяющих свойств пород.

Рис. 2. Разрез по значениям Zc

Рис. 3. Разрез по значениям RI

Такой подход иногда приводит к получению субъективной и обобщенной информации о строении разреза. Качественный скачок в области геологии и инженерной геологии, в частности, связан с появлением и развитием цифровых технологий, коренным образом изменивших подходы к анализу данных.

Современные методы работы с цифровыми данными, включая машинное обучение, многомерный статистический анализ, позволяют перейти от усредненного представления о толще пород к ее объективной и количественной стратификации.

Весьма интересным примером является исследование отечественных ученых из МГТУ им. Баумана и АО «МОСТ-ДОРГЕО-ТРЕСТ», которые представили метод машинного обучения для выделения инженерногеологических элементов (ИГЭ) в дисперсных грунтах. С использованием выявленных методом главных компонент (principal component method, PCA) ключевых параметров из числа физико-механических свойств, а также глубины отбора и коэффициент бокового давления 90 образцов авторами произведено стратифицирование грунтовой толщи. Для выделения инженерно-геологических элемен- тов (ИГЭ) использовались алгоритмы кластеризации. Для интерполяции с целью визуализации инженерно-геологического разреза применен индикаторный кригинг (Tishin et al., 2025).

В данной работе предлагается автоматизированный подход к разделению донного осадка на слои в зависимости от его химического состава. Для расчета привлечены результаты определения химического состава осадка методом рентгенофлуоресцентного анализа, приведенные в работе (Belkin et al., 2025). В частности, этот перечень включает в себя данные определений основного оксидного состава твердой фазы осадка (CaO, Fe 2 O 3 , SO 3 , MgO, SiO 2 , Na 2 O, Al 2 O 3 , K 2 O, MnO, TiO 2 , P 2 O 5 ), хлор (Cl) и потери при прокаливании (ППП), а также 24 микроэлементов (Sc, V, Cr, Co, Ni, Cu, Zn, Ga, As, Rb, Sr, Y, Zr, Nb, Sn, Sb, Cs, Ba, La, Ce, Pb, Th, U, Mo).

Реализация предлагаемого методического подхода демонстрируется на примере разреза по линии «N»–«C»–«S» (рис. 1). Методом k-means (k-средних) проведена кластеризация по отдельным скважинам для выделения отдельных слоев (рис. 4.). В качестве входных данных для алгоритма k-means использован датафрейм (dataframe), содержащий признаки, по которым производилась группировка: перечисленные выше определения основного оксидного состава твердой фазы осадка, хлор, ППП и 24 микроэлемента.

Рис. 4. Пример стратификации осадка на слои

Выбор оптимального числа кластеров (слоев) произведен методом локтя и равен 5. Каждому слою соответствует свой цвет. Для оценки качества кластеризации выбран коэффициент силуэта кластера (Cluster silhouette index), который при таком наборе входных параметров дал удовлетворитель- ные оценки – 0,2. Повышение данной метрики возможно после предварительной подготовки набора входных данных посредством сокращения размерности данных методом PCA.

Используя алгоритм кластеризации, можно построить для каждой скважины график изменения по слоям значений выбранного параметра, например содержание основного компонента осадка – оксида кальция CaO, % (рис. 5). Кластеризация произведена по тому же набору данных, однако визуализация учитывает изменение конкретного компонента. Такой подход применим также для визуальной оценки качества автоматизированного деления на слои в зависимости от содержания этого компонента.

Все компоненты химического состава нормализованы и выражены в процентах. Как видно из графика, распределение процентного содержания оксида кальция в выделенных слоях согласуется с историей формирования водоема (Belkin et al., 2025).

С использованием того же набора данных, характеризующего химический состав осадка, в автоматизированном режиме построен разрез по линии «N»–«C»–«S» с учетом деления осадка на пять слоев. Современный инструментарий предлагает широкий спектр методов интерполяции и ее визуализации. В рамках данного исследования для визуализации разреза проведена интерполяция различными методами: nearest – ближайший сосед (категориальный), linear – линейная, cubic – кубическая (гладкая интерполяция), rbf_inverse – радиальные базисные функции (обратная) (рис. 6).

Таким образом, представленные разрезы визуализируют разделение осадка по основным литогенным компонентам их состава с одновременным учетом нагрузки тяжелыми металлами. Отметим, что наиболее визуально привлекательным и отражающим экологическое состояние является тот разрез, который построен методом кубической интерполяции. Однако метод ближайшего соседа максимально точно учел результаты кластеризации.

Несмотря на некоторые визуальные различия, принципиально все методы выдают одну картину: относительно однородная нижняя часть и пестрая верхняя, что отражает

Рис. 5. Г рафик изменения содержания CaO по слоям

Скважина С нам

Слои осадка • Слой 1

• Слой 2 ф Слой 3

• Слой 4

• Слой 5

Сравнение методов интерполяции геологического разреза

Рис. 6. Визуализация разреза по линии «N»–«C»–«S» различными методами

частую смену условий осадконакопления на протяжении последнего периода существования пруда-отстойника. При этом сопоставление данных на рис. 4 и 6 дает основание утверждать, что автоматизированный расчет позволил выделить слои осадка, характеризующиеся повышенной нагрузкой тяжелыми металлами (наиболее загрязнен- ные слои приурочены к средней части осадка).

Заключение

Проведенное исследование продемонстрировало эффективность комплексного подхода к оценке состояния и загрязнения донных отложений, сочетающего современ- ные методы геохимического анализа и алгоритмы машинного обучения.

Дальнейшее развитие методики требует разработки алгоритма, тщательной подготовки исходных данных, оптимизации набора признаков для кластеризации для решения конкретных задач и интеграции с традиционными методами стратиграфического анализа. Перспективы использования метода связаны с разработкой адаптивных алгоритмов кластеризации, учитывающих пространственную корреляцию данных, и созданием комплексных моделей, интегрирующих различные показатели для более точной оценки экологического состояния донных осадков изучаемого объекта. Предлагаемый к применению подход при должном методическом обосновании может стать актуальным для изучения толщ накопленных отходов и других неоднородных образований при разработке проектов рекультивации отработанных объектов размещения отходов, а также объектов накопленного вреда окружающей среде.

Исследование выполнено за счет гранта Российского научного фонда № 24-77-10062,