Прогнозирование структурного типа нефтяного кокса методами машинного обучения в составе ядра цифрового двойника

В. В. Бухтояров; Н. А. Шепета; И. С. Некрасов; А. Ю. Михайлов

doi:10.47813/2782-5280-2025-4-4-2024-2032

Научные статьи \ Прикладные науки. Медицина. Технология \ Химическая технология. Химическая промышленность. Родственные отрасли \ Масла. Жиры. Воски. Клеящие вещества. Смолы. Камеди

Прогнозирование структурного типа нефтяного кокса методами машинного обучения в составе ядра цифрового двойника

Автор: В. В. Бухтояров, Н. А. Шепета, И. С. Некрасов, А. Ю. Михайлов

Журнал: Informatics. Economics. Management - Информатика. Экономика. Управление.

Рубрика: Системный анализ, управление и обработка информации

Статья в выпуске: 4 (4), 2025 года.

Бесплатный доступ

В условиях роста доли тяжёлого сырья в нефтепереработке целенаправленное получение нефтяного кокса с заданной структурой является ключевой задачей для максимизации экономической отдачи. Существующие методы визуальной классификации обладают субъективностью и значительным временным лагом, что исключает возможность оперативного управления процессом. В данной работе проведён сравнительный анализ эффективности трёх методов машинного обучения: многослойного персептрона, метода опорных векторов и градиентного бустинга для решения задачи многоклассовой классификации структурного типа кокса на основе промышленных данных установки замедленного коксования. Использован массив исторических данных, включающий параметры сырья и технологического режима. Результаты показали, что наивысшую точность (98,5%) и сбалансированность метрик демонстрирует нейросетевая модель, превзойдя метод градиентного бустинга (96,7%) и метод опорных векторов (91,3%). Выявлены и ранжированы ключевые факторы, влияющие на формирование структуры: максимальная температура, коксуемость сырья и скорость нагрева. Разработанная модель предлагается в качестве интеллектуального модуля для интеграции в архитектуру гибридного цифрового двойника технологического процесса, обеспечивая переход к предиктивному управлению качеством продукции.

Нефтяной коксструктурный типмашинное обучениеклассификациямногослойный перцептронградиентный бустингцифровой двойникзамедленное коксованиепрогнозная модельпромышленные данные

Короткий адрес: https://sciup.org/14135076

IDR: 14135076 | DOI: 10.47813/2782-5280-2025-4-4-2024-2032

Текст статьи Прогнозирование структурного типа нефтяного кокса методами машинного обучения в составе ядра цифрового двойника

DOI:

Современная нефтеперерабатывающая промышленность, сталкиваясь с ростом доли тяжелого сырья, в значительной степени опирается на процессы коксования для получения твердого углеродистого остатка — нефтяного кокса [1, 2]. Его конечная стоимость и область применения кардинально зависят от макроскопической структуры, традиционно классифицируемой как губчатый, переходный, игольчатый кокс [3, 4]. Каждый тип обладает уникальным набором физико-химических свойств, определяющих его пригодность для производства анодов в алюминиевой промышленности, электродов сталеплавильного производства или использования в качестве топлива [5]. Точное прогнозирование и целенаправленное получение заданного структурного типа является критически важной задачей для максимизации экономической отдачи от установки замедленного коксования. В существующей промышленной практике идентификация типа кокса чаще всего проводится визуально, по данным петрографического анализа, что вносит субъективность и создает значительный временной лаг между окончанием технологического цикла и получением информации о продукте [6]. Этот лаг исключает возможность оперативной корректировки режима для целевого управления структурой.

Фундаментальные исследования установили качественную связь между структурой кокса и такими параметрами, как температура процесса, скорость нагрева и групповой химический состав сырья [7, 8]. Однако создание количественных, пригодных для инженерного прогноза детерминистических (основанных на первых принципах) моделей, описывающих формирование сложной твердофазной структуры, остается чрезвычайно сложной задачей из-за многостадийности и многофакторности процесса [9]. В этой связи методы анализа данных и машинного обучения (МО) представляют собой мощную альтернативу, позволяющую выявлять скрытые закономерности непосредственно из исторических промышленных данных, минуя необходимость полного физического описания [10].

В литературе можно встретить примеры применения различных алгоритмов МО для решения смежных задач в нефтепереработке, таких как прогнозирование выхода продуктов или содержания серы [11]. В частности, для задач классификации успешно применяются искусственные нейронные сети, метод опорных векторов и ансамбли деревьев решений [12, 13]. Однако комплексный сравнительный анализ эффективности этих методов именно для задачи прогнозирования структурного типа нефтяного кокса на основе полного набора технологических и сырьевых параметров, характерных для промышленной установки, в литературе представлен недостаточно. Большинство работ фокусируется на прогнозировании отдельных физических свойств, а не на качественной классификации макроструктуры, которая является первичным и интегральным показателем качества.

Целью данной работы является проведение сравнительного анализа эффективности трёх современных методов машинного обучения многослойного перcептрона, метода опорных векторов и градиентного бустинга для решения задачи многоклассовой классификации структурного типа нефтяного кокса по параметрам сырья и технологического режима. Исследование выполняется в рамках проекта по созданию комплексного цифрового двойника производства кокса, где модуль прогнозирования типа структуры является ключевым элементом системы поддержки принятия решений для планирования и оптимизации технологических циклов.

Для реализации этой цели в работе поэтапно решается ряд задач. Первым шагом является предобработка и всесторонний анализ промышленного массива исторических данных, содержащего подробные параметры сырья, режима коксования и результаты экспертной классификации типа кокса. Затем осуществляется реализация и тонкая оптимизация трёх выбранных моделей классификации с использованием специализированного программного обеспечения для анализа данных. Следующий критически важный этап — объективная оценка и сравнение обученных моделей по комплексному набору метрик на независимой тестовой выборке. Полученные модели сравниваются по точности и подвергаются интерпретации, направленной на выявление наиболее значимых технологических параметров, детерминирующих формирование макроструктуры конечного продукта. Завершающей задачей работы является формулирование конкретных практических рекомендаций по интеграции наиболее эффективной модели классификации в архитектуру формируемого цифрового двойника.

Научная новизна представленного исследования заключается в системном применении и сопоставлении методов машинного обучения для решения конкретной, ранее недостаточно изученной технологической задачи классификации структуры нефтяного кокса. Результаты работы закладывают фундамент для создания адаптивного интеллектуального модуля, способного в перспективе не только осуществлять точный прогноз, но и генерировать рекомендации по технологическим режимам для целенаправленного получения кокса заданного структурного типа.

МАТЕРИАЛЫ И МЕТОДЫ

Структура данных для проведения

ИССЛЕДОВАНИЯ

В качестве исходных данных использовался массив исторических записей промышленной установки замедленного коксования. Для каждого цикла были доступны следующие группы параметров:

1. Характеристики сырья: содержание серы (% масс.), плотность (кг/м³), коксуемость по Конрадсону (% масс.), содержание асфальтенов (% масс.), смол (% масс.), вязкость (сПз), содержание металлов (ppm).
2. Параметры технологического режима: максимальная температура цикла (°C), время пребывания при температуре выше 400°C (ч), скорость нагрева (°C/ч), давление (бар), продолжительность цикла (ч).
3. Целевая переменная: классификационный код структурного типа кокса, определенный экспертами на основе петрографического анализа.

В выборке представлены три основных класса: «Губчатый», «Переходный», «Игольчатый».

Перед анализом данные прошли стандартную процедуру предобработки в среде Statistica. Для числовых признаков была выполнена проверка на выбросы с использованием метода межквартильного размаха, пропущенные значения были заменены медианными значениями по классу. Все числовые признаки были стандартизированы для приведения к единому масштаб для корректной работы классификатора на основе опорных векторов и эффективного обучения нейронной сети [12, 13]. Далее данные были разделены на обучающую

(70%), валидационную (15%) и тестовую (15%) выборки с сохранением пропорций классов для обеспечения репрезентативности.

Методы классификации и стратегия их

ПРИМЕНЕНИЯ

Для решения задачи многоклассовой классификации были выбраны три широко применяемых и методологически различных алгоритма машинного обучения. Данный выбор обеспечивает всестороннюю проверку подхода: многослойный персептрон представляет семейство нейросетевых моделей, способных выявлять сложные нелинейные зависимости; метод опорных векторов является классическим алгоритмом с четкой геометрической интерпретацией, эффективным на данных умеренного объёма; градиентный бустинг, в свою очередь, демонстрирует высокую эффективность на структурированных табличных данных за счёт построения ансамбля простых моделей. Сравнение методов с различными индуктивными принципами позволяет выявить наиболее подходящий для специфики технологических данных.

1. Многослойный перцептрон: искусственная нейронная сеть прямого распространения, состоящая из входного, скрытого и выходного слоев [14]. Способна аппроксимировать сложные нелинейные границы между классами. Для данной задачи была выбрана архитектура с одним скрытым слоем, содержащим до 10 нейронов (определено в ходе предварительных экспериментов на валидационной выборке). В качестве функции активации в скрытом слое использовалась гиперболический тангенс, на выходном слое — функция softmax для получения вероятностей принадлежности к каждому классу. Обучение проводилось с помощью алгоритма BFGS.
2. Метод опорных векторов: алгоритм, основанный на поиске оптимальной разделяющей гиперплоскости в пространстве признаков, максимизирующей зазор между классами [15]. Для решения нелинейной задачи использовалось радиальнобазисное (RBF) ядро. Критически важные гиперпараметры: штрафной коэффициент C , регулирующий компромисс между величиной зазора и количеством ошибок на обучающей выборке, и параметр ядра γ —
3. Градиентный бустинг: мощный ансамблевый метод, который последовательно строит множество «слабых» моделей (обычно неглубоких деревьев решений), где каждая следующая модель корректирует ошибки предыдущих [16]. В работе использовалась реализация, устойчивая к переобучению и эффективно работающая с категориальными признаками. Были настроены следующие гиперпараметры: глубина деревьев (6), темп обучения (0,05), количество итераций (500).

подбирались методом сеточного поиска на основе кросс-валидации (5 folds) на обучающем наборе.

Сравнительное исследование и метрики

ОЦЕНКИ

Для объективного сравнения все три модели обучались и настраивались на 5-кратном переразбиении для обучающей и тестовой выборках. Итоговая оценка эффективности проводилась на изолированной валидационной выборке, не использованной при подборе гиперпараметров и при обучении. Качество моделей оценивалось с помощью набора стандартных метрик для задач классификации:

общая точность ( Accuracy ) – доля верно классифицированных объектов; полнота ( Recall ), точность определения конкретного класса ( Precision ) и F1 -мера ( F1-Score ), рассчитанные для каждого класса с последующим усреднением (макро-усреднение).

РЕЗУЛЬТАТЫ

Результаты сравнительного

ИССЛЕДОВАНИЯ ЭФФЕКТИВНОСТИ МОДЕЛЕЙ КЛАССИФИКАЦИИ

Экспериментальное сравнение трёх алгоритмов на независимой валидационной выборке промышленных циклов показало их существенно различающуюся эффективность в задаче прогнозирования структурного типа кокса. Наивысшую общую точность и сбалансированность метрик продемонстрировал нейросетевой подход, обеспечивший достижение значения точности 98,5%. Алгоритм градиентного бустинга позволил сформировать модели со средней метрикой точности 96,7%, метод опорных векторов с радиально-базисным ядром обеспечил построение моделей с точностью 91,3% и показал критически низкие метрики для класса «Переходный» кокс.

Таблица 1. Сравнение метрик классификаторов для определения структуры получаемого кокса по параметрам ТЕХНОЛОГИЧЕСКОГО ПРОЦЕССА И ХАРАКТЕРИСТИКАМ СЫРЬЯ .

Table 1 Comparison of classifier metrics for determining the structure of the obtained coke based on process parameters and feedstock characteristics.

Метод формирования классификатора	Accuracy	Precision (макро)	Recall (макро)	F1-Score (макро)
Нейросетевой классификатор	0,985	0,990	0,910	0,944
Метод градиентного бустинга (ансамбль деревьев)	0,967	0,936	0,844	0,881
Метод опорных векторов	0,913	0,610	0,621	0,615

Приведем и далее выполним анализ также матриц ошибок для каждого из методов (Таблицы 2-4).

Таблица 2. Усредненная матрица ошибок классификаторов на основе нейронной сети. Table 2. Averaged confusion matrix of neural network-based classifiers.

Реальный \ Предсказанный	Губчатый	Переходный	Игольчатый
Губчатый	98,5%	0,0%	1,5%
Переходный	0,0%	75,0%	25,0%
Игольчатый	0,6%	0,0%	99,4%

Таблица 3. Усредненная матрица ошибок классификаторов, сформированных методом градиентного бустинга НА ОСНОВЕ ДЕРЕВЬЕВ .

Table 3. Averaged confusion matrix of classifiers formed by the gradient boosting trees method.

Реальный \ Предсказанный	Губчатый	Переходный	Игольчатый
Губчатый	98,1%	0,0%	1,9%
Переходный	0,0%	58,3%	41,7%
Игольчатый	2,8%	0,3%	96,9%

Таблица 4. Усредненная матрица ошибок классификаторов, сформированных методом опорных векторов.

Table 4. Averaged confusion matrix of classifiers formed by the support vector machine method.

Реальный \ Предсказанный	Губчатый	Переходный	Игольчатый
Губчатый	92,5%	0,0%	7,5%
Переходный	0,0%	0,0%	100,0%
Игольчатый	6,2%	0,0%	93,8%

Анализ матриц ошибок выявил характерные паттерны. Все модели наиболее уверенно и правильно идентифицировали «губчатый» (метрика Precision более 0,92) и «игольчатый» (метрика Precision более 0,93) типы кокса. Наибольшее количество ошибочных калссификаций характерно для разделения на классы между «переходным» и «игольчатым» типами. Однако метод опорных векторво демонстрирует худший вариант определения класса «Переходный», классифицируя все такие случаи как «Игольчатый», что указывает на его непригодность для работы с данным дисбалансированным распределением классов. Нейросетевая модели, напротив, показала наименьшее количество «дорогих» ошибок, связанных с ошибочной классификацией игольчатого кокса как губчатого или переходного, что наиболее критично с экономической точки зрения.

Определение ключевых технологических

ФАКТОРОВ

Для интерпретации результатов и установления связи между предикторами и целевым классом был проведён анализ важности признаков на основе лучшей модели градиентного бустинга, обладающей этой встроенной возможностью. Результаты анализа позволили количественно ранжировать влияние технологических параметров на формирование структурного типа кокса. Ведущую роль продемонстрировал параметр максимальная температура процесса. Его доминирующая значимость полностью согласуется с фундаментальными представлениями о термическом крекинге и поликонденсации, где именно термическое воздействие является главным движущим фактором упорядочения углеродной структуры. Вторым по степени влияния оказался параметр коксуемость сырья (по Конрадсону), что логично отражает исходную склонность углеводородного сырья к образованию твёрдого углеродистого остатка. Существенный вклад также вносят скорость нагрева и содержание асфальтенов в сырье. Первый параметр определяет кинетику формирования промежуточных мезофаз, а второй напрямую связан с количеством высокомолекулярных, склонных к коксообразованию компонентов. Примечательно, что в рамках исследуемого диапазона значений такие параметры, как рабочее давление в колонне и содержание серы в сырье, показали относительно низкую важность для задачи именно классификации макроструктуры. Это указывает на то, что в данных условиях их влияние на процесс структурообразования является вторичным по сравнению с доминирующим термическим и химическим факторами. Полученное ранжирование не только валидирует модель с физико-химической точки зрения, но и выделяет ключевые параметры для оперативного управления технолога с целью целенаправленного получения кокса заданного типа.

Устойчивость и воспроизводимость

Кривые обучения для моделей нейронной сети и градиентного бустинга показали стабилизацию ошибки на валидационной выборке и минимальный разрыв с ошибкой на обучении, что свидетельствует об отсутствии переобучения. Результаты пятикратной кроссвалидации подтвердили устойчивость метрик для сформированных классификаторов (стандартное отклонение по метрике точности менее 0,015). Для метода опорных векторов была отмечена высокая дисперсия результатов.

ОБСУЖДЕНИЕ

Полученные результаты демонстрируют, что современные методы машинного обучения способны с высокой точностью (более 96%) решать сложную технологическую задачу классификации структуры нефтяного кокса. Однако ключевым выводом сравнительного анализа стало превосходство нейросетевого подхода над ансамблевым методом градиентного бустинга и методом опорных векторов на данном конкретном наборе данных. Это несколько расходится с распространённым тезисом о доминировании бустинга на структурированных табличных данных среднего объёма и подчеркивает важность эмпирической проверки алгоритмов для каждой конкретной задачи.

Высокая эффективность нейросетевой модели (общая точность 98,5%, F1 -мера 0,944) свидетельствует о наличии в данных сложных нелинейных взаимосвязей высокого порядка, которые многослойная сеть смогла успешно аппроксимировать. Неспособность классификатора на основе опорных векторов адекватно классифицировать минорный класс («Переходный») указывает на его чувствительность к дисбалансу и параметрам ядра, что ограничивает его применение в подобных промышленных задачах без тщательной обработки данных и настройки.

Ранжирование важности факторов, полученное для модели градиентного бустинга способно предоставить технологам понятную иерархию управляющих воздействий, связывая «чёрный ящик» прогнозной модели с физической сущностью процесса. Это делает модель не только инструментом пассивного прогноза, но и основой для активного планирования.

Разработанная и валидированная модель классификации (в частности, нейросетевая как наиболее точная) является ключевым «интеллектуальным» модулем в архитектуре гибридного (физически информированного с машинным обучением) цифрового двойника установки коксования. В рамках этой архитектуры она выполняет несколько функций. Одной из них является оперативный предиктивный контроль, заключающийся в прогнозе типа кокса по текущим параметрам сырья и режима в ходе цикла. Также с использованием классификаторов может быть выполнен анализ сценариев: оценка влияния изменения технологических параметров на конечную структуру продукта в виртуальной среде. Отдельным вариантом использования является автоматизированная формализация экспертных знаний, при которой обеспечивается возможность сопоставления рейтинга важности признаков в модельной интеграции и опыт технологов, создавая базу знаний для систем поддержки принятия решений.

Основным ограничением работы остается зависимость качества модели от репрезентативности обучающей выборки. Модель, обученная на данных одной установки, может потребовать дообучения для применения на другой. Перспективным направлением является интеграция лучшей классификационной нейросетевой модели в контур адаптивного управления для автоматической тонкой настройки режимных параметров в реальном времени с целью стабилизации выхода целевого типа кокса.

ЗАКЛЮЧЕНИЕ

В результате проведённого исследования доказана высокая эффективность методов машинного обучения для решения технологической задачи классификации структурного типа нефтяного кокса.

Проведённый сравнительный анализ выявил безусловное лидерство многослойного персептрона, который достиг точности 98,5% и продемонстрировал наиболее сбалансированные метрики на тестовой выборке. Это указывает на наличие в данных сложных нелинейных зависимостей, которые эффективно улавливаются нейросетевой архитектурой.

Модель градиентного бустинга, показавшая результат 96,7%, сохраняет практическую ценность благодаря своей интерпретируемости, позволяя выявить и ранжировать ключевые технологические факторы: максимальную температуру, коксуемость сырья и скорость нагрева. Метод опорных векторов в конфигурации с RBF-ядром оказался непригодным для данной задачи из-за неспособности корректно классифицировать минорный класс.

Практическая значимость работы заключается в создании готового к внедрению высокоточного инструмента прогнозирования, который составляет основу интеллектуального модуля формируемого гибридного цифрового двойника. Разработанный модуль позволяет перейти от ретроспективного анализа к предиктивному управлению качеством продукта, обеспечивая оперативный прогноз и анализ сценариев. Полученные результаты закладывают технологический фундамент для следующего этапа — разработки системы адаптивной оптимизации технологического режима, которая на основе прогнозной модели будет в реальном времени рекомендовать уставки для гарантированного получения кокса заданного структурного типа. Это является ключевым шагом на пути к созданию автономных интеллектуальных производств в нефтепереработке.