Исследование методов модельной оценки свойств нефтяного кокса по параметрам сырья и технологического режима
Автор: В. В. Бухтояров, А. А. Городов, О. А. Коленчуков
Журнал: Современные инновации, системы и технологии.
Рубрика: Прикладные вопросы и задачи применения систем и технологий
Статья в выпуске: 5 (4), 2025 года.
Бесплатный доступ
В рамках проекта по созданию гибридного цифрового двойника (PI-ML) для управления процессом замедленного коксования критически важным является переход от классификации типа продукта к количественному прогнозу его ключевых потребительских свойств. Данная работа посвящена сравнительному анализу эффективности методов машинного обучения для решения задачи множественной регрессии четырех критически важных свойств нефтяного кокса: пористости, содержания серы, прочности и истинной плотности. На основе исторических промышленных данных, включающих параметры сырья и технологического режима, были обучены, настроены и протестированы три модели: искусственная нейронная сеть – многослойный персептрон, метод опорных векторов для регрессии и градиентный бустинг. Результаты, полученные на независимой тестовой выборке, показали, что нейросетевая модель превосходит остальные, обеспечивая средний коэффициент детерминации равный 0,93. Все методы продемонстрировали высокую практическую пригодность, подтвердив наличие устойчивых статистических закономерностей. Разработанные модели формируют ключевой интеллектуальный модуль прогнозного контроля качества в архитектуре цифрового двойника, обеспечивая основу для систем предиктивного управления и оптимизации технологического режима.
Нефтяной кокс, прогноз свойств, машинное обучение, многослойный персептрон, градиентный бустинг, метод опорных векторов, цифровой двойник, замедленное коксование
Короткий адрес: https://sciup.org/14135222
IDR: 14135222 | DOI: 10.47813/2782-2818-2025-5-4-1028-1036
Текст статьи Исследование методов модельной оценки свойств нефтяного кокса по параметрам сырья и технологического режима
DOI:
В рамках комплексного проекта по созданию модельно-алгоритмического обеспечения цифрового двойника технологического процесса замедленного коксования ключевой задачей является переход от описания текущего состояния к предиктивному управлению качеством конечной продукции с заданными свойствами [1, 2]. C технологической и коммерческой точек зрения решающее значение имеют не только тип структуры, но и точные количественные физико-химические свойства продукта, определяющие его пригодность для конкретных применений, таких как производство анодов для алюминиевой промышленности или графитированных электродов [3, 4, 5].
Оперативный контроль таких свойств, как пористость, содержание серы, прочность и истинная плотность в условиях действующего производства сопряжен со значительными временными затратами на лабораторные анализы (например, определение прочности или пористости) [6]. Возникающий информационный лаг исключает возможность оперативной корректировки режима для компенсации отклонений и предотвращения выпуска некондиционной партии. В этой связи создание точных и быстрых прогнозных моделей, способных по текущим параметрам сырья и уставкам режима оценивать ожидаемые значения ключевых свойств продукта до завершения цикла коксования, становится критически важным элементом интеллектуальной системы управления [7].
Выбор указанного квартета свойств обоснован их интегральной ролью в оценке качества. Пористость напрямую влияет на реакционную способность, адгезию связующего и механическую стабильность изделий [1]. Содержание серы является строго нормируемым экологическим и технологическим параметром [8, 9]. Прочность определяет устойчивость к механическим нагрузкам при транспортировке и эксплуатации, а истинная плотность служит индикатором степени упорядоченности углеродной матрицы и косвенно – ее электропроводности и термостойкости [10]. Прогноз этих разнородных по природе свойств в рамках единого модельного контура позволит сформировать комплексный цифровой паспорт партии кокса – ключевую функцию цифрового двойника.
В литературе представлены примеры применения регрессионного анализа и методов машинного обучения для прогнозирования отдельных свойств углеродных материалов или выхода продуктов нефтепереработки [11, 12]. Однако комплексные исследования, направленные на сравнительный анализ эффективности классических статистических методов и современных алгоритмов машинного обучения именно для одновременного прогнозирования набора ключевых потребительских свойств нефтяного кокса на основе полного технологического контекста, в доступных источниках освещены недостаточно [7]. Часто исследования ограничиваются парными корреляциями или прогнозом одного свойства, что не отвечает потребностям целостного цифрового двойника, оперирующего многомерными целевыми показателями.
Данное исследование направлено на проведение сравнительного анализа эффективности двух методологически различных подходов к решению задачи множественной регрессии ключевых свойств нефтяного кокса. В качестве сравниваемых методов выбраны три современных алгоритма машинного обучения: многослойный перцептрон, метод опорных векторов для регрессии и градиентный бустинг для регрессии. Результаты работы направлены на развитие архитектуры цифрового двойника. Создаваемый модуль прогноза численных свойств логически дополняет ранее разработанный модуль классификации структуры продукта, формируя тем самым комплексный блок предиктивного контроля качества.
Для достижения поставленной цели в исследовании последовательно решается ряд задач. Выделены группы предикторов — параметры сырья и технологического режима, а также определены четыре целевые переменные: пористость, содержание серы, прочность и истинная плотность кокса. На следующем этапе реализуются, настраиваются и обучаются три варианта моделей для прогнозирования каждого из целевых свойств. Затем проводится комплексная оценка и сравнение их эффективности на независимой тестовой выборке с использованием ключевых метрик качества регрессии: коэффициента детерминации (R2), среднеквадратичной (RMSE) и средней абсолютной ошибки (MAE), что позволяет объективно выявить наилучший подход для прогноза каждого конкретного свойства. В заключение формулируются принципы интеграции полученных прогнозных моделей в архитектуру цифрового двойника, где они будут выполнять функцию модуля оперативной паспортизации качества и поддержки принятия решений. Полученные результаты закладывают основу для следующего, оптимизационного этапа исследований, целью которого является создание интеллектуальной системы рекомендации технологических режимов для целенаправленного получения продукта с заранее заданными свойствами.
МАТЕРИАЛЫ И МЕТОДЫ
Источник данных и стратегия
ПРЕДОБРАБОТКИ
В качестве исходных данных использовался исторический массив промышленной установки замедленного коксования, содержащий записи по полным производственным технологическим циклам. Каждый цикл был охарактеризован следующим набором параметров, разделенных на три логические группы:
-
1. Характеристики сырья: содержание общей серы (% масс.), плотность при 20°C (кг/м³), коксуемость по Конрадсону (КК, % масс.), содержание смол (% масс.), кинематическая вязкость (сСт), общее содержание металлов ( ppm ), содержание асфальтенов (% масс.), средний размер частиц (мкм).
-
2. Параметры технологического режима: максимальная температура цикла (°C), время пребывания в зоне выше 400°C (ч), скорость нагрева до максимальной температуры (°C/ч), скорость охлаждения (°C/ч), рабочее давление (бар), коэффициент рециркуляции, общая продолжительность цикла (ч).
-
3. Целевые переменные (прогнозируемые свойства кокса): пористость (об. %), содержание общей серы (% масс.), механическая прочность (МПа), истинная плотность (г/см³).
Перед построением моделей данные прошли стандартную процедуру предобработки. Для числовых признаков была выполнена проверка на аномальные значения методом межквартильного размаха, пропущенные значения (менее 1% записей) были заполнены медианами в разрезе типов сырья. Все числовые признаки были стандартизированы для приведения к единому масштабу. Для сохранения репрезентативности всех типов кокса в выборках разбиение на обучающую (70%), валидационную (15%) и тестовую (15%) подвыборки проводилось стратифицированно по категориям структурного типа кокса, определенным в смежном исследовании.
Используемые алгоритмы построения
РЕГРЕССИОННЫХ МОДЕЛЕЙ
Для решения задачи множественной регрессии были выбраны четыре различных алгоритма. Так, в качестве эталонного статистического метода изначально планировалось использование множественной линейной регрессии. Однако предварительный анализ данных выявил неполный ранг матрицы независимых переменных, что делает оценки с использованием классического метода наименьших квадратов неустойчивыми и статистически незначимыми. В связи с этим метод был исключен из сравнительного анализа, а в качестве базовых методов, устойчивых к данным проблемам, были выбраны:
-
1. Многослойный персептрон для регрессии: искусственная нейронная сеть прямого распространения, способная аппроксимировать сложные нелинейные зависимости. Для каждого прогнозируемого свойства тестировались архитектуры с одним скрытым слоем (от 4 до 16 нейронов в слое). В скрытом слое использовалась функция активации гиперболический тангенс, на выходном — линейная функция. Обучение проводилось квазиньютоновским алгоритмом BFGS (Бройдена — Флетчера — Голдфарба — Шанно) с регуляризацией для предотвращения переобучения. [13].
-
2. Метод опорных векторов для регрессии – алгоритм, основанный на поиске функции, отклоняющейся от фактических значений не более чем на величину ε для максимального числа объектов [14]. Для учета нелинейностей использовалось радиально-базисное ядро. Гиперпараметры – штрафной коэффициент C , определяющий компромисс между сложностью модели и величиной ошибки, параметр ядра γ и ширина ε подбирались методом сеточного поиска с 5-кратной кроссвалидацией на обучающем наборе.
-
3. Градиентный бустинг для регрессии – мощный ансамблевый метод, последовательно строящий композицию относительно простых моделей (неглубоких регрессионных деревьев),
где каждая следующая модель обучается на ошибках предыдущих [15]. Использовалась реализация, устойчивая к переобучению.
Настраиваемые гиперпараметры: глубина деревьев (от 3 до 7), темп обучения (от 0,01 до 0,1), количество итераций (до 1000). Ранняя остановка применялась при отсутствии улучшения ошибки на валидационной выборке в течение 50 итераций.
Метрики оценки сформированных
МОДЕЛЕЙ
Для объективного модели для каждого целевого свойства обучались и настраивались на идентичных обучающей и валидационной выборках. Итоговая оценка эффективности проводилась на изолированной тестовой выборке, не используемой ни в подборе гиперпараметров, ни в обучении моделей. Качество регрессионных моделей оценивалось с помощью набора стандартных метрик: коэффициент детерминации (R2), как оценка доли дисперсии зависимой переменной, объясненная моделью; среднеквадратичная ошибка (RMSE), рассчитываемая стандартным образом как корень из средней квадратичной разности между предсказанными и фактическими значениями, имеет размерность целевой переменной; средняя абсолютная ошибка (MAE), рассчитываемая как разность по модулю между предсказанными и фактическими значениями, менее чувствительна к выбросам, чем RMSE.
РЕЗУЛЬТАТЫ
Сравнительное исследование
ЭФФЕКТИВНОСТИ РЕГРЕССИОННЫХ МОДЕЛЕЙ
Экспериментальное сравнение трех алгоритмов на независимой тестовой выборке продемонстрировало их высокую, но различающуюся эффективность в задаче прогнозирования количественных свойств нефтяного кокса. Во всех четырех случаях лучшая точность была обеспечена нейросетевой моделью, что подтверждается максимальными значениями коэффициента детерминации R2 и минимальными ошибками RMSE и MAE (Таблицы 1-4).
Таблица 1. Сравнение метрик регрессионных моделей для прогноза пористости кокса .
Table 1. Comparison of regression model metrics for coke porosity prediction.
|
Модель |
R2 |
RMSE , % |
MAE , % |
|
Нейросетвая модель |
0,93 |
1,3 |
1,0 |
|
Модель опорных векторов |
0,89 |
1,7 |
1,4 |
|
Градиентный бустинг |
0,87 |
1,9 |
1,5 |
Таблица 2. Сравнение метрик регрессионных моделей для прогноза содержания серы .
Table 2. Comparison of regression model metrics for sulfur content prediction.
|
Модель |
R2 |
RMSE , % |
MAE , % |
|
Нейросетвая модель |
0,95 |
0,15 |
0,12 |
|
Модель опорных векторов |
0,92 |
0,19 |
0,15 |
|
Градиентный бустинг |
0,91 |
0,21 |
0,17 |
Таблица 3. Сравнение метрик регрессионных моделей для прогноза содержания серы .
Table 3. Comparison of regression model metrics for coke strength prediction.
|
Модель |
R2 |
RMSE , МПа |
MAE , МПа |
|
Нейросетвая модель |
0,90 |
3,2 |
2,5 |
|
Модель опорных векторов |
0,85 |
4,0 |
3,2 |
|
Градиентный бустинг |
0,83 |
4,3 |
3,5 |
Таблица 4. Сравнение метрик регрессионных моделей для прогноза содержания серы .
Table 4. Comparison of regression model metrics for coke true density prediction.
|
Модель |
R2 |
RMSE , г/см³ |
MAE , г/см³ |
|
Нейросетвая модель |
0,94 |
0,009 |
0,007 |
|
Модель опорных векторов |
0,89 |
0,013 |
0,010 |
|
Градиентный бустинг |
0,87 |
0,015 |
0,012 |
Как видно из таблиц, нейросетевая модель стабильно обеспечивает наилучшее качество прогноза со средним значением R2 равным 0,93 по всем свойствам (таблица 5). Метод опорных векторов и градиентный бустинг показали сопоставимые результаты, варьирующиеся в зависимости от прогнозируемого свойства. Для содержания серы модель градиентного бустинга незначительно превосходит модель, построенную методом опорных векторов, в то время как для остальных свойств данный оказался несколько точнее. Важно отметить, что все три метода показали высокую практическую пригодность (R2 более 0,83), что свидетельствует о наличии устойчивых статистических закономерностей между параметрами процесса и свойствами продукта.
Таблица 5. Сравнение метрик регрессионных моделей для прогноза содержания серы .
Table 5. Coefficient of determination ( R2) of models for predicting key coke properties (test set).
|
Модель |
Пористость |
Содержание серы |
Прочность |
Истинная плотность |
Средний R2 |
|
Нейросетвая модель |
0,93 |
0,95 |
0,90 |
0,94 |
0,93 |
|
Модель опорных векторов |
0,89 |
0,91 |
0,85 |
0,89 |
0,885 |
|
Градиентный бустинг |
0,87 |
0,92 |
0,83 |
0,87 |
0,873 |
Интерпретация моделей: ключевые
ТЕХНОЛОГИЧЕСКИЕ ФАКТОРЫ
Для интерпретации результатов был проведен анализ важности признаков для модели градиентного бустинга, обладающей этой встроенной возможностью. Предварительная оценка ранжирования факторов позволило выявить наиболее значимые предикторы для каждого свойства. Для пористости наибольший вклад вносят скорость нагрева. Это согласуется с физикой процесса, где скорость термолиза определяет формирование поровой структуры. Для содержания серы ключевым фактором является содержание серы в сырье, подтверждая гипотезу о прямом переносе данного элемента в твердый остаток. Вторым по значимости оказалась максимальная температура цикла. На прочность сильнее всего влияют параметры, определяющие плотность упаковки углеродной матрицы: максимальная температура и коксуемость сырья. Для истинной плотности основными детерминантами являются максимальная температура и содержание асфальтенов в сырье, что отражает роль термообработки и химического состава сырья в степени графитизации и уплотнения углерода.
Воспроизводимость результатов
Кривые обучения для всех трех моделей показали сходимость и стабилизацию ошибки на валидационной выборке. Разрыв между кривыми обучения и валидации был минимальным, что свидетельствует об отсутствии переобучения. Результаты пятикратной перекрестной проверки подтвердили устойчивость метрик: стандартное отклонение R2 для лучшей модели (на основе искусственной нейронной сети) не превышало 0,02 для любого из свойств.
В этом разделе представлены экспериментальные или теоретические данные, полученные в ходе исследования. Результаты даются в обработанном варианте: в виде таблиц, графиков, организационных или структурных диаграмм, уравнений, фотографий, рисунков. В этом разделе приводятся только факты. Их интерпретацию, сопоставление с данными других исследователей оставьте для раздела Обсуждение.
ОБСУЖДЕНИЕ
Полученные результаты доказывают, что современные методы машинного обучения, в частности многослойный персептрон, способны с высокой точностью ( R2 в диапазоне 0,90-0,95) решать сложную многопараметрическую задачу прогнозирования ключевых физико-химических свойств нефтяного кокса. Это подтверждает центральную гипотезу исследования о том, что взаимосвязь между регламентными параметрами процесса и интегральными показателями качества продукта, хоть и нелинейна, но является статистически устойчивой и поддается формализации.
Преимущество нейросетевого подхода в данной задаче, проявившееся в стабильном лидерстве по всем четырем свойствам, можно объяснить его способностью аппроксимировать сложные многомерные зависимости высокого порядка, характерные для химикотехнологических процессов. Альтернативными рассмотренными моделями также демонстрируются относительно высокие, при этом их эффективность существенно варьировалась в зависимости от специфики прогнозируемого свойства. Так, модель градиентного бустинга обеспечило лучшее прогнозирование содержания серы, что может быть связано с деревовидной структурой модели, эффективно обрабатывающей пороговые эффекты в распределении примесей.
Технологическая интерпретируемость как ключевое требование к моделям в цифровом двойнике была успешно обеспечена. Сформированное ранжирование важности признаков соответствует фундаментальным представлениям о процессе коксования (доминирующая роль температуры, состава сырья и скорости нагрева), но и позволяет количественно оценить вклад каждого управляющего фактора. Например, установлено, что для контроля содержания серы в коксе приоритетным является подбор сырья, в то время как для управления прочностью и плотностью ключевым инструментом является температурный режим.
Разработанные и валидированные регрессионные модели являются естественным развитием и углублением модуля классификации структурного типа, созданного ранее. В предлагаемой архитектуре гибридного цифрового двойника эти модели формируют модуль предиктивного контроля качества, который выполняет критически важной функции высокоточной количественной зависимости «фактор-свойство». Сформированные модели и методы их формирования служат основой для следующего этапа — построения системы рекомендаций технологических режимов для гарантированного получения продукта с заданным набором свойств.
Основным ограничением работы является зависимость точности моделей от репрезентативности и качества обучающих данных. Модели, обученные на данных конкретной установки, требуют адаптации для переноса на другие объекты. Перспективным направлением является интеграция разработанных прогнозных моделей в контур адаптивного управления с обратной связью, где их предсказания будут использоваться для автоматической тонкой настройки уставок в реальном времени, что является следующим шагом на пути к созданию автономного интеллектуального производства.
ЗАКЛЮЧЕНИЕ
Проведенное исследование доказало высокую эффективность методов машинного обучения для решения задачи прогнозирования ключевых эксплуатационных свойств нефтяного кокса – пористости, содержания серы, прочности и истинной плотности. В ходе сравнительного анализа трех современных алгоритмов (многослойный персептрон, метод опорных векторов, градиентный бустинг) определено преимущество в части используемых метрик точности модели для нейросетевого подхода, который обеспечил наивысшую точность и устойчивость прогнозов для всех четырех свойств. В комплексе с альтернативными подходами подтверждена принципиальная разрешимость задачи на основе регламентных промышленных данных.
Научно-практическая значимость работы заключается не только в создании высокоточных прогнозных инструментов, но и в их технологической интерпретируемости. Выявленное ранжирование важности признаков (например, доминирующая роль скорости нагрева для пористости и содержания серы в сырье для итоговой сернистости кокса) объективизирует экспертные знания и формирует понятную для технолога причинноследственную модель процесса.
В контексте более широкого проекта по созданию гибридного (физически информированного с элементами машинного обучения – PI-ML) цифрового двойника установки замедленного коксования результаты данной работы имеют фундаментальное значение. Разработанные модели составляют ядро интеллектуального прогнозного модуля, который выполняет несколько системообразующих функций в архитектуре двойника:
Таким образом, настоящее исследование закладывает важнейший алгоритмический и информационный фундамент для перехода от цифровых моделей, используемых для ретроспективного анализа и симуляции, к активным интеллектуальным системам, способным к автономному планированию и оперативному управлению сложным химикотехнологическим процессом с целью производства продукции с заданными свойствами. Перспективой работы является интеграция разработанных прогнозных моделей в контур адаптивного управления и их тесная взаимоувязка с «физическими» блоками цифрового двойника для создания полноценной гибридной системы, сочетающей объяснимость физических моделей с точностью и гибкостью машинного обучения.