Автоматизированное формирование операционных технологических правил для управления качеством нефтяного кокса на основе анализа данных и деревьев решений
Автор: И. С. Некрасов, В. В. Бухтояров, В. С. Тынченко
Журнал: Современные инновации, системы и технологии.
Рубрика: Управление, вычислительная техника и информатика
Статья в выпуске: 5 (4), 2025 года.
Бесплатный доступ
Для эффективного внедрения в условия промышленного применения цифрового двойника установки замедленного коксования критически важным является переход от прогнозирования свойств продукта к формированию конкретных управляющих предписаний для технологического персонала. Данная работа посвящена апробации метода деревьев решений для автоматизированного извлечения операционных правил типа «если-то» из исторических промышленных данных. На примере двух ключевых технологических сценариев получения низкосернистого и высокопрочного нефтяного кокса продемонстрирована возможность построения компактных и интерпретируемых моделей, обеспечивающих точность классификации выше 92%. Из структуры деревьев формализованы полные «карты решений», включающие как правила достижения целевых состояний, так и условия, гарантированно ведущие к неудаче. Ключевыми управляющими факторами для данных сценариев были определены, соответственно, содержание серы в сырье и давление в колонне коксования. Полученный набор правил представляет собой прототип модуля операционных предписаний в архитектуре гибридного цифрового двойника и служит основой для создания системы поддержки принятия решений, направленной на оперативное планирование режимов и гарантированное получение продукта с заданными свойствами.
Нефтяной кокс, замедленное коксование, деревья решений, операционные правила, управление качеством, цифровой двойник, поддержка принятия решений, технологические сценарии, классификация, анализ данных
Короткий адрес: https://sciup.org/14135228
IDR: 14135228 | DOI: 10.47813/2782-2818-2025-5-4-2031-2038
Текст статьи Автоматизированное формирование операционных технологических правил для управления качеством нефтяного кокса на основе анализа данных и деревьев решений
DOI:
Современный этап цифровизации нефтеперерабатывающих производств характеризуется переходом от создания изолированных расчетных моделей к построению комплексных цифровых двойников (ЦД), способных не только описывать, но и оптимизировать технологические процессы в режиме, близком к реальному времени [1, 2]. В рамках проекта по разработке модельноалгоритмического обеспечения ЦД процесса замедленного коксования ключевой задачей является обеспечение производства нефтяного кокса со строго заданными свойствами, определяющими его стоимость и область применения [3, 4]. Предшествующие этапы исследований позволили создать высокоточные прогнозные модули для классификации структурного типа кокса и регрессионного предсказания его ключевых физико-химических свойств по параметрам сырья и режима. Однако для замкнутого контура управления необходимо решить обратную задачу: на основе целевых показателей продукта сгенерировать понятные и выполнимые рекомендации по настройке технологического режима.
В существующей промышленной практике планирование режимов коксования часто опирается на опыт технологов и нормативные документы, что при изменении качества сырья или требований к продукту может приводить к длительным периодам подбора оптимальных уставок и выпуску некондиционных партий [5, 6]. Применение оптимизационных алгоритмов и методов решения обратных задач на основе «первых принципов» ( first-principles models ) сопряжено со значительной вычислительной сложностью и требует детальных кинетических данных, которые часто недоступны [7]. В этой связи методы анализа данных, в частности деревья решений, представляют собой мощный практический инструмент. Они позволяют выявить и формализовать скрытые в исторических данных логические зависимости между управляемыми параметрами процесса и конечным результатом, представляя их в виде набора интерпретируемых правил типа «ЕСЛИ-ТО» [8, 9]. Такой подход напрямую трансформирует данные в операционные знания, понятные технологическому персоналу.
В литературе представлены примеры успешного применения деревьев решений для управления качеством в различных химикотехнологических процессах, таких как полимеризация или крекинг [10, 11]. Однако их системное использование именно для формирования операционных правил управления процессом замедленного коксования, интегрированных в архитектуру цифрового двойника, в доступных источниках освещено недостаточно. Чаще исследования фокусируются либо на прогнозе свойств, либо на оптимизации отдельных параметров без предоставления итогового продукта в форме, готовой для непосредственного использования оперативным персоналом [12].
Данная работа ставит своей целью разработку и практическую апробацию методики, позволяющей автоматически формировать операционные технологические правила для управления качеством нефтяного кокса. В ее основе лежит использование алгоритмов деревьев решений, что позволяет решить актуальную задачу поддержки принятия решений — предоставить технологу четкие, обоснованные историческими данными указания по выбору диапазонов управляющих параметров для гарантированного получения продукта, соответствующего выбранному целевому сценарию. Работа является этапом цикла разработки интеллектуальных модулей для цифрового двойника, обеспечивая ключевой переход от этапа прогнозирования свойств к этапу активного управления процессом.
Для реализации этой цели в исследовании последовательно решается ряд взаимосвязанных задач. Во-первых, на основе анализа требований потребителей и технологических возможностей производства определяются и формализуются репрезентативные целевые сценарии качества конечного продукта. Следующим шагом является построение, тонкая настройка и строгая валидация моделей деревьев решений для бинарной классификации записей по их соответствию целевому сценарию. На основе полученных моделей из их структуры извлекается формализованный набор технологических правил, который подвергается критическому анализу с точки зрения технологической выполнимости и внутренней согласованности. Завершающей задачей является оценка практической точности полученных правил и формулирование принципов их будущей интеграции в архитектуру системы поддержки принятия решений формируемого цифрового двойника. Таким образом, в статье предлагается и тестируется методика «компиляции» сложных, нелинейных взаимосвязей, выявленных методами машинного обучения, в набор простых, интерпретируемых и готовых к непосредственному внедрению операционных предписаний для конкретного химикотехнологического процесса.
МАТЕРИАЛЫ И МЕТОДЫ
Формирование целевых сценариев
В качестве исходной информационной базы использовался расширенный массив исторических данных промышленной установки замедленного коксования, включающий записи по завершенным технологическим циклам. Каждая запись содержала набор предикторов: характеристики сырья (содержание серы, коксуемость по Конрадсону, плотность, содержание асфальтенов, смол, металлов), параметры технологического режима
(максимальная температура, скорость нагрева и охлаждения, давление, коэффициент рециркуляции и общее время цикла), а также измеренные значения ключевых свойств получаемого кокса: пористость, содержание серы, прочность и истинная плотность. Целевые сценарии качества конечного продукта были определены на основе анализа требований основных потребителей — алюминиевой и сталеплавильной промышленности. В результате в целях апробации было формализовано два типичных сценария:
-
1. Сценарий «Низкая сера»: направлен на получение кокса с минимальным содержанием серы (менее 2.0% масс.) при сохранении приемлемой прочности (более 12 МПа). Данный сценарий критически важен для производства анодной продукции.
-
2. Сценарий «Высокая прочность»: ориентирован на максимизацию механической прочности кокса (более 18 МПа) при обеспечении стандартной пористости. Это ключевое требование для электродов, работающих в условиях высоких механических нагрузок.
Для каждого сценария на основе граничных значений свойств всем записям (как историческим, так и синтетическим) был присвоен бинарный целевой признак
«Соответствует сценарию» (1) или «Не соответствует» (0).
Методология построения и извлечения
ОПЕРАЦИОННЫХ ПРАВИЛ
Ключевым инструментом для формирования правил был выбран алгоритм деревьев решений (Classification and Regression Trees). Выбор обусловлен его способностью автоматически выявлять нелинейные взаимодействия между предикторами и представлять результат в виде интуитивно понятной древовидной структуры, каждый путь от корня к листу которой соответствует одному логическому правилу.
Анализ проводился для каждого сценария отдельно. В качестве независимых переменных (предикторов) использовались ключевые управляемые факторы процесса: максимальная температура цикла, скорость нагрева, рабочее давление, а также наиболее значимые характеристики сырья — коксуемость и содержание серы. Зависимой переменной выступал бинарный целевой признак, описанный выше. Для предотвращения переобучения модели и получения излишне сложных, плохо обобщаемых правил, в настройках алгоритма были заданы ограничения: минимальное количество наблюдений в конечном узле (листе) и максимальная глубина дерева. Оптимальные значения этих параметров подбирались эмпирически на основе точности классификации на валидационной подвыборке.
Обученная и валидированная древовидная структура подвергалась процедуре извлечения правил. Каждый лист дерева, отнесенный алгоритмом к классу «Соответствует сценарию», формировал одно операционное правило. Правило представляло собой конъюнкцию (логическое «И») всех условий, встречающихся на пути от корневой вершины до данного листа. Например, правило могло иметь вид: «ЕСЛИ содержание серы в сырье менее 1,8% И максимальная температура ≥ 492°C И скорость нагрева находится в диапазоне 22–26 °C/ч, ТО сценарий «Низкая сера» достижим с высокой вероятностью». Каждому правилу также сопоставлялась статистическая метрика — доля верно классифицированных объектов в данном листе (точность правила).
Протокол валидации и оценки
ПРАКТИЧЕСКОЙ ЗНАЧИМОСТИ
Для объективной оценки качества построенных деревьев и извлеченных из них правил исходный набор данных случайным образом разбивался на обучающую (70%) и тестовую (30%) подвыборки с сохранением пропорций целевого признака. Дерево обучалось на обучающей выборке, а его итоговая эффективность оценивалась на тестовой. В качестве основных метрик использовались стандартные показатели бинарной классификации: общая точность (Accuracy), полнота (Recall), точность определения целевого сценария (Precision) и F1-мера.
Однако ключевой оценкой являлась не только статистическая точность дерева, но и практическая значимость и выполнимость извлеченных правил. Поэтому после их формализации проводился технологический анализ каждого правила на предмет соответствия известным физико-химическим закономерностям процесса коксования и технологическим ограничениям установки (например, достижимости заданных диапазонов температуры или скорости нагрева). Правила, противоречащие технологическим реалиям или имеющие крайне малую статистическую поддержку (менее 1% от объема выборки), рассматривались как потенциальные артефакты и либо уточнялись, либо отбрасывались. Итоговым результатом для каждого сценария являлся валидированный набор из 3–5 ключевых операционных правил, готовых к использованию в качестве справочного инструмента для технолога.
РЕЗУЛЬТАТЫ
Эффективность моделей деревьев
РЕШЕНИЙ
Для двух ключевых технологических сценариев были построены компактные деревья решений с ограничением глубины, обеспечивающим их интерпретируемость. Эффективность моделей оценивалась на независимой тестовой выборке, составляющей 30% от исходного массива данных. Как видно из Таблицы 1, обе модели продемонстрировали высокую точность классификации, превышающую 90%.
Таблица 1. Сравнительные метрики эффективности деревьев решений для целевых сценариев. Table 1. Table name.
Модель для сценария «Высокопрочный кокс» показала несколько более высокие метрики, что может быть связано с более жесткой и однозначной зависимостью ключевых выходных свойств (прочности) от выявленного деревом главного фактора — давления в колонне. Модель для сценария «Низкосернистый кокс», зависящего от большего числа взаимосвязанных факторов (состав сырья, температура), показала сопоставимо высокий, но чуть более низкий результат.
Структура деревьев и извлечение
ОПЕРАЦИОННЫХ ПРАВИЛ
Процедура извлечения из сформированных деревьев логических правил позволила сформировать полные «карты решений» для каждого сценария. Эти карты включают как правила достижения целевого состояния продукта, так и правила, при которых требуемые свойства не будут обеспечены с высокой вероятностью, что критически важно сокращенном виде такие фрагмент такой карты на основе правил приведены в Таблице 2.
Как видно из Таблицы 2, каждый сценарий описывается парой альтернативных правил достижения и парой запретительных правил, исключающих попадание в целевой класс. Такой подход не только повышает достоверность прогноза, но и обеспечивает технолога информацией для принятия решений в условиях неопределенности или ограниченности ресурсов.
Технологическая интерпретация ключевых факторов
Анализ структуры деревьев подтвердил ведущую роль параметров, известных из фундаментальных представлений о процессе коксования. Для сценария «Низкосернистый кокс» дерево выявило два альтернативных управляющих контура: «сырьевой» (контроль качества поступающего сырья) и «режимный» (управление температурой). Это предоставляет технологу гибкость в планировании.
Таблица 2. Фрагмент набора операционных технологических правил, извлеченных из деревьев решений.
Table 2. Fragment of the set of operational technological rules extracted from decision trees.
|
Сценарий |
Тип правила |
Логическое условие (ЕСЛИ...) |
Тогда вывод |
Технологическая интерпретация |
|
Низкосернистый кокс |
Достижение |
Сера в сырье ≤ 2.5% И Макс. температура > 490°C |
Целевой сценарий достижим (вер. ~90%) |
Даже при умеренном содержании серы в сырье цель достигается за счет высокой термической обработки. |
|
Достижение |
Сера в сырье ≤ 0.97% И Коксуемость сырья ≤ 16.8% |
Целевой сценарий достижим (вер. ~95%) |
При использовании высококачественного малосернистого сырья с умеренной коксуемостью жесткие температурные требования не критичны. |
|
|
Избегание |
Сера в сырье > 2.5% |
Целевой сценарий НЕ достижим (вер. ~99%) |
Высокосернистое сырье является непреодолимым ограничением для получения малосернистого кокса. |
|
|
Избегание |
Сера в сырье ≤ 2.5% И Макс. температура ≤ 490°C И Сера в сырье > 0.97% |
Целевой сценарий НЕ достижим (вер. ~96%) |
Комбинация сырья среднего качества и недостаточной температуры ведет к неудаче. |
|
|
Высокопрочный кокс |
Достижение |
Давление в колонне ≤ 2.25 бар |
Целевой сценарий достижим (вер. ~98%) |
Низкое давление — наиболее эффективный и контролируемый фактор получения высокопрочного кокса. |
|
Достижение |
Давление > 2.25 бар И Сера в сырье > 4.32% И Скорость нагрева > 29.4 °C/ч |
Целевой сценарий достижим (вер. ~85%) |
Рисковый путь: при повышенном давлении прочность может быть достигнута только на высокосернистом сырье при очень высокой скорости нагрева. |
|
|
Избегание |
Давление > 2.25 бар И Сера в сырье ≤ 4.32% |
Целевой сценарий НЕ достижим (вер. ~100%) |
Повышенное давление в сочетании с низко- или среднесернистым сырьем гарантированно не дает высокой прочности. |
|
|
Избегание |
Давление > 2.25 бар И Сера в сырье > 4.32% И Скорость нагрева ≤ 29.4 °C/ч |
Целевой сценарий НЕ достижим (вер. ~94%) |
Недостаточная скорость нагрева блокирует возможность компенсации высокого давления сернистым сырьем. |
Для сценария «Высокопрочный кокс» модель однозначно указала на давление в колонне как на ключевой и наиболее эффективный рычаг управления. При этом было обнаружено существование сложного, многофакторного компенсационного механизма (сырье + скорость нагрева), позволяющего достичь цели даже в субоптимальных условиях по давлению, хотя и с меньшей вероятностью и повышенными энергозатратами.
Таким решений
образом, разработанные
деревья
не только обеспечивают высокую
точность прогноза
достижимости
целевых
состояний,
но и формализуют сложные
технологические взаимосвязи в виде набора простых, проверяемых и готовых к применению операционных правил.
ОБСУЖДЕНИЕ
Полученные результаты демонстрируют принципиальную возможность и высокую эффективность применения метода деревьев решений для формализации технологических знаний и генерации операционных правил управления процессом замедленного коксования. Точность классификации, превышающая 92% для обоих рассмотренных сценариев, подтверждает, что статистические закономерности, связывающие управляемые
параметры сырья и режима с конечными потребительскими свойствами кокса, являются устойчивыми и поддаются извлечению даже из ограниченного набора данных.
Выявленные деревьями ключевые факторы полностью согласуются с общепринятыми физико-химическими представлениями о процессе. Доминирующая роль содержания серы в сырье для получения малосернистого кокса и давления в колонне для управления прочностью документально подтверждена в ряде фундаментальных и технологических исследований [13 - 15]. Однако предлагаемый подход позволяет перейти от качественных зависимостей к количественным и логически структурированным правилам, определяющим не только наличие влияния, но и конкретные пороговые значения параметров и их комбинации.
Важным практическим результатом является формирование «карты решений», включающей как конструктивные правила достижения цели, так и запретительные правила избегания нецелевых состояний. Это напрямую соответствует логике оперативного технологического планирования, где критически важно знать не только «что делать», но и «чего не делать». Например, правило, однозначно указывающее на невозможность получения низкосернистого кокса из высокосернистого сырья, формализует и обосновывает сырьевые ограничения, которые в текущей практике часто носят эмпирический характер.
Основным ограничением проведенного исследования является рассмотрение лишь двух наиболее очевидных и востребованных целевых сценариев. В реальных условиях планирования производства набор целевых состояний продукта может быть значительно шире и включать композитные требования (например, «низкая сера И высокая плотность»). Кроме того, используемый исторический массив данных, несмотря на предобработку, может не в полной мере отражать все возможные режимные состояния установки, особенно критические или аварийные.
Разработанные деревья решений и извлеченные из них правила являются прототипом модуля операционных предписаний в формируемом модельно-алгоритмическом обеспечении гибридного цифрового двойника. В его архитектуре данный модуль занимает промежуточное положение между прогнозными блоками машинного обучения (отвечающими на вопрос «что будет?») и системами оптимизации (решающими задачу «как наилучшим образом достичь цели?»). Его функция — трансляция сложных прогнозных моделей в понятный для технологического персонала набор инструкций, что является ключевым шагом для повышения операционной эффективности и снижения зависимости от субъективного человеческого опыта.
ЗАКЛЮЧЕНИЕ
В результате проведенного исследования была успешно апробирована методика применения деревьев решений для формирования операционных технологических правил управления процессом замедленного коксования. На реальных промышленных данных для двух ключевых сценариев качества — получения низкосернистого и высокопрочного нефтяного кокса — были построены компактные интерпретируемые модели, показавшие высокую точность классификации ( F1‑score 0,91 и 0,95 соответственно).
Практическая значимость работы состоит в создании инструмента, готового к интеграции в технологический контур. Этот инструмент формализует экспертные знания в виде набора логических правил «ЕСЛИ-ТО» и позволяет технологу на этапе подготовки цикла оценить достижимость целевого сценария, выбирая соответствующий набор управляющих воздействий. Кроме того, разработанный подход создает основу для системы поддержки принятия решений в составе цифрового двойника, замыкая контур «прогноз – правило – действие».
Полученные результаты подтверждают принципиальную возможность построения подобного анализа. Они определяют направления дальнейшего развития, которое будет включать расширение набора целевых сценариев совместно с технологическими службами предприятия, интеграцию модуля правил с блоками предиктивного моделирования и оптимизации в единый контур адаптивного управления цифрового двойника, а также разработку механизма периодической актуализации правил по мере накопления новых производственных данных для сохранения их релевантности при изменении сырьевой базы или модернизации установки.
Таким образом, работа вносит конкретный вклад в решение общей задачи проекта — создание интеллектуального модельно- алгоритмического обеспечения для цифрового двойника, способного не только описывать, но и