Применение методов машинного обучения при проектировании камер сгорания газотурбинных двигателей

Автор: Борисов Д.С., Симовин К.К., Юкина Д.Р., Благов А.В., Чечет И.В., Матвеев С.Г.

Журнал: Онтология проектирования @ontology-of-designing

Рубрика: Прикладные онтологии проектирования

Статья в выпуске: 3 (57) т.15, 2025 года.

Бесплатный доступ

В статье рассматривается применение рекуррентной нейронной сети с долгой краткосрочной памятью и алгоритма градиентного бустинга для определения основных геометрических размеров диффузора камеры сгорания авиационного газотурбинного двигателя. Выполнено численное моделирование физических процессов в диффузоре на основе метода конечных элементов и расчѐт потерь полного давления. Сформирована база данных геометрических параметров рассматриваемой модели диффузора и соответствующих им результатов расчѐта потерь полного давления. Вариант с минимальными потерями полного давления использован в качестве эталона. Проведено сравнение метода градиентного бустинга и нейронной сети с долгой краткосрочной памятью на данных о потерях полного давления, полученных в результате численного моделирования диффузора с различными значениями его геометрических размеров. Погрешность метода градиентного бустинга составила 1,64%, для рекуррентной нейронной сети с долгой краткосрочной памятью – 7,28%. Применѐнный подход позволяет формировать базу данных вариантов конструкций диффузоров, результаты расчѐтов использовать для обучения нейронных сетей и в дальнейшем дообучать модели на других конструкциях для использования полученного результата при проектировании камер сгорания.

Еще

Машинное обучение, градиентный бустинг, рекуррентная нейронная сеть, проектирование, диффузор камеры сгорания, метод конечных элементов

Короткий адрес: https://sciup.org/170209532

IDR: 170209532   |   DOI: 10.18287/2223-9537-2025-15-3-351-362

Текст научной статьи Применение методов машинного обучения при проектировании камер сгорания газотурбинных двигателей

Задачи проектирования элементов, узлов и конструкций авиационных двигателей решаются с использованием методов вычислительной газодинамики, специализированных программных комплексов (Ansys Fluent1, STAR-CCM+2, OpenFOAM3, FLOW-3D4 и др.) и больших вычислительных ресурсов [1]. К такой задаче можно отнести проектирование элементов камер сгорания (КС) газотурбинных двигателей (ГТД). Важным требованием к КС ГТД является обеспечение потерь полного давления (ППД), не превышающих значений, установленных техническим заданием на проектирование КС [2, 3]. Примерно две трети ППД в КС обусловлены процессами горения и смешения. Остальные потери приходятся на диффузор, который обеспечивает торможение потока воздуха, выходящего из компрессора и его распределение по кольцевым каналам КС. Снижение ППД в диффузоре улучшает характеристики КС и повышает эффективность двигателя в целом [2-5].

Первичный облик КС определяется выбранным прототипом. Проектировочный расчёт прототипа КС позволяет установить: габариты диффузора, геометрию фронтового устройства, объём и габариты жаровой трубы, длину газосборника и т.д.Упрощённая геометрическая модель КС используется для трёхмерного моделирования процессов средствами вычислительной гидродинамики ( Computational Fluid Dynamics, CFD ) [1]. В результате итеративного процесса CFD -расчётов получается окончательный вариант проекта конструкции.

Целью данной работы является попытка применения методов интеллектуального анализа данных (ИАД) [6-10] к проектированию проточной части диффузора КС ГТД. В практике проектирования КС используется специализированное программное средство «Optimization » в Ansys 1 , с помощью которого определяют геометрию диффузора, обеспечивающую минимальные ППД и его распределение по каналам КС. Время поиска решения может составлять от нескольких дней до нескольких недель. В результате создаётся большой объём данных, который можно использовать для обучения нейронной сети (НС). Предиктивная аналитика, базирующаяся на использовании нейросетевых моделей, способна быстро и точно прогнозировать различные результаты и явления. Количество и структура данных, по которым проходит обучение моделей, оказывает существенное влияние на их прогностическую способность. Например, недостаточное количество данных влияет на качество и точность прогноза, а увеличение количества данных позволит повысить точность, но может привести к переобучению [11].

  • 1    Выбор методов машинного обучения

Предиктивная аналитика объединят методы ИАД и прогнозного моделирования с целью прогнозирования будущих событий [6]. Она представляет собой набор инструментов, включающий методы анализа больших данных и статистические методы. Использование различных алгоритмов ИАД позволяет обнаруживать скрытые закономерности, выявлять неизвестные зависимости и обучаться [7].

На начальных этапах ИАД выполняют подготовку и преобразование данных [7, 12]. Частью преобразования является очистка данных, в процессе которой устраняются дубликаты, многозначность, аномалии, пропущенные значения и т.п. Одним из распространённых алгоритмов преобразования является нормализация [13]. Другим важным алгоритмом преобразования является обобщение, позволяющее объединить данные в категории для более глубокого понимания зависимостей [14].

Перед обучением нейросетевой модели данные необходимо разделить на выборки [13]. Обычно используются два типа выборок: контрольная и тренировочная. На контрольную выборку отводится 20%, на тренировочную 80%. Тренировочная выборка разделяется ещё на две: 70% - обучающая и 30% - тестовая выборки. Обучающая выборка используется для обучения модели, тестовая - для оценки её качества, а контрольная - для выбора наилучшей модели.

Следующим этапом определяется тип задачи, решаемой ИАД. Среди основных задач: регрессия, классификация и кластеризация [15]. После этого данные могут обрабатываться посредством построения моделей, онтологических конструкций и других методов. В данной работе применены рекуррентная НС (РНС) с долгой краткосрочной памятью ( Long Short-Term Memory, LSTM), способная обучаться долгосрочным зависимостям [16], и алгоритм машинного обучения с применением градиентного бустинга над деревьями решений ( Categorical Boosting, CatBoost ) [17].

РНС с долгой краткосрочной памятью способна хранить информацию на протяжении продолжительного времени. На рисунке 1 представлена схема искусственной НС, которая состоит из трёх типов слоёв [18]: ■    входной - получает данные;

  •    скрытый - обрабатывает информацию и может состоять из нескольких скрытых слоёв, количество кото

рых зависит от сложности задачи;

  •    выходной - генерирует результат.

Каждый нейрон, называемый также сумматором, получает входные сигналы с весами, отражающими их значимость [19]. Нейрон суммирует входные сигналы, умножая их на соответствующие веса. РНС представляют собой последовательность одинаковых сетей, позволяющих запоминать и передавать информацию [20]. Схема работы РНС приведена на рисунке 2.

РНС демонстрируют высокую эффективность при решении задач многомерного прогнозирования и моделирования нелинейных взаимосвязей и не требуют большого количества данных, как глубокие НС [21].

РНС имеют ограниченную способность запоминать информацию на протяжении длительных периодов. Поэтому применяется архитектура LSTM , которая позволяет НС хранить и обрабатывать информацию в

Входной слой Скрытые слои

Рисунок 1 - Схема модели искусственной нейронной сети

течение длительного времени. LSTM -сети сохраняют состояние ячейки, содержащее информацию, необходимую для запоминания. Управление доступом к информации, хранящейся в состоянии ячейки, осуществляется посредством фильтров, включающих сигмоидальный слой [21]. Схематическое представление архитектуры LSTM приведено на рисунке 3.

U — матрица весов для входных данных; V — матрица весов для выходных данных; W — матрица весов

для рекуррентных входных данных; xt — входное значение в момент времени t ; yt выходное значение в момент времени t ; ht вектор результата активации скрытых нейронов в момент времени t

Рисунок 2 - Схема рекуррентной нейронной сети

Рисунок 3 - Схема нейронной сети с долгой краткосрочной памятью

В условиях ограниченного объёма обучающей выборки целесообразно использовать алгоритмы машинного обучения с применением градиентного бустинга. Градиентный бустинг отличается устойчивостью при недостаточном объёме данных и эффективностью работы с табличными данными. В качестве входных данных принимаются множества X, Y и используется пространство вещественных чисел в качестве оценок. Описать принцип градиентного бустинга можно следующей формулой [22]: a ( x ) = C ( b ( x )), где b : X ^ R - алгоритмический оператор (базовый алгоритм), а функция C : R ^ Y называется решающим правилом.

Схема алгоритм градиентного бустинга представлена на рисунке 4. В отличие от НС алгоритм градиентного бустинга может обрабатывать данные разных типов. Он применим для прогнозирования числовых значений (регрессия) и для классификации объектов. CatBoost эффективно обрабатывает нелинейные зависимости в дан- ных, а применение L 2-регуляризации, осуществляющей штрафование больших весов модели, способствует улучшению обобщающей способности алгоритма [23]:

где Л - коэффициент регуляризации, n - количество элементов в векторе весов, w i - i -тый элемент вектора весов.

Оценка качества построенной модели осуществляется посредством анализа метрик, релевантных решаемой задаче. Для задач классификации применяется метрика точности, а для задач регрессии -среднеквадратичная ошибка ( Mean Squared Error , MSE ). Другим методом оценки является кроссвалидация, в частности, метод k-Fold [13], который включает разделение исходного набора данных на к непересекающихся частей (фолдов). В ходе к итера-

Рисунок 4 - Схема алгоритма градиентного бустинга

ций каждый из k фолдов поочерёдно используется в качестве тестовой выборки, а оставшиеся к- 1 фолды - в качестве обучающей выборки. По завершении к итераций формируется к оценок качества, усреднённое значение которых характеризует общую эффективность модели.

  • 2    Задача проектирования диффузора камеры сгорания ГТД

Уровень ППД современных КС лежит в диапазоне 4,5-6,5% и определяется по формуле:

Др* =       100%,                             (1)

где Р*х - полное давление на входе в диффузор; Рв*ых - полное давление на выходе из КС.

Около 3-3,5% ППД возникают в процессах смесеобразования, горения и смешения в жаровой трубе КС, 1-3% - при торможении потока воздуха, выходящего из компрессора, и его распределении по кольцевым каналам КС [2, 3].

Объектом исследования является диффузор КС с внезапным расширением, схема которого представлена на рисунке 5. Для трёхмерного CFD -расчёта рассмотрен сектор диффузора (10°) кольцевой КС. В процессе расчёта положения входного и выходного сечений и их размеры оставались неизменными. Элементы внутреннего и внешнего корпусов приняты линейными для упрощения автоматического построения конечно-элементной модели (КЭМ). Геометрия диффузора определена следующими параметрами: L^- длина диффузора, d^ -диаметр до точки пересечения линии угла нацеливания а с выходным сечением диффузора, а 1 и а 2 -углы раскрытия стенок диффузора.

Линейные и угловые размеры варьировались в

1 - диффузор, 2 - элементы корпуса

Рисунок 5 - Схема конструкции диффузора КС с внезапным расширением

диапазонах, основанных на экспериментальных данных, включённых в методики одномерного проектирования [3, 24, 25]: угол раскрытия диффузора 9°...11°; Ьд = 63^77 мм; dд = 456^558 мм.

Для CFD -расчёта создана КЭМ с максимальным размером элемента 1,2 мм и минимальным 0,15 мм. Количество элементов в модели во всех вариантах расчёта составило около 200 тыс. элементов. Ортогональное качество элементов модели 0,2.

Расчёты выполнялись для значений давления на входе в КС в диапазоне 3,2- 5,2 МПа, что соответствовало режимам работы ГТД во время взлёта и посадки.

Выполнены расчёты 2142 вариантов геометрии диффузора. На каждом шаге автоматического расчёта записывались значения всех геометрических параметров диффузора, давления на выходе и рассчитывались ППД. Минимальное значение ППД принято за эталон. На полученных значениях обучены нейросетевая модель и алгоритм градиентного бустинга. Результаты прогнозов верифицированы по CFD -расчёту.

Для сравнения потерь, предсказанных методами РНС и CatBoost , и потерь, полученных в результате CFD -расчёта, определена относительная погрешность

£ _ |Др predicted-^ CFd\ ^ q q 0 /                                    Г 2 'j где Pp*peed-ted - предсказанные ППД; CFD-fd - ППД, полученный в результате CFD-расчёта.

  • 3    Реализация методов LSTM и CatBoost

    Для реализации методов LSTM и CatBoost на Python использовались данные, полученные при трёхмерном численном моделировании диффузора. Набор данных содержит восемь столбцов значений: входное и выходное давления, процент потерь и пять геометрических параметров диффузора. После предварительной обработки данных (2142 варианта), включающей удаление дубликатов и строк с пропущенными значениями, он был сокращён до 1720. Нормализация данных выполнена тремя методами: минимума-максимума; Z-масштабирования; на основе среднего значения [26]. Данные были разделены на обучающую, тестовую и контрольную выборки и преобразованы в формат, совместимый с используемыми методами машинного обучения.

Для построения и оценки моделей LSTM использовался фреймворк Keeas [27]. Архитектура модели включала входной слой, заданное количество скрытых слоёв и выходной слой, оптимизированный с помощью алгоритма Adam [28]. Перебор гиперпараметров, включая точность обучения, размер пакета данных, тип нормализации и количество скрытых слоёв, проводился с использованием кросс-валидации и отрицательной среднеквадратичной ошибки в качестве функции потерь. Обучение модели осуществлялось с использованием лучших параметров, определённых в процессе перебора, и последующим восстановлением исходных значений для оценки результатов.

Для оценки влияния предобработки данных на эффективность алгоритма градиентного бустинга деревья решений были протестированы на данных с различными типами нормализации, а также на исходном, ненормализованном наборе данных. С целью оптимизации гиперпараметров каждой модели CatBoost (обученной на данных с различными типами нормализации) был реализован поиск по сетке с варьированием скорости обучения, глубины дерева, количества итераций и коэффициента L 2-регуляризации. Оценка качества моделей производилась посредством кросс-валидации с использованием MultiRMSE [17]:

MultiRMSE - ^^Т^У^^аУ, где N — количество наблюдений в выборке; dim - количество зависимых переменных; yld — истинное значение d-го признака для i-го наблюдения; yid — предсказанное моделью значение d-го признака для i-го наблюдения.

Перед проведением вычислительного эксперимента выполняется настройка моделей. Из набора данных выделена тестовая выборка, на которой методом geid seaech [29] определены гиперпараметры моделей: тип нормализации данных; количество скрытых слоёв; размеры пакетов данных; количество итераций; коэффициенты регуляризации; глубина и точность обучения. Гиперпараметры для методов LSTM и CatBoost представлены в таблице 1. Тип нормализация для метода LSTM был выбран максимально-минимальный, точность обучения составила 0,001, а для метода CatBoost – 0,1. Схемы моделей, применённые для каждого метода, представлены на рисунках 6-8.

Рисунок 6 – Схема модели, предиктором которой является потеря полного давления в диффузоре

Рисунок 7 – Схема модели, предикторами которой являются углы раскрытия диффузора и наклона осевой линии

Рисунок 8 – Схема модели, предикторами которой являются линейные параметры диффузора

Таблица 1 – Гиперпараметры методов LSTM и CatBoost

Метод

LSTM

CatBoost

Гиперпараметры

Количество скрытых слоев

Размер пакета данных

Количество итераций

Коэффициент регуляризации

Глубина

По проценту потерь

5

1

1000

5

4

По углам

3

1

3000

7

10

По линейным параметрам

5

15

3000

7

15

  • 4    Вычислительный эксперимент и анализ результатов

  • 0.0         0.2         0.4         0.6         0.8         1.0

В ходе вычислительного эксперимента верифицировались значения ППД, предсказанные методами LSTM и CatBoost со значениями ППД, полученными в результате численного моделирования диффузора в Ansys Fluent . Модель диффузора строилась по спрогнозированным геометрическим параметрам. Значения входных параметров для каждой модели задавались случайным образом из принятых диапазонов (см. раздел 2). В модели, предиктором которой был процент ППД, задаваемый диапазон ограничен максимальным значением 1,1%.

В таблице 2 представлены примеры трёх строк из набора данных, полученного в результате расчётов в Ansys Fluent . Входные параметры для моделей LSTM и CatBoost брались из этих строк, выходные – предсказывались. По ним строилась геометрия диффузора и проводился верификационный расчёт прогноза по моделям LSTM и CatBoost .

Вычислительный эксперимент повторен 12 раз. Определены погрешности спрогнозированных процентов ППД от эталонных, полученных в результате расчётов в Ansys Fluent . Построены графики зависимости погрешности от спрогнозированного процента потерь (рисунки 9 и 10). Для каждой модели определено среднее значение погрешности предсказанных ППД. Метод CatBoost обеспечивает наилучшую точность предсказания геометрических параметров диффузора по проценту потерь (средняя погрешность 1,64%). Сводные данные приведены в таблице 3.

Таблица 2 – Полученные параметры диффузора с помощью разных алгоритмов на трёх наборах предикторов

Методы

Набор X

, мм

, мм

α, град

α 1 , град

α 2 , град

,

МПа

,

МПа

, %

Ansys

По проценту потерь

72,69

466,26

2,39

5,80

6,10

5,230

5,249

0,36

По углам

77,70

522,00

2,50

4,57

5,77

3,179

3,205

0,80

По линейным параметрам

75,00

542,00

1,50

3,60

5,40

3,183

3,205

0,66

CatBoost

По проценту потерь

73,20

468,80

2,30

6,10

6,20

5,230

5,249

0,36

По углам

77,20

538,40

2,50

4,57

5,77

3,176

3,205

0,90

По линейным параметрам

75,00

542,00

1,90

4,50

5,80

3,186

3,205

0,56

Верификация прогноза CatBoost

По проценту потерь

73,20

468,80

2,30

6,10

6,20

5,227

5,249

0,37

По углам

77,20

538,40

2,50

4,57

5,77

3,175

3,205

0,93

По линейным параметрам

75,00

542,00

1,90

4,50

5,80

3,186

3,205

0,58

LSTM

По проценту потерь

79,00

453,60

2,74

6,64

6,90

3,190

3,202

0,36

По углам

79,67

491,08

2,50

4,57

5,77

4,587

4,641

1,17

По линейным параметрам

75,00

542,00

2,50

4,57

5,77

4,458

4,508

1,12

Верификация прогноза LSTM

По проценту потерь

79,00

453,60

2,74

6,64

6,90

3,190

3,202

0,38

По углам

79,67

491,08

2,50

4,57

5,77

4,580

4,641

1,30

По линейным параметрам

75,00

542,00

2,50

4,57

5,77

4,450

4,509

1,29

• По проценту потерь

■ По углам

По линейным параметрам

0.0         0.2         0.4         0.6         0.8         1.0

Процент потерь модели

Рисунок 9 – Зависимости погрешности моделей

CatBoost , среднее значение погрешности модели (пунктирная линия)

Процент потерь модели

Рисунок 10 – Зависимости погрешности моделей LSTM , среднее значение погрешности модели (пунктирная линия)

Таблица 3 – Средние значения погрешностей методов

Методы

Модели

По потерям, X =

По углам, X= {α, α1, α2}

По линейным параметрам X= {  ,  }

CatBoost

1,64%

3,11%

2,84%

LSTM

7,28%

11,39%

12,19%

Для взаимодействия с обученными моделями создан веб-интерфейс с использованием следующих технологий.

  • ■   React 5 : библиотека JavaScript , обеспечивающая динамическое обновление пользовательского интерфейса.

  •    Material UI (MUI)6: библиотека готовых компонентов пользовательского интерфейса.

  • ■   React-hot-toast 7: инструмент для визуализации .

  • ■   Flask 8 : фреймворк для разработки серверной часть системы.

Заключение

В работе проведено сравнение вариантов применения методов, использующих нейросетевую LSTM модель и алгоритм градиентного бустинга CatBoost , для проектирования диффузора КС ГТД. Анализ полученных результатов показал, что CatBoost предпочтителен при имеющемся объёме обучающих данных. Средняя погрешность CatBoost составила 1,64%.

Формирование базы данных, полученных с помощью CFD -расчётов, позволило на основе машинного обучения существенно сократить время предварительной оценки геометрических параметров диффузора КС ГТД.

Статья научная