ОЦЕНКА ЭФФЕКТИВНОСТИ ПРИМЕНЕНИЯ КЛАССИФИКАТОРОВ МАШИННОГО ОБУЧЕНИЯ В ЗАДАЧЕ РАСПОЗНАВАНИЯ ТИПА ГАЗА И ЕГО КОНЦЕНТРАЦИИ
Автор: Т. В. Осипова, А. М. Баранов, И. И. Иванов
Журнал: Научное приборостроение @nauchnoe-priborostroenie
Рубрика: Системный анализ приборов и измерительных методик
Статья в выпуске: 4, 2023 года.
Бесплатный доступ
В данной работе были рассмотрены методы классификации в машинном обучении, проведена оценка применимости классификаторов в задаче распознавания типа газа и его концентрации в смеси. В ходе исследования были сформированы теоретические значения водорода, углеводородов и их смесей в соотношении 20, 50 и 80%, и оценка классификаторов проводилась на экспериментальных данных, полученных с термокаталитического сенсора. Представленные классификаторы позволили определить тип газа с точностью до 87.5%.
Термокаталитический сенсор, метод главных компонент, классификация, определение концентрации, водород, обработка данных
Короткий адрес: https://sciup.org/142238617
IDR: 142238617
Текст статьи ОЦЕНКА ЭФФЕКТИВНОСТИ ПРИМЕНЕНИЯ КЛАССИФИКАТОРОВ МАШИННОГО ОБУЧЕНИЯ В ЗАДАЧЕ РАСПОЗНАВАНИЯ ТИПА ГАЗА И ЕГО КОНЦЕНТРАЦИИ
На сегодняшний день проведение измерений и анализа состава газовой смеси играет ключевую роль в различных областях, включая мониторинг окружающей среды и промышленное производство. Способность точно идентифицировать, количественно определять и разделять по типу газообразные вещества играет важную роль в обеспечении безопасности жизнедеятельности, оптимизации технологических процессов и диагностике окружающей среды. Традиционные методы газового анализа в значительной степени опираются на стандартные методы измерений и ручную интерпретацию, часто сталкиваясь с присущими им ограничениями в чувствительности обнаружения, трудоемкостью анализа и подверженностью человеческим ошибкам.
Среди огромного количества разнообразных углеводородов особое место занимает водород. Имея самый большой диапазон взрывоопасных концентраций (от 4 до 75% об.), а также являясь крайне летучим, водород считается одним из самых взрывоопасных газов. Также водород рассматривается в качестве перспективного вида топлива (или компонента топлива, в частности, в смесях с углеводородами) [1, 2], разработка эффективных сенсоров водорода и методик его мониторинга в воздухе является актуальной задачей.
В последние годы с появлением машинного обучения произошло ключевое обновление в применении искусственного интеллекта, развитии экспертных систем и появлении новых подходов к обработке больших массивов данных. Эта область искусственного интеллекта позволяет разрабатывать инновационные подходы для автоматизации сложных задач, повышения эффективности и получения ценной информации из обширных наборов данных. Используя возможности методов машинного обучения, исследователи модернизируют методы газового анализа, способствуя развитию этой важной научной области.
Используя алгоритмы машинного обучения, газовый анализ может выйти за рамки стандартных практик и преобразоваться в более точный, эффективный и комплексный подход. Способность быстро обрабатывать огромные массивы данных и извлекать закономерности в сочетании со скоростью принятия решений алгоритмами приведет к модернизации или к разработке новых способов в методологиях газового анализа. Более того, модели машинного обучения могут значительно повысить точность распознавания горючего газа и количественной оценки состава газовой смеси, что позволяет проводить более надежные и точные измерения.
Инструментом для проведения измерений при газовом анализе является сенсор газа. В настоящее время существует ряд сенсоров, основными из которых считаются полупроводниковые, оптические и термокаталитические [3]. В данной работе исследование проводилось на данных, полученных с помощью термокаталитического сенсора. Такой тип сенсора является широко применяемым при измерениях концентраций горючего газа или смеси. Но ввиду того, что на поверхности сенсора окисляются все присутствующие в окружающей среде газы, одним из недостатков является низкая избирательность к искомому типу газа. Предполагается, что применение методов машинного обучения позволит усовершенствовать существующие методики измерений и анализа газовой смеси.
В наших предыдущих работах [4, 5] представлены результаты, показавшие, что метод главных компонент (МГК) как способ, применяемый в области машинного обучения, позволяет различать отклики сенсоров при разной концентрации без использования дополнительных математических операций подготовки полученных данных. Также установлено, что при обработке исходных данных при помощи МГК вне зависимости от количества сенсоров полученные значения главных компонент образуют линейные зависимости концентрации, которые пропорциональны между собой. МГК позволяет как визуально различать отклики сенсоров при разной концентрации, так и с использованием дополнительных математических операций получить значение концентрации.
Другим направлением в области машинного обучения является классификация — получение однозначного ответа на основе набора признаков. Классификация необходима для газового анализа, в первую очередь для определения типа и состава различных газов. Это важно по нескольким причинам:
– безопасность (разные газы обладают разным уровнем взрывоопасности, благодаря точной классификации анализируемого газа можно принять надлежащие меры предосторожности для предотвращения несчастных случаев, утечек или вредного воздействия);
– воздействие на окружающую среду (некоторые газы оказывают значительное воздействие на окружающую среду и способствуют загрязнению воздуха, анализ и классификация газов помогают оценить присутствие и концентрацию таких газов, поддерживая усилия по снижению их выбросов и контролю за ними);
– оптимизация технологических процессов (во многих промышленных процессах газы используются в качестве реагентов, катализаторов или носителей, понимание свойств и состава этих газов с помощью классификации позволяет лучше оптимизировать процесс, что приводит к повышению эффективности и производительности).
В статье [6] предлагается метод классификации газов для системы электронного носа, для которого используются комбинированные признаки, полученные с помощью линейно-дискриминантного анализа. Результаты проведенного эксперимента показали, что для восьми типов данных газа, которые были измерены с помощью сенсорной матрицы, состоящей из 16 каналов, метод показал хоро- шую эффективность классификации. В частности, когда в процессе измерения генерируется шум, предложенный метод показал результаты классификации, которая является более эффективной, чем у других методов. Учитывая возможность тестирования на множестве сложных данных, в будущем будут проводиться эксперименты, сочетающие различные типы характеристик.
В статье [7] представлен метод, основанный на алгоритме ядерного дискриминантного анализа для идентификации типов газа. Было обнаружено, что точность алгоритма была на 4.17% выше, чем та, которая была получена с использованием МГК. В случае стандартного отклонения представленный алгоритм обладает самой высокой скоростью распознавания и наименьшими затратами времени.
Целью данной работы является изучение алгоритмов классификации машинного обучения, а также оценка точности применимых классификаторов. Важность данного исследования связана с оптимизацией параметров и характеристик термокаталитических сенсоров, в частности чувствительности и селективности, а также с необходимостью изменения методик измерения для получения большего числа данных для последующей математической обработки и повышения селективности сенсоров.
МЕТОДИКА ЭКСПЕРИМЕНТА
Многомерный сигнал сенсора представляет собой совокупность значений отклика сенсора, измеренных при разном приложенном напряжении питания ( U пит ). На рис. 1 представлены экспериментально полученные S-образные зависимости отклика сенсора от напряжения питания для водорода, пропана и метана в чистом виде.

Рис. 1. Экспериментальные S-образные зависимости отклика сенсора от напряжения питания для водорода, пропана и метана
Измерения сигнала осуществлялись при сканировании с изменением напряжения от 0.05 В до 3.3 В с шагом 0.05 В. В качестве сенсоров были взяты промышленные термокаталитические сенсоры, которые серийно выпускаются фирмой "НТЦ ИГД" [8]. Термокаталитический сенсор был включен в мостовую измерительную схему, в которой в одном плече вместе с ним размещался сенсор сравнения (аналогичный по конструкции сенсор, но без нанесенного катализатора), а во втором плече — два прецизионных резистора с номиналом 1 кОм.
В соответствие с работой [5] и на основе полученных экспериментальных S-образных зависимостей были сформированы значения отклика сенсора на двухкомпонентные смеси (водород – пропан) и (водород – метан) с процентным содержанием H 2 : 20, 50 и 80% (в дальнейшем — теоретические значения). Теоретические значения отклика сенсора представлены на рис. 2. На рис. 2, а, представлены значения для водорода, пропана и их смесей, на рис. 2, б, — для водорода, метана и их смесей.
Теоретические значения были обработаны при помощи МГК, результат обработки представлен на рис. 3.


б
Напряжение, В
Рис. 2. Теоретические значения отклика сенсора.
а — для водорода, пропана и их смесей; б — для водорода, метана и их смесей

Рис. 3. Теоретические значения после применения МГК
Отмечено, что значения главных компонент образовали линейные зависимости и расположены в порядке возрастания концентрации водорода в смеси (слева — максимум концентрации (чистый водород), справа — минимум концентрации), формируя свои шкалы распределения концентрации отдельно для смесей (водород – метан) и (водород – пропан).
В контексте машинного обучения классификация относится к обучению с учителем. Данный тип обучения подразумевает, что на этапе обучения исходным данным, подаваемым на вход, уже присвоен класс, а важная часть признаков уже разделена на отдельные категории.
Существует несколько алгоритмов, используемых для задач классификации, в том числе:
– наивный байесовский алгоритм (вероятностный алгоритм предполагает независимость между объектами и вычисляет вероятность принадлежности экземпляра данных к каждому классу);
– метод опорных векторов (метод находит гиперплоскость, которая наилучшим образом разделяет точки данных разных классов в многомерном пространстве);
– метод k-ближайших соседей (предсказывает класс точки данных на основе большинства классов ее k ближайших соседей в пространстве объектов);
– логистическая регрессия (выводит прогнозы о точках в бинарном масштабе — нулевые или единичные; если значение чего-либо равно либо больше 0.5, то объект классифицируется в большую сторону (к единице), если значение меньше 0.5 — в меньшую (к нулю)).
Чтобы выполнить классификацию, модель машинного обучения обучается на помеченных дан- ных, где каждая точка данных связана со своим правильным классом. Во время обучения модель изучает закономерности и взаимосвязи в данных, что позволяет ей делать точные прогнозы для испытательных примеров.
В данной работе мы рассмотрим методы классификации, перечисленные выше, и оценим их производительность по точности прогноза.
РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ
Применение классификации к результатам, полученным после обработки МГК, выполнено с помощью библиотеки scikit-learn [9] средствами языка Python 3.11. В качестве проверочных данных были использованы экспериментальные данные, полученные по методике, описанной в работе [10], для водорода, метана, пропана и их смесей.
После обработки экспериментальных откликов, полученных системой сенсоров, при помощи МГК были получены следующие результаты, представленные на рис. 4.
Как видно из полученного результата, экспериментальные данные образовали области локализации вокруг теоретических значений чистых углеводородов, водорода и их смесей. Разброс между полученными значениями главных компонент связан с разбросом экспериментальных данных (отклонения в снятых значениях обусловлены допуском, закладываемым на каждый сенсор в рамках производства). Также отмечено, что некоторые значения водорода и его смесей с пропаном в соотношении 50% и 80% находятся в окрестности теоретических точек смеси (водород – метан) в тех же соотношениях.
х H2(20)_CH
□ H2 (50)_C 3 H
О H2(80)_C3H ж H2(20)_C3H

Рис. 4. Результат обработки экспериментальных данных при помощи МГК
Табл. Точность прогнозирования каждого метода классификации
№ п/п |
Метод |
Точность, % |
1 |
Метод k-ближайших соседей |
87.5 |
2 |
Логистическая регрессия |
85.71 |
3 |
Наивный байесовский алгоритм |
87.5 |
4 |
Метод опорных векторов |
87.5 |
Предполагается, что при применении классификаторов возможно неправильное определение типа газа. Результат определения представлен на рис. 4, где неверно классифицированные значения обозначены подписями на сером фоне. Точность прогнозирования составила 87.5%. Аналогично были рассмотрены остальные методы, результаты прогнозирования которых сведены в таблицу.
Как видно из полученных результатов, большинство алгоритмов корректно определяет тип газа. Различие по точности логистической регрессии объясняется тем, что данный классификатор является линейным и чаще используется на тех данных, у которых есть линейная зависимость. Ввиду того, что исходные данные имеют нелинейную зависимость, использование логистической регрессии в задаче классификации является нецелесообразным, хотя и имеет достаточную точность.
Стоит отметить, что точность классификаторов возможно повысить путем применения большего количества экспериментальных данных или предварительной подготовкой снятых данных с термокаталитического сенсора (приведение исходных данных к одному общему формату данных). Также возможным вариантом повышения точности классификаторов является уточнение и переопределение теоретических значений.
ЗАКЛЮЧЕНИЕ
В работе было проведено исследование применения классификаторов для определения типа газа на основе данных, полученных с термокаталитических сенсоров, при помощи МГК в мультисен-сорной системе. Применение классификаторов позволяет с точностью до 87.5% распознать тип газа или двухкомпонентную смесь.
Показано, что при обработке исходных данных при помощи МГК полученные значения главных компонент образуют линейные зависимости концентрации, которые пропорциональны между собой, а также не имеют пересечений для разных углеводородов. В данной работе представлены такие углеводороды, как метан и пропан, обработка значений которых сформировала две линейные отдельные зависимости. Это позволило визуально различать отклики сенсоров при разной концентрации.
Полученные результаты имеют важное значение для разработки и оптимизации методов анализа состава воздуха, в частности позволят перейти от пересчетов концентрации "внутри" сенсора к математической обработке получаемых с сенсора данных и на ее основе проводить определение концентрации поданного газа.
Также, ввиду того что водород становится топливом будущего, новым энергоносителем (его роль будет сопоставима с ролью угля, нефти или газа), разработанный метод общеприменим и перспективен для дальнейшего использования в сенсорах газа, не только сенсорах водорода, которые будут актуальны в ближайшем будущем, но и при распознавании других целевых газов.
Список литературы ОЦЕНКА ЭФФЕКТИВНОСТИ ПРИМЕНЕНИЯ КЛАССИФИКАТОРОВ МАШИННОГО ОБУЧЕНИЯ В ЗАДАЧЕ РАСПОЗНАВАНИЯ ТИПА ГАЗА И ЕГО КОНЦЕНТРАЦИИ
- 1. Попадько Н.В., Рожнятовский Г.И., Дауди Д.И. Водородная энергетика и мировой энергопереход // Инновации и инвестиции. 2021. № 4. С. 59–64. URL: https://elibrary.ru/item.asp?id=45723109
- 2. Грушевенко Е., Капитонов С., Мельников Ю. и др. Декарбонизация нефтегазовой отрасли: международный опыт и приоритеты. Центр энергетики МШУ СКОЛКОВО, 2021. 158 с. [Электронный ресурс]. URL: https://energy.skolkovo.ru/downloads/documents/SEneC/Research/SKOLKOVO_EneC_Decarbonization_of_oil_and_gas_RU_22032021.pdf (дата обращения: 01.08.2023).
- 3. Баранов А.М., Осипова Т.В. Современные тенденции в развитии сенсоров довзрывоопасных концентраций горючих газов и паров горючих жидкостей (Краткий обзор) // Научное приборостроение. 2021. Т. 31, № 4. C. 3–29. URL: http://iairas.ru/mag/2021/abst4.php#abst1
- 4. Осипова Т.В., Баранов А.М., Иванов И.И. Метод главных компонент как альтернативный алгоритм обработки данных термокаталитических сенсоров // Научное приборостроение. 2022. Т. 32, № 1. C. 77–92. URL: http://iairas.ru/mag/2022/abst1.php#abst8
- 5. Осипова Т.В., Баранов А.М., Иванов И.И. Метод главных компонент как способ определения концентрации водорода в многокомпонентных смесях // Научное приборостроение. 2023. Т. 33, № 2. C. 24–34. URL: http://iairas.ru/mag/2023/abst2.php#abst3
- 6. Choi S.-Il, Eom T., Jeong Gu-Min. Gas classification using combined features based on a discriminant analysis for an electronic nose // Journal of Sensors. 2016. Vol. 2016. Id. 9634387. DOI: 10.1155/2016/9634387
- 7. Li H., Luo D., Sun Y., GholamHosseini H. Classification and identification of industrial gases based on electronic nose technology // Sensors. 2019. Vol. 19. Id. 5033. DOI: 10.3390/s19225033
- 8. Karpov-sensors. Производство термокаталитических сенсоров горючих газов. [Электронный ресурс] URL: http://karpov-sensor.com/ (дата обращения 01.08.2023).
- 9. Scikit-learn: machine learning in Python. [Электронный ресурс] URL: https://scikit-learn.org (дата обращения 09.08.2023).
- 10. Иванов И.И., Баранов А.М., Талипов В.А., Миронов С.М., Колесник И.В., Напольский К.С. Разработка эффективных сенсоров обнаружения довзрывоопасных концентраций H2 // Научное приборостроение. 2021. Т. 31, № 3. C. 25–36. URL: http://iairas.ru/mag/2021/abst3.php#abst4