Разработка методики управления качеством данных на основе логико-семантического цифрового двойника
Автор: Павлович Татьяна Вячеславовна, Дронь Елена Анатольевна, Куликов Григорий Геннадьевич
Рубрика: Краткие сообщения
Статья в выпуске: 2 т.23, 2023 года.
Бесплатный доступ
Качество данных - ключевой вопрос в системах поддержки принятия решений. Использование же данных, содержащих одну или несколько логических ошибок, может привести к неправильным решениям и большим потерям для предприятия. Цель исследования. Целью исследования является разработка классификации данных, учитывающих профиль производства, типы данных на производстве, формальную структуру бизнес-процессов для каждого типа данных на основе предлагаемой логико-семантической архитектуры цифрового двойника для контроля качества данных. Теоретико-методологической основой исследования являются труды отечественных и зарубежных ученых по проблемам управления цифровыми платформами и цифровой трансформацией и цифровых двойников предприятия. Результаты. В ходе исследования была обобщена и систематизирована классификация основных логико-семантических факторов некачественного предоставления данных, представлена методика оценки качества данных. Бизнес-процессы сбора, хранения и обработки формализованы для каждого типа данных и определено одно ответственное лицо для соответствующих бизнес-процессов, а также разработаны требования к компетентности для отдельных ответственных лиц и инструмент для контроля качества данных. В результате предлагается подход на основе логико-семантической архитектуры цифрового двойника для контроля качества данных. Заключение. В современных реалиях необходима логическая фильтрация огромного количества избыточных данных в системах поддержки принятия решений (ППР). Цифровые двойники (ЦД) в системах поддержки принятия решений могут обеспечить высокое качество исходных цифровых данных для ППР. В этой статье представлен комплексный подход к управлению качеством данных на основе их логико-семантических цифровых двойников при создании эффективной системы поддержки принятия решений на примере нефтегазовых компаний. Управление качеством данных на основе применения логико-семантических цифровых двойников обеспечивает полезность цифровых данных.
Управление качеством данных, большие данные, цифровые двойники, цифровая трансформация
Короткий адрес: https://sciup.org/147240878
IDR: 147240878 | DOI: 10.14529/ctcr230210
Текст краткого сообщения Разработка методики управления качеством данных на основе логико-семантического цифрового двойника
Цифровые двойники – это цифровые копии предприятий, бизнес-процессов или отдельных физических объектов. Цифровой двойник – это инструмент для решения проблем управления эффективностью бизнеса, выбора наилучших способов развития предприятия для обеспечения выживания и благополучия компаний на высоко конкурентных рынках [1, 2].
Качество данных напрямую определяет ценность применения цифрового двойника и качество бизнес-решений.
В этой статье представлен комплексный подход к управлению качеством данных на основе их логико-семантических цифровых двойников при создании эффективной системы поддержки принятия решений на примере нефтегазовых компаний.
Анализ основных факторов качества данных
Согласно стандарту ISO 9000: 2015 основными критериями качества данных являются их полнота, надежность, точность, согласованность, доступность и своевременность.
Необходимо сформулировать дополнительные логико-семантические критерии оценки качества данных, чтобы разделить, какие совокупности данных являются качественными, а какие нет. Для этого можно выделить пять основных логико-семантических факторов некачественного предоставления данных, действие которых снижает их качество:
-
1) упустить факт;
-
2) искажать последовательность событий;
-
3) не указывать время;
-
4) добавить ложную информацию;
-
5) изменить важность.
Эти логико-семантические факторы являются основными причинами неправильного представления менеджера о ситуации. Есть много способов, которыми эти пять факторов неправомерного использования данных могут создать совершенно ложное впечатление о деловой ситуации. Решения, действия или приказы, принятые на основе некорректных данных, приводят к ошибкам и негативным последствиям для бизнеса. Существует большое количество комбинаций этих методов или ошибок, одно и то же сообщение или отчет может содержать сразу несколько факторов по некачественным данным, а в некоторых случаях даже все пять факторов.
Разработана методология оценки качества данных (рис. 1):
-
• шаг 1 – анализ данных или оценка качества данных в отчетах;
-
• шаг 2 – анализ ситуации или выявление проблемной области предприятия, которую нужно проверить или проинспектировать прежде всего.

Профильные компетенции
Добыча нефти
Влияние качества G&G**
данных на точность прогноза профиля добычи
------------------------------------------------------------------Г------------------------------------------------------------------
Элементы внедрения процессов управления качеством данных «как должно быть» для достижения целевых показателей добычи
Примечание: *SPA (Single Person of Accountability) - единственное ответственное лицо.
Количество требуемых специалистов
Специалисты с какими компетенциям и необходимы
Способы контроля качества данных
Ответственный по каждому виду данных
Требования к компетенциям
Чек-лист контроля качества данных по ГИС
Модель процессов по всем видам данных
ГИС гдис
Керн
Флюиды
Петрофизика
Сейсмика
Модель процессов «как должно быть» Управления качеством данных для НГДУ
SPA* по всем видам данных
Рис. 1. Концепция методологии управления качеством данных Fig. 1. Concept of data quality management methodology
В первую очередь, необходимо разработать классификацию данных, так как они влияют на профиль производства. Предлагается семь типов данных, которые получаются в ходе следующих операций: геофизические исследования скважин, гидродинамические исследования скважин, петрофизические исследования, сейсморазведка, анализ керна, анализ флюидов, пространственные данные скважин.
В дальнейшем бизнес-процессы сбора, хранения и обработки необходимо формализовать для каждого типа данных и определить одно ответственное лицо (SPA) для соответствующих бизнес-процессов, а также разработать требования к компетентности для отдельных ответственных лиц и инструмент для контроля качества данных (рис. 2).
к
ex
о о.
ф
Подготовительный этап

Организация
Создание орг. структуры, поддерживающей' выполнение процессов. Определение одного ответственного за все виды данных и за каждый вид данных
Подготовительный этап

Определение набора ключевых показателей и отчетности по процессу
Внесение изменений в функциональные обязанности (перераспределение, найм или вынесение функционала ) Разработка регламента взаимодействия подрядчиков и подрядчиков в разрезе видов данных
Окончательный этап
Итого определение 7 приоритетных* видов данных

Проф. компетенции
-
• Оценка наличия специалистов согласно разработанной орг. структуре.
-
• Определение набора требуемых компетенций специалистов

Инструменты
-
• Введение чек-листов ГИС на этапах контроля процесса, включая создание инструкции
-
• Использование ИТ- программ
Долгосрочный план УКИД и бизнес-кейс
-
• Анализ результатов внедрения процессов «как должно быть»
-
• Поддержка подготовки создания бизнес-кейса с оценкой влияния качества данных на добычу, а также долгосрочного плана развития
ф
-
■ Орг. структура и регламент взаимодействия по выбранным видам данных
-
• Внедренные чек-листы по ГИС
-
• Эффективно работающий процесс по выбранным типам данных
-
■ Орг. структура и регламент взаимодействия по выбранным видам данных
-
• Набор КПЗ и отчетность
-
• Эффективно работающий процесс по выбранным типам данных
-
- Орг. структура и регламент взаимодействия по выбранным видам данных. Набор КПЗ и отчетность
-
• Материалы для создания бизнес- ; кейса и долгосрочного бизнес-планр
Рис. 2. Этапы внедрения методики управления качеством данных Fig. 2. Stages of implementing data quality management techniques
Все релевантные факты должны быть известны
Должна быть сохранена действительная последовательность событий

Должно быть правильно указано время
КАЧЕСТВО ДАННЫХ
Г Данные должны соответствовать фактам, то есть должны быть истинными
Должна быть установлена относительная важность " данных*
Рис. 3. Архитектура целостности элементов качества данных Fig. 3. Data qquality element integrity architecture
Этот инструмент представляет собой контрольный список для отдельных ответственных лиц, который включает проверку пяти факторов. Эти факторы были определены как противоположность ошибок данных и недостатков данных.
Контрольный список для проверки качества данных показан на рис. 3. Один ответственный человек сравнивает полученные данные по пяти факторам. В результате аудита может оказаться, что отсутствует один или несколько факторов. В этом случае уточняются недостающие факторы. Только после прояснения каждого фактора единственное ответственное лицо имеет право передавать эти проверенные данные вышестоящему руководству для принятия деловых решений.
Методика управления качеством данных с применением цифровых двойниковв системах поддержки принятия решений в нефтегазовых компаниях
Использование умных скважин повысило точность прогноза дебита скважин на 15–20 % с учетом меняющихся условий добычи. Кроме того, виртуальное тестирование режимов работы скважин позволяет избежать экспериментов с реальными объектами. Это также позволяет специалистам создать несколько сценариев и выбрать лучший по заданным критериям. Вместе с тем в ряде случаев наблюдались серьезные ошибки прогнозов дебитов нефти и выбора режимов работы погружного оборудования. Эти ошибки увеличили эксплуатационные расходы и затраты на подъем, затраты на геологические и технические мероприятия, а также на ремонт и техническое обслуживание оборудования.
Анализ причин этих ошибок показал проблемы с качеством данных. Данные, которые не соответствуют хотя бы одному из пяти элементов качества данных, являются некондиционными, или мы можем сказать, что эти данные содержат минусы. Все это создало предпосылки для уточнения методики управления качеством данных применительно к цифровым аналогам и интеллектуальным полям с целью повышения эффективности поддержки принятия решений. В основе методики лежит следующая идея: качество анализа данных зависит от знания и понимания идеальной картины разработки месторождения, а также целевых показателей (например, по снижению темпов падения добычи). Это означает, что ответственный руководитель должен знать, как должна выглядеть сфера деятельности, в данном случае развитие сферы с рациональной и логической точки зрения [3–6].
Если это условие выполнено, то необходимо выполнить следующие два шага: анализ данных, анализ текущей ситуации.
В методологии управления качеством данных ситуация – это общая картина с определенным объемом данных [7, 8]. Данные – это факты, диаграммы, утверждения, решения, действия, описания, которые предлагаются как правильные [9, 10]. Минусы – это любые отдельные данные, которые предлагаются как верные, но оказываются нелогичными в результате их сравнения с 5 элементами. Плюсы – это достоверные данные, которые оказываются верными в результате сравнения их с теми же 5 элементами.

гаис гдис
Smart well 1-
Smartwell 1
Smart well N
Smart well 2
Smart well N
Выбор оптимальных показателей
21 (-) показатель с минусами в данных
5 факторов качества данных
49(+)показателей без минусов
Система сбора и хранения данных
Текущий профиль добычи
Целевой профиль _ добычи
Устранение минусов в 6-ти показателях ГДИС
Разработка корректирующих мероприятий для скважины 1 Smart well 1
Целевой профиль добычи восстановлен
' 3 (-) б (.)
Петрофизика
Сейсмика
Керн
Флюиды
Прост**, данные
5 (-) показателей с минусами в данных
Smart well 2’
4 (-) показателя с минусами в данных
Причины
Проверка этих мероприятий в Smart field гис
12 (-) показателей с минусами в данных
Smart well 1
мероприятий и их реализация
12 (-) показателей с минусами в данных
Шаг 2. Анализ ситуации
Шаг 1. Анализ данных
Нефтегазоносный пласт
Рис. 4. Ключевые этапы методологии управления качеством данных с применением факторов логико-семантического цифрового двойника Fig. 4. Key stages of the data quality management methodology using the factors of the logical-semantic digital twin
На первом этапе качество данных оценивается путем сравнения его с 5 элементами. В результате этого шага могут быть обнаружены данные, содержащие минусы, т. е. некачественные данные.
Анализ текущей ситуации на шаге два заключается в том, что данные с минусами сортируются по участкам месторождения или по компонентам скважины. Область с наибольшим количеством данных с минусами становится основной целью коррекции (рис. 4).
Ситуационный анализ относится к распределению данных с минусами по единицам целого [11]. В результате ситуационного анализа становится понятно, какой участок необходимо исправить и в чем причина недостижения запланированных показателей и целей [12]. Таким образом, созданная система поддержки принятия решений на первом этапе выдает ответственному специалисту по разработке месторождения список данных с минусами или ошибками. В результате реализации второго шага ответственное лицо информируется о проблемной зоне, которой соответствует наибольшее количество данных с минусами.
Ненадежные данные приводят к неправильным решениям и сводят на нет эффект от использования интеллектуальных систем, таких как интеллектуальный анализ данных, машинное обучение, прогнозная аналитика и т. д [13–15]. Управление качеством данных на основе применения логико-семантических цифровых двойников обеспечивает полезность цифровых данных. Ключевым фактором успеха цифровой трансформации компаний являются подходы, обеспечивающие качество корпоративных данных. Для этого компании внедряют новые бизнес-процессы, назначают ответственных людей и обучают персонал управлению качеством данных, поскольку надежность данных, их доступность и согласованность в различных ИТ-системах требуют комплексного подхода.
Список литературы Разработка методики управления качеством данных на основе логико-семантического цифрового двойника
- Антонов В.В., Куликов Г.Г. Семантико-математический язык описания структуры интеллектуальной системы на основе нечеткой логики // Программные продукты и системы. 2011. № 3. С. 33-35.
- Юсупова Н.И., Еникеева К.Р. Интеллектуальная информационная поддержка принятия решений при анализе рисков чрезвычайных ситуаций и управлении ими. М.: Машиностроение, 2014. 206 с.
- Миронов М.В., Головкин Ю.Б., Юсупова Н.И. Об алгоритмах управления по состоянии ситуации // Управление сложными техническими системами: межвуз. науч. сб. Уфа: УАИ, 1985. № 8. C. 107-111.
- Антонов В.В., Куликов Г.Г. Метод построения математической модели предметной области // Вестник Самарского государственного экономического университета. 2010. № 5 (67). С. 10-14.
- Подход к применению концепции цифровых двойников для трансформации корпоративной информационной системы под требования INDUSTRY 4.0 (на примере создания единого информационного пространства «вуз - предприятие») / Куликов Г.Г., Сапожников А.Ю., Кузнецов А.А. и др. // Вестник УГАТУ. 2019. Т. 23, № 4 (86). С. 154-160.
- Концепция системного представления предметной области при формировании цифрового двойника производственного процесса машиностроительного предприятия / А.В. Речкалов, А.В. Артюхов, Г.Г. Куликов, В.Н. Новиков // Вестник УГАТУ. 2022. Т. 26, № 1 (95). С. 120-135. DOI: 10.54708/19926502_2022_26195120
- Юсупова Н.И., Богданова Д.Р., Бойко М.В. Обработка слабоструктурированной информации на основе методов искусственного интеллекта. М.: Инновационное машиностроение, 2016. 256 с.
- ПНСТ 429-2020. Умное производство. Двойники цифровые производства. Часть 1. Общие положения. М.: Стандартинформ, 2020. 8 с.
- Никулина Н.О., Шилина М.А., Кондратьева О.В. Проектирование автоматизированных информационных систем управления процессами: учеб. пособие. Уфа: УГАТУ, 2018. 375 с.
- Методы и технологии проектирования программных средств для организации обработки данных / В В. Антонов, Г.Г. Куликов, М.А. Шилина и др. Уфа: УГАТУ, 2018. 219 с.
- Структурирование информационного пространства с использованием процессного подхода и семантической идентификации / Г.В. Старцев, М.А. Шилина, А.А. Бармин, О.В. Бармина // Экономика, статистика и информатика. Вестник УМО. 2014. № 3. С. 203-207.
- Основы концепции онтологического моделирования бизнес-процессов для задач принятия решений / К.А. Конев, В.В. Антонов, Д.А. Ризванов и др. // Современные наукоемкие технологии. 2020. № 12-1. С. 71-77. DOI: 10.17513/snt.38413
- Конев К.А. Принятие решений в сложных социально-экономических системах // Методы менеджмента качества. 2018. № 1. С. 30-36.
- Использование BI систем в оперативном управлении производством / Т.К. Гиндуллина, М.С. Демченко, В.Н. Капустин, А.Н. Гаффарова // 90 лет УГАТУ на службе науке, образованию и бизнесу: материалы Всерос. науч.-практ. конф. Уфа: УУНиТ, 2022. С. 21-23.
- Гелисханов И.З., Юдина Т.Н., Бабкин А.В. Цифровые платформы в экономике: сущность, модели, тенденции развития // Научно-технические ведомости СПбГПУ. Экономические науки. 2018. Т. 11, № 6. С. 22-36. DOI: 10.18721/JE.11602