Сравнительная характеристика основных форматов записи и хранения ЭКГ

Бесплатный доступ

В настоящий момент времени активно создаются нейросетевые модели, способные находить патологии сердечной мышцы человека на электрокардиограмме. Для обучения таких нейросетевых продуктов требуются большие массивы данных. В следствии этого возникает потребность в нахождении наиболее подходящего формата ЭКГ. Для записи и хранения электрокардиограмм в Российской Федерации и за рубежом используются такие форматы данных как CSV, XML, EDF, WFDB, .MAT, SCP-ECG, ZQECG. Целью данной статьи является нахождения наиболее подходящего электронного формата ЭКГ, для последующего обучения нейросетевых моделей. Задача исследования заключается в анализе и последующем сравнении актуальных электронных форматов ЭКГ. Анализ форматов, позволил получить следующие результаты. CSV способен хранить в себе информацию о амплитуде сигнала по каждому из 12 стандартных отведений, но не имеет технической возможности сохранять в себе метаданные и аннотации. EDF и XML, уже имеет в себе эту возможность, но формат EDF выглядит более предпочтительным вариантом, в силу его простаты и большей распространённости на территории нашей страны. Форматы WFDB и .MAT имеют те же технические возможности для хранения данных, как у EDF и XML, но являются сугубо научными, в силу истории происхождения и невозможности большинства электрокардиографов, записывать ЭКГ, в данных форматах. SCP-ECG является стандартным протоколом хранения электрокардиограммы, как в Российской Федерации, так и за рубежом. Так же он способен хранить, всю необходимую информацию для анализа ЭКГ врачом кардиологом. ZQECG является прямым конкурентом SCP-ECG, но из-за своей нераспространённости и существенных различий в своей файловой структуре, в различных версиях этого формата, не является его заменой. Вследствие этого можно сделать вывод EDF и SCP-ECG является наиболее подходящими форматами.

Еще

Цифровая электрокардиограмма, электрокардиограмма, формат данных, сравнение форматов, анализ форматов.

Короткий адрес: https://sciup.org/14135117

IDR: 14135117   |   DOI: 10.47813/2782-5280-2026-5-1-4001-4008

Текст статьи Сравнительная характеристика основных форматов записи и хранения ЭКГ

DOI:

В современном мире электрокардиография (ЭКГ), является одним из основных методов диагностики сердечно-сосудистых патологий (ССЗ) [1]. Аппараты способные производить данный вид исследования сердечно- сосудистой системы имеют широкое распространение в мире. Они имеются в каждой поликлинике, фельдшерском пункте, автомобиле скорой медицинской помощи, а также во всех стационарных учреждениях. Данный вид исследования получил такое широкое распространение вследствие его дешевизны и простоты интерпретации. ССЗ занимают первое место в мире по причине смертности.

Электрокардиография – это метод функционального исследования сердца, основанный на графической регистрации изменений во времени разности потенциалов его электрического поля (биопотенциалов). Появление возбуждения в мышечных волокнах сердца обусловлено изменением физикохимических свойств мембран кардиомиоцитов и ионного состава внутри- и внеклеточной жидкости, существенно различающихся по своему составу в различные фазы сердечного цикла. В настоящий момент является одним из наиболее современных и информативных методов диагностики. К преимуществам электрокардиограммы относиться, дешевизна оборудования, доступность, широкий спектр диагностируемых патологий. К недостаткам можно отнести необходимость дополнительного оборудования для более точной диагностики некоторых патологий.

В данный момент времени, стали появляться информационные системы, способные находить на ЭКГ патологии сердечной мышцы человека. Часто они содержат в своей структуре нейросетевые компоненты, с помощью которых определяется форма зубцов электрокардиограммы. Для обучения таких нейросетей, требуются большие массива ЭКГ, записанных в электронном формате. Отсюда возникает проблема исследования, заключающаяся в нахождении наиболее распространённого в практической медицине, и удобного для работы формата электрокардиограмм.

Рисунок 1. Основные комплексы и интервалы во втором стандартом отведении ЭКГ.

Figure 1. The main complexes and intervals in the second standard ECG lead.

Обычно на ЭКГ можно выделить 5 зубцов: P, Q, R, S, T. Зубец P отображает процесс деполяризации (возбуждение и сокращение) миокарда предсердий, комплекс QRS — деполяризации желудочков (возбуждение и сокращение), сегмент ST и зубец T отражают процессы реполяризации (расслабления) миокарда желудочков и предсердий (рис. 1).

МАТЕРИАЛЫ И МЕТОДЫ

Материалами данного исследования являлись электронные форматы ЭКГ CSV, XML, EDF, WFDB, .MAT, SCP-ECG, ZQECG.

В исследование использовались методы информационного анализа сложных систем, статистического исследования.

Метод информационного анализа сложных систем использовался, для анализа цифровых форматов электрокардиограмм. Было изучено как форматы CSV, XML, EDF, SCP-ECG, ZQECG, хранят в себе информацию о сигналах, метаданных пациентов, общем принципе устройства файла каждого формата, а также удобстве использования рядовым пользователем.

Также этот метод применялся для анализа возможностей современного нейросетевого программного обеспечения, созданного для анализа ЭКГ. Анализ показал, что для подобного ПО, входными данными являются электрокардиограммы в форматах WFDB, .MAT [2, 3].

Метод статистического исследования применялся к электронным форматам электрокардиограмм, было установлено какие форматы наиболее распространены в мире и Российской Федерации, количество баз данных по каждому формату.

РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ

Рассмотрим форматы представления данных ЭКГ и проведем их сравнительную характеристику.

Одними из основных форматов используемых для хранения данных ЭКГ, считаются CSV, XML, EDF, SCP-ECG, ZQECG.

Рисунок 2. Пример файла формата CSV открытого в Microsoft Excel. Figure 2.

An example of a CSV file opened in Microsoft Excel.

Формат CSV (Comma Separated Values, значения, разделённые запятыми) – текстовый формат, который содержит табличные данные, разделённые запятыми. Электрокардиограф ведет запись ЭКГ, в реальном времени, следовательно каждая строка в CSV, содержит индекс (он указывает на место этой строки, ’’по времени’’, среди других строк) этой строки, а также значение амплитуды сигналов в различных

Microsoft Excel а также в программном

отведениях. Так же можно сказать, что в первом столбце этой таблицы всегда записан индекс, в последующих значения амплитуды в отведениях I, II, III, aVR, aVL, aVF, V1, V2, V3, V4, V5, V6 (рис.2).

К преимуществам данного формата можно отнести:

  •    Его простота для понимания.

  •    Возможность открытия его в или Google Таблицах, специализированном обеспечении (ПО).

К недостаткам относятся:

  •    Невозможность хранения таких метаданных как пол, возраст.

  •    Также нет возможности добавления к записи меток, где начало R-пика и комплекса QRS , диагноза.

Формат EDF (European Data Format) — это один из     основных     стандартов     хранения физиологических сигналов (включая ЭКГ). Данный формат был представлен в 1992 году. В отличие от CSV (только таблица чисел), EDF — бинарный контейнер с метаданными и сигналами, что делает его удобным, чем CSV, для медицинской и научной деятельности. Также каждый канал имеет свою частоту дискретизации и единицы измерения [4] (рис.3).

Метаданные в этом формате содержат общую информацию (идентификатор пациента, пол, возраст и др.) и технические характеристики каждого сигнала (калибровка, частота дискретизации, фильтрация и т. д.), закодированные в виде символов ASCII. Записи сигналов содержат выборки 16-битные целые числа.

В 2003 году был представлен формат EDF+. Его отличия от предшественника заключаться в том, что может хранить аннотации (например, R -пики, артефакты, начало аритмии). Аннотации представляет собой специальный канал с текстовым сообщением. А также тем, что новая версия поддерживает прерывания записи (например, запись 10 с, пауза, ещё 20 с).

Рисунок 3. Пример электрокардиограммы, записанной в формате EDF.

Figure 3. Example of an electrocardiogram recorded in EDF format.

Несомненными достоинствами EDF являться:

  •    Распространенность.    Многие    модели

электрокардиографов     в     Российской

Федерации (РФ), способны записывать электрокардиограммы, в этом формате.

  •    Так же несомненным преимуществом является возможность хранения метаданных и аннотаций. Что существенно облегчает жизнь врачам кардиологам, а также позволяет, накапливать ЭКГ в базах данных.

Как таковые существенные недостатки у формата отсутствуют.

XML    ( e X tensible M arkup L anguage    или

«расширяемый язык разметки»)- это текстовый формат, где данные хранятся в виде тегов. В области здравоохранения этот формат используется для передачи ЭКГ между больницами,     поликлиниками,     научно исследовательскими институтами, различным медицинским оборудованием.

Запись ЭКГ в формате XML состоит из трех блоков:

  •    Метаданные (ФИО пациента, модель прибора, дата и время записи, его пол, уникальный id ЭКГ и т.д.).

  •    Сигнал (числовые данные, отображающие записанный сигнал ЭКГ,  в различных

отведениях, движущийся по прямоугольной системе координат осей X и   Y, закодированный в Base64).

  •    Аннотации (метки — где R-пик, начало QRS, диагноз).

К плюсам XML можно отнести:

  •    Возможность хранения полного пакета информации (Метаданные, аннотации, сигнал).

К минусам данного формата:

  •    Менее понятен для врача кардиолога, из-за своего синтаксиса.

  •    Не так массово распространён в РФ, от отличия от EDF.

Так же существуют форматы WFDB и .MAT. Они так же используются для хранения электрокардиограммы, но в отличии от форматов CSV, XML, EDF, данные форматы создавались для кардиологических исследований.

Waveform Database (WFDB), формат хранения биомедицинских данных, использующийся в медицинских и научных целях, разработанный в Массачусетском технологическом институте (MIT) Джорджем Б. Муди в 1989 году [5].

Этот формат представляет собой совокупность файлов, которые вместе описывают сигнал ЭКГ и его метаданные. Можно выделить следующие типы файлов:

  •    Signal file (.dat) – в нем содержаться бинарные данные сигналов.

  •    Header file (.hea) – содержит текстовое описание сигналов, частоту дискретизации, формат, калибровка, название каналов и т.д.

  •    Annotation file (.atr, .qrs, .ari и др) - Содержит аннотации, например временные метки событий, метки сердечных сокращений, артефактов, аритмий и т.д.

У этого формата хранения данных можно выделить как преимущества, так и недостатки.

К преимуществам можно отнести:

  •    Формат     имеет     открытый     и

  • документированный стандарт.
  •    Поддерживает синхронные многоканальные сигналы.

  •    Позволяет хранить аннотации и метаданные отдельно.

  •    Поддерживается множеством библиотек и инструментов (Python, MATLAB, C, Java).

К недостаткам:

  •    Не всегда удобен для ручного редактирования (особенно .dat).

  • Формат кодирования 12-битных данных

может быть непривычен пользователю.

  • •   Нет встроенного сжатия (только внешние

решения).

  •    Чтение данного формата возможно, только через специальные библиотеки, так как формат создавался для научных изысканий.

.MAT - это контейнер данных, представляющий бинарный формат файлов, используемый в программе MATLAB. Разработан компанией The MathWorks. Его часто используют для хранения электрокардиограмм, но преимущественно он создавался не для этого [6].

Многие базы данные ЭКГ, представлены в этом формате, в частности в PTB Diagnostic ECG Database , MIT-BIH Arrhythmia Database . Данный формат удобен тем, что его можно открыть не только в специализированном программном обеспечении от компании разработчика, но и с помощь специализированных библиотек на языке программирования Python.

Как и все вышеперечисленные форматы данных, .MAT способен хранить в себе сигнал записанной в виде числовой последовательности, метаданные, частоту дискредитации.

Контейнер данных .MAT представляет собой матрицу. Где строки обозначают отведения, содержащие последовательности чисел, а столбцы временные отчеты.

У формата .MAT, можно выделить следующие преимущества:

  •    Универсальный - хранит сигнал, аннотации, частоту, время, всё в одном файле.

  •    Поддерживается MATLAB, Octave, Python.

  •    Может хранить многоканальные и многомерные данные.

  •    Легко добавляются метаданные (структуры, cell-массивы, словари).

А также недостатки:

  •    Не существует специально адаптированной версии для хранения электрокардиограммы (формат в разных базах немного разный).

  •    Большие файлы (особенно v7.3 — HDF5)

занимают много места.

SCP-ECG (Standard Communications Protocol for Computer-assisted Electrocardiography) – это международный формат записи и хранения электрокардиограммы. Согласно ГОСТ Р ИСО 11073-91064-2017    является    стандартным протоколом для хранения и передачи информации, между средствами записи и компьютерными устройствами в Российской Федерации. Данный формат представляет собой файл или же, другими словами, бинарный контейнер, содержащий в себе основную информацию о записанной электрокардиограмме [7]. Файл SCP-ECG в своей структуре имеет следующие секции или разделы:

  •    Section 0 (Секция 0) выполняет функцию оглавления, она хранит в себе информацию о наличии или отсутствии секций в файле (к примеру секции под номерами 4,7,8 могут отсутствовать), а так же их ID, с какого байта они начинаться ( секции в SCP-ECG могут идти не по порядку, 1 и 5 секция могут быть поменяны местами), и их длину измеряемую в байтах.

  •    Section 1 (Секция 1) хранит в себе такую информацию о пациенте как зашифрованное ФИО, его ID, дату рождения, пол, рост, вес, дату и время записи электрокардиограммы.

  •    Section 2 (Секция 2) несет в себе информацию о электрокардиографе, с помощью которого, было снята ЭКГ. Название модели, производителе, серийном номере, частоте дискредитации, усилении, калибровке.

  •    Section 3 (Секция 3) содержит данные об отведениях ЭКГ. В частности, о количестве

каналов, их порядке, какие из 12 стандартных отведений использовались, использовались ли дополнительные отведения, масштабе.

  •    Section 4 (Секция 4) хранит данные о кардиологических             комплексах,

обнаруженных аппаратом записи, их временной позиции и длительности.

  •    Section 5 (Секция 5) данная секция хранит данные    о    ритме,    установленном

электрокардиографом.

  •    Section 6 (Секция 6) несет в себе информацию о амплитуде кардиологических комплексов, зубцов и данные о найденной электрической оси сердца (ЭОС).

  •    Section 7    (Секция      7)      содержит

предварительный предполагаемый диагноз, выставленный электрокардиографом. Этой функцией обладают не все аппараты записи ЭКГ, поэтому данная секция может отсутствовать в некоторых файлах формата SCP-ECG.

  •    Section 8 (Секция 8) служит хранилищем необработанных сигналов ЭКГ. Обычно они храниться в виде 16-битных чисел.

Преимуществами SCP-ECG являются;

  •    Способен хранить все необходимые данные для последующего анализа ленты ЭКГ, врачом кардиологом.

  •    Признан стандартным протоколом в Российской Федерации, а также на международном уровне.

  •    Компактен, относительно аналогов.

  •    Подходит для архивов и телемедицины.

К недостаткам SCP-ECG относят;

  • •   Из-за бинарной структуры файла, могут

возникать сложности с его отладкой.

ZQECG – формат хранения и записи электрокардиограммы, разработанной Китайской компанией ZQ. Разрабатывался как аналог SCP-ECG, имеет тот же функционал, и похожую структуру. ZQECG так же, как и SCP-ECG имеет бинарную структуру, но в отличии от него не признан международным стандартом. Компания разработчик исползает его в своих аппаратах записи ЭКГ и холтер-мониторах.

Основные отличия ZQECG от SCP-ECG:

  •    Китайский аналог имеет линейную структуру записанных в файле данных, в нем

отсутствует аналог Section 0, и вследствие этого Section, располагаться всегда в одном порядке. Если этот порядок будет нарушен, то программное обеспечение компании разработчика, не сможет прочесть файл.

  •    В записанную электрокардиограмму в виде файла SCP-ECG можно добавлять самостоятельно дополнительные Section, а в ZQECG такая возможность отсутствует.

  •    Различные    версии   ZQECG,    могут

существенно отличаться в плане внутреннего устройства и способах записи диагнозов, сигналов. SCP-ECG всегда стандартен.

  •    SCP-ECG    международный    стандарт,

вследствие этого, широкий перечень программных     продуктов,     способен распознавать этот формат.  ZQECG не является    международным    форматом, открывается только ПО разработчика или его партнеров.

Отсюда вытекают существенные недостатки ZQECG как формата для обучения нейросетевых продуктов:

  •    Отсутствие масштабных баз данных.

  •    Будущие проблемы с дообучением нейросетей, из-за малого количества электрокардиографов, поддерживающих его, а также вследствие существенных различий в структуре файлов разных версий.

Формат CSV не имеет техническую возможность хранить метаданные и аннотации, но способен содержать информацию о амплитуде сигналов по каждому из 12 стандартных отведений. EDF и XML, являются более совершенными форматами, в их файловой структуре предусмотрено место для хранения аннотаций и метаданных, также они как CSV способны хранить информацию о амплитуде сигналов. WFDB и .MAT, имеют техническую возможность хранить тот же перечень данных о электрокардиограмме, что и EDF и XML, но не поддерживаться большинством электрокардиографов. Формат SCP-ECG способен хранить всю необходимою информацию о ЭКГ, согласно ГОСТ Р ИСО 11073-91064-2017 и является стандартным протоколом хранения электрокардиограмм в Российской Федерации. ZQECG - это азиатский аналог SCP-ECG, имеющий те же технические возможности, к его основным недостаткам относят низкую распространённость в

Российской Федерации, и существенные различия в файловой структуре разных версий.

ЗАКЛЮЧЕНИЕ

Одним из способов решения проблемы распознавания зубцов P, Q, R, S, T на ЭКГ, являются методы искусственного интеллекта, а именно их выявление с помощью нейросетей. Наиболее походящими форматами для их обучения являются EDF и SCP-ECG, потому что EDF имеет техническую возможность хранить метаданные, диагнозы, данные о начале и конце зубцов и интервалов. Так же этот формат является одним из самых распространённых на территории Российской Федерации.

SCP-ECG – это международный стандарт электронной электрокардиограммы, являющийся также стандартным протоколом и в РФ. Имеет техническую возможность хранить в себе всю необходимую информацию, необходимую для последующего выставления диагноза врачом кардиологом. Стандартен и потому возможно создание больших баз данных.