Анализ данных мониторинга электропотребления и выявление сверхпотребления электроэнергии на основе предлагаемого алгоритма

Автор: Е. В. Пупкова, А. С. Дулесов, Н. В. Дулесова

Журнал: Современные инновации, системы и технологии.

Рубрика: Управление, вычислительная техника и информатика

Статья в выпуске: 4 (2), 2024 года.

Бесплатный доступ

Предложен алгоритм выявления сверхпотребления электрической энергии в электросетях низкого напряжения. В основе исследования лежит системный подход, основанный на комплексе методов интеллектуального сбора и обработки информации. Для извлечения, сжатия, выборки, анализа и представления данных использована технология Data Mining. Методом экспертных оценок определены основополагающие критерии влияния на исследуемый процесс. Выполнена обработка массива данных путем деления их на кластеры. Предложен анализ исследуемого процесса методом дерева принятия решений, на базе статистического пакета IBM SPSS Statistics. В ходе проделанной работы из большого массива данных извлечены элементы, отвечающих установленным критериям отбора. Получен алгоритм, применимый для анализа поведенческого потребления электроэнергии, позволяющий отслеживать количественные и качественные показатели сверхпотребления электроэнергии, в процессе производственной деятельности исследуемого объекта, на выбранном временном интервале. Применение данного алгоритма позволило оптимизировать процесс решения проблемы неконтролируемого использование энергоресурсов путем выявления незаконной предпринимательской деятельности, в частности майнинга криптовалюты.

Еще

Сверхпотребление электроэнергии, анализ данных, технология Data Mining, обработка информации, кластерный анализ, дерево решений

Короткий адрес: https://sciup.org/14129635

IDR: 14129635   |   DOI: 10.47813/2782-2818-2024-4-2-0280-0290

Текст статьи Анализ данных мониторинга электропотребления и выявление сверхпотребления электроэнергии на основе предлагаемого алгоритма

DOI:

В современных реалиях, превышение фактического потребления электроэнергии над плановым является проблемой, негативно отражающейся на энергобезопасности как страны в целом, так и Республики Хакасия, в частности. Аномальное электропотребление создает перегрузку сетей и дефицит мощностей. Основной причиной сверхпотребления электроэнергии является использование бытовых мощностей в промышленных целях. А именно, рост майнинга криптовалюты в регионе

  • [1]. Кроме того, неконтролируемое использование энергоресурсов майнерами приводит к снижению качества и надежности электроснабжения потребителей электроэнергии.

Майнинг получил свое наибольшее распространение в регионах с низким тарифом на электроэнергию. По данным Федеральной службы государственной статистики по регионам России на 1 января 2024 года тарифы на электрическую энергию для населения и приравненных к ним группам, в Республике Хакасия являются одними из самых низких по стране (после Иркутской области) [2]. Данный факт определяет благоприятные условия для незаконной предпринимательской деятельности, в лице теневых майнеров. Как следствие присутствует угроза работоспособности энергосистемы региона.

В настоящее время энергетиками разрабатывается множество методов борьбы с незаконным использованием энергоресурсов. В правовом аспекте лежит незаконный майнинг и расценивается как хищение электроэнергии [3]. В связи с этим большая доля используемых методов имеет технический характер борьбы с несанкционированным потреблением электрической энергии.

Для эффективного решения сложившейся ситуации, одновременно с техническими рекомендуется использование организационных мероприятий, основанных на интеллектуальном сборе и обработке информации [4]. Исходя из актуальности проблемы, в статье предлагается алгоритм выявления сверхпотребления, в основе которого представлен системный подход, базирующийся на применении комплекса методов принятия решений и анализе поведенческого потребления электроэнергии.

ПОСТАНОВКА ЗАДАЧИ

Поскольку, на территории Республики Хакасия наблюдается острый дефицит мощности электрической энергии, в качестве исследуемого процесса, рассматривается превышение фактического электропотребления над плановым. В качестве исследуемого объекта определена одна из сетевых организаций, ведущих свою деятельность на территории региона. Основной причиной поставленной проблемы, по мнению экспертов, определен рост теневого майнинга в сетях низкого напряжения. В связи с этим ключевой задачей является выявления сверхпотребления электроэнергии из большого массива данных, полученного путем мониторинга производственного процесса данной организации.

ПОДГОТОВКА ДАННЫХ

Для решения поставленной задачи, отобрана необходимая информация из массива базы данных, содержащей данные о потребителях электрической энергии, электроснабжение токоприемников которых осуществляется от сетей определенной организации. Данная форма хранения информации содержит необходимые количественные и качественные характеристики потребителей в скрытом виде. Для их извлечения и представления в удобном виде используем технологию Data Mining, которая описывается множеством методов нахождения новых знаний [5,6].

Для первичной обработки данных использовался метод экспертных оценок. Для этого выделены некоторые факторы, влияющие на процесс, связанный с электропотреблением. В таблице 1 представлена оценка исследуемого явления, посредством обобщенного мнения задействованных экспертов по изучаемой проблеме.

Таблица 1. Экспертная оценка.

Table 1. Expert assessment.

Показатель                    Экспертная оценка значимости (влияния)

1 2 3 Средняя оценка Превышение среднестатистический объем потребления электроэнергии (1) 10 9 10 9,7 29 12,5 156,25 Отсутствие данных о количестве зарегистрированных лиц (2) 6 5 6 5,7 17 0,5 0,25 Наличие/отсутствие прибора учета (3) 9 8 7 8,0 24 7,5 56,25 Вид расчетного тарифа (4) 2 3 3 2,7 8 -8,5 72,25 Наличие/отсутствие АСКУЭ (5) 3 4 4 3,7 11 -5,5 30,25 Наличие/отсутствие сбора данных с прибора учета за последние 2 месяца (6) 7 7 5 6,3 19 2,5 6,25 Увеличение объема потребления 5 6 8 6,3 19 2,5 6,25 электроэнергии относительно предыдущего месяца (7)

Современные инновации, системы и технологии // (cc) ® 2024; 4(2) Modern Innovations, Systems and Technologies

Увеличение объема потребления

8

10

9

9,0

27

10,5

110,25

электроэнергии относительно аналогичного периода (8) Сезон года (9)

1

1

2

1,3

4

-12,5

156,25

Вид объекта собственности (10)

4

2

1

2,3

7

-9,5

90,25

Для оценки согласованности мнения экспертов, определим коэффициент конкордации. Данная величина лежит в пределах от 0 (при полном отсутствии согласованности) до 1 (при абсолютном единогласии экспертов) [7].

W =

12 S m 2 ( n 3 - n )

где m – число экспертов, S – сумма квадратов отклонений, сумм рангов, присвоенных каждому показателю, от средней суммы рангов.

Исходя из того, что вычисленный коэффициент составил 0,92 (0 < 0,92 < 1) , можно считать, что мнения экспертов относительно критериев, определяющих дальнейший анализ, согласованы.

По согласованному мнению экспертов, наибольшее влияние при выявлении сверхпотребления, оказывают факторы представленные на рисунке 1. При этом, ключевым является показатель превышения среднестатистического объема потребления электроэнергии.

Рисунок 1. Основные факторы, влияющие на процесс выявления сверхпотребления.

Figure 1. The main factors influencing the process of detecting overconsumption.

Рассматривая вопрос об анализе большого объема данных, требуется придать ему более упорядоченную форму. Воспользуемся разбиением данных на кластеры [8]. Посредством фильтрации, выполняется разделение исходного множества на группы, в которых элементы обладают схожими свойствами. В результате кластеризации получаем значительно меньшее число элементов (до кластеризации – 5528 ед., после – 1080 ед.), что поддерживает задачу анализа количественных и качественных характеристик исследуемого процесса.

РЕЗУЛЬТАТЫ АНАЛИЗА ДАННЫХ

Применение интеллектуального анализа данных опирается на множество методов и алгоритмов. В условиях неопределенности, цель анализа – выполнение сжатия данных, с наименьшими потерями заложенной в них информации [9].

Выполнив выборку элементов и определив переменные для анализа, используем метод, основанный на дереве решений (на базе статистического пакета IBM SPSS Statistics) [10]. В качестве зависимой переменной определен показатель, оказывающий наибольшее влияние на исследуемый процесс – превышение среднестатистического объема потребления электроэнергии (рис.2). Остальные показатели по результатам выборки являются предикторами.

Отсутствие сбора данных с прибора квадрат-163.384, ст.св.-1

Рисунок 2. Дерево классификаций.

Figure 2. Classification tree

В результате установлена связь между зависимой переменной и предикторами. Из пяти независимых переменных дерево включило в модель – четыре. Таким образом, существует возможность ранжирования переменных по степени полезности. Анализ взаимосвязей между значениями исследуемых переменных представлен в таблицах 2-4.

Таблица 2. Выигрыши для узлов.

Table 2. Winnings for nodes.

Узел

По узлам

Узел                 Выигрыш          Отклик    Индекс

N      Проценты      N      Проценты

6

5

3

1

287        26,6%        108        76,6%       37,6%      288,2%

213         19,7%         32         22,7%       15,0%      115,1%

513         47,5%          1          0,7%        0,2%        1,5%

67         6,2%          0          0,0%        0,0%       0,0%

Таблица 3. Выигрыши для процентилей.

Table 3. Winnings for percentiles.

Процентиль

Узлы

N

Выигрыш

Отклик

Индекс

N

Проценты

10

6

108

41

28,8%

37,6%

288,2%

20

6

216

81

57,6%

37,6%

288,2%

30

6; 5

324

114

80,5%

35,0%

268,5%

40

5

432

130

92,0%

30,0%

230,1%

50

5; 3

540

140

99,3%

25,9%

198,7%

60

3

648

140

99,5%

21,6%

165,8%

70

3

756

140

99,6%

18,6%

142,3%

80

3

864

141

99,8%

16,3%

124,7%

90

3

972

141

99,9%

14,5%

111,0%

100

3; 1

1080

141

100,0%

13,1%

100,0%

Таблица 4. Риск.

Table 4. Risk.

Оценка

Среднеквадратическая Ошибка

0,131

0,010

Из таблиц 2-3 видно, что узел 6 является наиболее информативным. Из колонки

«отклик» следует, что 37,6 % наблюдений из данного узла относятся к целевой категории. Индекс показывает, что в узле 6 ожидается найти более чем в 2,5 раза больше наблюдений, относящихся к категории «превышение среднестатистического объема потребления электроэнергии». Оценка классификации (таблица 4) позволяет определить доверительный интервал ошибки классификации. Он находится в пределах от 11,14 % до 15,06%, что говорит о достаточно высокой оценке прогностической точности дерева. Проверка модели на адекватность показала, что узлы с выигрышными результатами по обучающей и контрольной выборке имеют незначительные отличия. Дерево является общим и устойчивым. Модель прошла проверку и будет хорошо работать в актуализированных выборках.

Таким образом, на выходе выполненной работы из массива данных объемом 5528 единиц остается 208 элементов, отвечающих принятым критериям.

Декодировав результаты анализа, получаем перечень потенциальных потребителей электроэнергии, использующих бытовые мощности в промышленных целях, посредством майнинга криптовалюты.

ЗАКЛЮЧЕНИЕ

В результате интеллектуальной обработки и анализа массива данных, путем комбинирования методов экспертных оценок, кластеризации и дерева принятия решений, получен алгоритм выявления сверхпотребления электрической энергии.

Рисунок 3. Алгоритм выявления сверхпотребления электроэнергии.

Figure 3. Model for identifying excess electricity consumption.

Применение данного алгоритма в процессе эксплуатации электрических сетей низкого напряжения позволяет оптимизировать процесс решения задачи неконтролируемого использование энергоресурсов, путем выявления незаконной предпринимательской деятельности, в частности майнинга криптовалюты. Сопоставляя между собой определяющие показатели сверхпотребления, можно оценить степень вероятности присутствия следов майнинговой деятельности как в исследуемой системе в целом, так и каждого из ее элементов, на выбранном временном интервале. Основным направлением для дальнейших исследований планируется расширение функциональных возможностей алгоритма, путем определения новых факторов влияния на исследуемый процесс, а также усовершенствование его структуры с целью прогнозирования поведенческого потребления электроэнергии.

Статья