Об одном методе восстановления пропущенных значений потокового временного ряда в режиме реального времени
Автор: Цымблер Михаил Леонидович, Полонский Вячеслав Александрович, Юртин Алексей Артемьевич
Статья в выпуске: 4 т.10, 2021 года.
Бесплатный доступ
Проблема восстановления пропущенных значений потокового временного ряда в режиме реального времени возникает в широком спектре практических приложений цифровой индустрии и интернета вещей.В статье предложен новый метод восстановления на основе совместного применения технологий интеллектуального анализа временных рядов и искусственных нейронных сетей. Метод предполагает три этапавосстановления: предварительная обработка данных, распознавание и реконструкция. Предварительнаяобработка предполагает однократную предварительную подготовку обучающих выборок данных. Распознавание и реконструкция реализуются с помощью нейронных сетей, обучаемых на указанных выборках. Предварительной обработке подвергается заранее сохраненный фрагмент потокового временного ряда безпропусков, в котором выполняется поиск набора типичных подпоследовательностей (сниппетов). Распознавание реализуется с помощью сверточной нейронной сети, на вход которой подается вектор из элементоввременного ряда, предшествующих пропуску. Распознаватель выдает сниппет, на который более всего похожа входная подпоследовательность. Реконструкция реализуется с помощью рекуррентной нейронной сети,на вход которой подается конкатенация вывода распознавателя и вектора элементов ряда, предшествующих пропуску. Реконструктор выдает восстановленное значение. Представлены результаты экспериментов,показывающих высокую точность восстановления и преимущество предложенного метода перед аналогами. Ключевые слова: временной ряд, восстановление пропущенных значений, режим реального времени, сверточная нейронная сеть, рекуррентная нейронная сеть, типичные подпоследовательности.
Временной ряд, восстановление пропущенных значений, режим реального времени, сверточная нейронная сеть, рекуррентная нейронная сеть, типичные подпоследовательности
Короткий адрес: https://sciup.org/147235840
IDR: 147235840 | УДК: 004.032.26, | DOI: 10.14529/cmse210401
On one method of imputation missing values of a streaming time series in real time
The problem of the imputation of missing values in a streaming time series arises in a wide range of Industry 4.0 and Internet of Things applications. In the article, we propose a novel imputation method based on timeseries mining techniques and artificial neural networks. The method involves three steps of imputation: datapreprocessing, recognition, and reconstruction. Preprocessing is a one-time preparation of training data samples.Recognition and reconstruction are implemented through two neural networks trained on the samples above.Preprocessing supposes the discovery of a set of typical subsequences (snippets) in a pre-stored fragment of thestreaming time series without misses. Recognition is implemented through a Convolutional Neural Network, andits input is a vector of the elements preceding the current (missing) value. The Recognizer outputs the snippet thatthe input subsequence is most similar to. Reconstruction is implemented through a Recurrent Neural Network,and its input is a concatenation of the Recognizer’s output and the vector of the elements preceding the missingvalue. The Reconstructor outputs the value to be imputed. The experimental results show high accuracy and theadvantage of the proposed method over analogs.