Расчет временных характеристик системы массового обслуживания с процессами расщепления и слияния заявок и разогревом
Автор: Хабаров Роман Сергеевич, Лохвицкий Владимир Александрович, Корчагин Павел Викторович
Рубрика: Математическое моделирование
Статья в выпуске: 2, 2021 года.
Бесплатный доступ
Представлена модель и алгоритм расчета начальных моментов времени пребывания в системе массового обслуживания с процессами расщепления и слияния заявок и «разогревом». Предложенный подход позволяет оценить оперативность проектируемых систем распределенной обработки данных, функционирующих в реальном масштабе времени, с учетом временных задержек на прием информации с приемлемой для практических целей точностью.
Распределенная обработка в реальном масштабе времени, теория очередей, система массового обслуживания, процессы расщепления и слияния заявок, обслуживание с «разогревом»
Короткий адрес: https://sciup.org/148321626
IDR: 148321626 | DOI: 10.25586/RNU.V9187.21.02.P.010
Текст научной статьи Расчет временных характеристик системы массового обслуживания с процессами расщепления и слияния заявок и разогревом
В последние годы все большее распространение получают технологии распределенной обработки данных в реальном масштабе времени. Примером применения такой технологии в сфере обработки данных дистанционного зондирования Земли (ДЗЗ) является создание единой территориально распределенной системы (ЕТРИС) ДЗЗ. Эта система позволяет перейти к распределенной обработке данных со всех типов космических аппаратов (КА) ДЗЗ с использованием универсальных комплексов приема информации [5]. Данные подходы предполагается реализовать с помощью создания унифицированных программных комплексов распределенной обработки, хранения и распространения данных ДЗЗ, функционирующих на вычислительных кластерах пунктов приема информации или в центрах обработки данных.
Текущими проблемными вопросами дальнейшего развития технологии распределенной обработки данных являются увеличение объема обрабатываемых данных и недостаточная пропускная способность каналов передачи.
Например, в сфере обработки информации с КА ДЗЗ увеличение объема данных наблюдения вызвано повышением пространственного разрешения космических снимков
Расчет временных характеристик системы массового обслуживания ...
с--------------------------------------------------------------------------------------------------------------
Хабаров Роман Сергеевич начальник лаборатории военного института (научно-исследовательского) Военнокосмической академии им. А.Ф. Можайского. Сфера научных интересов: исследование операций, теория очередей, машинное обучение. Автор 11 опубликованных научных работ.
и использованием многоспектральной и гиперспектральной съемки. Существует практическая необходимость обработки и интерпретации таких данных в реальном масштабе времени, например при космическом мониторинге чрезвычайных ситуаций [7]. В связи с этим остро встает проблема оперативной передачи гиперспектральных данных по радиоканалам с ограниченной пропускной способностью. Существенную роль приобретает соотношение между информационной производительностью аппаратуры ДЗЗ и пропускной способностью используемых радиоканалов передачи информации [4].
Анализ оценок информационной производительности современных КА ДЗЗ с гиперспектральной съемкой показывает, что передача видеоданных с КА на наземные пункты приема информации в масштабе времени, близком к реальному, требует обеспечения скорости передачи информации в сотни мегабит – единицы гигабит в секунду. В существующих и перспективных спутниковых системах передачи видеоданных с КА ДЗЗ скорости передачи информации составляют сотни мегабит в секунду. Однако эти возможности систем передачи информации уже сейчас не согласуются с информационными возможностями многих гиперспектральных систем ДЗЗ, в перспективе это рассогласование будет только усиливаться [4].
В связи со сложившейся ситуацией все большую актуальность приобретают вопросы оценивания оперативности проектируемых систем распределенной обработки данных, функционирующих в реальном масштабе времени, с учетом временных задержек на прием информации. Особую сложность представляет тот факт, что оценка оперативности таких систем в виде среднего времени обработки, как правило, является недостаточной, и требуется получить оценку вероятности превышения (непревышения) директивно заданного времени.
Методы обработки данных
В [3] отмечается, что, несмотря на наличие различных подходов к анализу работы вычислительных сетей (математический аппарат теории графов и сетевого анализа, теории нечетких множеств и нечеткой логики, тензорного анализа, теории фракталов), методически разработанным и применяемым на практике математическим аппаратом является теория очередей. При моделировании распределенной обработки данных с учетом задержки на время их приема и (или) восстановление необходимо учитывать также следующие особенности:
-
• обработка осуществляется параллельно на заданном наборе серверов;
-
• каждый сервер результаты своей работы записывает в отдельный файл, после чего выполняются их «склеивание» и дальнейшая интерпретация результатов выполнения.
Подобный процесс разделения задачи на подзадачи с параллельным их выполнением и последующим объединением результатов традиционно называется Split-Join. На рисунке 1 изображена схема процесса обработки по технологии Split-Join применительно к данным ДЗЗ. Общее время выполнения такой задачи определяется длительностью этапов ее декомпозиции и объединения результатов, а также временем решения самой трудоемкой из подзадач.

Рис. 1. Схема процесса обработки с разделением и слиянием задач
На рисунке 2 в качестве примера изображена циклограмма обработки данных ДЗЗ, полученных в текущем сеансе связи, в процессе выдачи восстановленной информации с распределением по серверам обработки. В общем случае время восстановления одной части принятых данных τ является случайной величиной. Из представленного рисунка видно, что время обработки всего объема принятых в текущем сеансе связи данных без учета временных затрат на операции «склеивания» и интерпретации результатов определяется моментом завершения обработки последнего фрагмента t max. Такие дополнительные временные затраты на обслуживание при поступлении заявок в свободную систему в теории очередей традиционно называются процессами «разогрева».
На рисунке 3 изображена циклограмма для случая одновременной обработки данных сеанса связи после завершения восстановления всей принятой информации. Поскольку для операции восстановления, как правило, выделяются отдельные сервера, при поступлении данных в занятую систему процесс восстановления происходит во время ожидания начала обработки и не оказывает влияния на оперативность обработки данных в целом.
Расчет временных характеристик системы массового обслуживания ...
n-1
n

Рис. 2. Циклограмма обработки данных в процессе выдачи восстановленной информации

Рис. 3. Циклограмма обработки данных после завершения восстановления информации
Несмотря на то, что процессам Split-Join посвящено достаточно большое количество работ [8–16], вопросы оценивания времени пребывания в системах массового обслуживания (СМО) с процессами Split-Join, а также с «разогревом» до сих пор не освещены. В данной работе предлагается алгоритм расчета СМО с процессами Split-Join и «разогревом», позволяющий получить начальные моменты времени пребывания заявок в системе.
Постановка задачи
Будем считать, что заданы начальные моменты времени обработки фрагмента данных в канале bj , j = 1, m. Поток поступления заявок будем считать простейшим с интенсивностью λ . Заданы начальные моменты времени задержки, вызванной операциями приема и восстановления части информации aj , j = 1, m . Число каналов обработки – n . Дисциплина обслуживания в СМО – Split-Join. Требуется найти начальные моменты времени пребывания в системе vj , j = 1, m .
Для оценки вероятности превышения директивно заданного времени необходимо по найденным моментам vj , j = 1, m рассчитать параметры аппроксимирующего распределения (например, Вейбулла) и получить значение дополнительной функции распределения (ДФР) при заданном значении требуемого времени обработки.
Алгоритм расчета
Расчет начальных моментов времени пребывания в представленной СМО предлагается осуществить в два этапа. На первом этапе произведем расчет начальных моментов времени обработки с учетом разделения и слияния задач для двух случаев:
-
1 . Обработка осуществляется после прибытия заявки в свободную систему. Расчет начальных моментов времени обработки gj *, j = 1, m необходимо производить с учетом временных задержек на прием и восстановление.
Обработка данных осуществляется синхронно без учета задержки на прием и восстановление. Соответствующие начальные моменты времени обработки gj , j = 1, m представляют собой начальные моменты распределения максимума из n случайных величин времен обработки части данных в канале и могут быть рассчитаны по формулам, представленным в [8]:
Методы обработки данных
r gj = jZtk-1 AkF ^k) et ’ (1)
k = 1
где для {xk} и {Ak} существуют справочные таблицы [3] для различных значений r, а F*(t) представляет собой ДФР распределения максимума времени обработки в n каналах, функция которого определяется как n F *( t) =П F (t), i=1
где Fi ( t ) – функция распределения времени обслуживания в i -м канале.
После получения упомянутых начальных моментов становится возможным представить весь процесс обработки в виде одноканальной системы массового обслуживания типа M/G/ 1 с начальными моментами времени обслуживания в канале gj , j = 1, m и начальными моментами времени «разогрева» gj *, j = 1, m .
На втором этапе производится непосредственный расчет начальных моментов времени пребывания заявок в системе vj , j = 1, m дифференцированием в нуле соответствующего преобразования Лапласа – Стилтьеса (ПЛС), которое определяется выражением [7]
v ( s ) = p 0
a-^M s hM
1 - sA - e( s )
где p *0 = 1/(1 + λTB ), TB = b *(1 – λb ); β( s ), β*( s ) – ПЛС времени обслуживания, соответственно, без «разогрева» и с «разогревом»; b , b * – математические ожидания времени обслуживания без «разогрева» и с «разогревом» соответственно.
Осталось указать способ расчета gj *, j = 1, m . Далее предлагается рассмотреть отдельно варианты расчета для случаев детерминированной и случайной задержки на время приема и восстановления части данных.
Расчет начальных моментов распределения максимума при детерминированной задержке
Как видно из рисунка 2, при детерминированной задержке начало обслуживания в j -м канале будет сдвинуто относительно момента начала обслуживания на время jτ . Таким образом, расчет gj *, j = 1, m для случая детерминированной задержки осуществляется согласно
r
gj=j^ tk-1 AkG *(tk) et, k=1
где
n
G(tk,t)=1—nF(tk,iT)’ F(tk,т)= i=1
' 0, t k < T, F ( t k - T ),
t k ^ T •
Расчет начальных моментов распределения максимума при случайной задержке
При заданных начальных моментах aj , j = 1, m времени приема и восстановления части информации τ начальные моменты времени задержки начала обслуживания в j -м канале
Расчет временных характеристик системы массового обслуживания ...
am*,j. будут определяться j-кратной сверткой τ, а начальный момент m порядка времени обработки в j-м канале определяется на основании символьного представления gm,j = (b + a*j)m, m = 1,2,…, (3) где после развертывания бинома степени переводятся в номера соответствующих начальных моментов. Дальнейший расчет можно осуществлять по формуле (1), при этом для каждого канала по найденным с помощью (3) начальным моментам gm,j осуществляется подбор по методу моментов параметров аппроксимирующей функции распределения времени обработки в канале с учетом задержек. В качестве аппроксимирующей функции может выступать гамма-распределение, позволяющее выровнять два первых начальных момента при произвольных значениях коэффициента вариации.
Экспериментальная проверка точности расчета начальных моментов времени обработки с расщеплением и слиянием заявок и задержкой начала обслуживания
Верификация предложенного алгоритма расчета производилась сравнением результатов, полученных с помощью формул (1)–(3) с данными имитационного моделирования (ИМ). Приведем здесь пример расчета в сравнении с данными ИМ для следующих исходных данных:
-
• исходная заявка разделяется на 3 подзадачи;
-
• случайная длительность выполнения каждой задачи задана гиперэкспоненциальным распределением второго порядка ( H 2-распределение) с параметрами y 1 = 0,3, y 2 = 0,7, μ 1 = 0,15, μ2 1 = 0,7.
При детерминированной задержке параметр τ был задан равным 0,5. При случайной задержке начала обслуживания были заданы первые три начальные моменты времени задержки aj – {0,5, 2,0, 10,0} соответственно.
Полученные результаты сопоставлены с результатами имитационного моделирования и представлены в таблицах 1 и 2. Символом σ обозначено среднеквадратическое отклонение времени пребывания заявок в системе. Для численного расчета представлены собственно значения моментов, а также абсолютная и относительная погрешность, обозначенные ∆ и δ соответственно.
Таблица 1
Результаты расчетов при детерминированной задержке
ИМ |
Численный расчет |
|||
Знач. |
∆ |
δ, % |
||
b 1 |
6,638 |
6,571 |
6,67e-2 |
1,02 |
σ |
0,414 |
0,429 |
1,49e-2 |
3,48 |
b 3 |
525,8 |
519,9 |
5,96 |
1,15 |
Таблица 2
Результаты расчетов при случайной задержке
ИМ |
Численный расчет |
|||
Знач. |
∆ |
δ, % |
||
b 1 |
10,34 |
10,18 |
1,63e-1 |
1,60 |
σ |
0,397 |
0,432 |
3,58e2 |
8,27 |
b 3 |
1696 |
1758 |
6,19e1 |
3,52 |
Как видно из таблиц 1 и 2, результаты численных расчетов хорошо согласуются с результатами имитационного моделирования.
Методы обработки данных
Расчет начальных моментов времени пребывания в системе
Найденные на предыдущем этапе начальные моменты времени обработки с учетом задержки позволяют перейти к расчету СМО.
Проверку точности расчета приведем для тех же исходных данных. Зададим интенсивность входящего потока λ = 0,12. При таком значении λ обеспечивается коэффициент загрузки СМО, равный 0,75. В таблицах 3 и 4 представлены результаты расчетов для начальных моментов времени пребывания в системе vj , j = 1,3 при детерминированной и случайной задержке соответственно.
Согласно [2], для оценок первого момента считается допустимой погрешность 20, второго – 40, третьего – 60%. Погрешности расчетных значений не превысили указанных требований. Заметим, что ИМ не является эталоном, поскольку датчики равномерно распределенных чисел не идеальны, а конечные результаты содержат статистическую погрешность.
Таблица 4
Таблица 3
Начальные моменты времени пребывания в СМО при детерминированной задержке
ИМ |
Численный расчет |
|||
Знач. |
∆ |
δ, % |
||
v 1 |
26,36 |
24,92 |
1,441 |
5,467 |
v 2 |
1365 |
1204 |
161,3 |
11,81 |
v 3 |
1,06e5 |
8,62e4 |
1,96e4 |
18,51 |
Начальные моменты времени пребывания в СМО при случайной задержке
ИМ |
Численный расчет |
|||
Знач. |
∆ |
δ, % |
||
v 1 |
26,54 |
25,20 |
1,337 |
5,036 |
v 2 |
1363 |
1220 |
142,7 |
10,46 |
v 3 |
1,04e5 |
8,74e4 |
1,62e4 |
15,59 |
На рисунке 4 представлен график ДФР времени пребывания заявки в СМО, построенный аппроксимацией распределением Вейбулла. Параметры распределения подбирались с помощью метода моментов по найденным на предыдущем шаге значениям vj , j = 1,3. Полученные графики ДФР позволяют оценить вероятность превышения директивно заданного времени.

Рис. 4. ДФР времени пребывания заявок в системе
Расчет временных характеристик системы массового обслуживания ...
Заключение
Предложены модель и реализующий ее алгоритм расчета начальных моментов времени пребывания в СМО с процессами расщепления и слияния заявок и «разогревом». Представленная модель позволяет оценить оперативность (среднее время обработки, высшие моменты, вероятность превышения директивно заданного времени) проектируемых систем распределенной обработки данных, функционирующих в реальном масштабе времени, с учетом временных задержек на прием и восстановление информации.
Список литературы Расчет временных характеристик системы массового обслуживания с процессами расщепления и слияния заявок и разогревом
- Бучнев А.А., Пяткин В.П., Русин Е.В. Распределенная высокопроизводительная обработка данных дистанционного зондирования Земли // Исследование Земли из космоса. 2007. № 4. С. 34–38.
- Вишневский В.М. Теоретические основы проектирования компьютерных сетей. М.: Техносфера, 2003. 512 с.
- Крылов В.И., Шульгина Л.Т. Справочная книга по численному интегрированию. М.: Наука. 1966. 372 с.
- Макаренко С.И. Анализ математического аппарата расчета качества обслуживания информационно-вычислительной сети на сетевом уровне эталонной модели взаимодействия открытых систем // VII Всероссийская конференция молодых ученых по математическому моделированию и информационным технологиям (с участием иностранных ученых): программа и тезисы докладов. Красноярск, 1–3 ноября 2006 г. Красноярск: Изд-во Ин-та вычислительных технологий Сибирского отделения Российской академии наук.
- Мальцев Г.Н., Козинов И.А. Передача гиперспектральных видеоданных дистанционного зондирования Земли по радиоканалам с ограниченной пропускной способностью // Информационно-управляющие системы. 2016. № 2. С. 74–83.
- Ромашкин В.В., Лошкарев П.А., Федоткин Д.И., Тохиян О.О. и др. ЕТ РИС ДЗЗ – современные решения в развитии отечественной наземной космической инфраструктуры дистанционного зондирования Земли из космоса // Современные проблемы дистанционного зондирования Земли из космоса. 2019. Т. 16, № 3. С. 220–227. DOI: 10.21046/2070-7401-2019-16-3-220-227
- Рыжиков Ю.И. Алгоритмический подход к задачам массового обслуживания: монография. СПб.: Изд-во Военно-космической академии им. А.Ф. Можайского, 2013. 496 с.
- Рыжиков Ю.И., Лохвицкий В.А., Хабаров Р.С. Метод расчета длительности обработки задач в системе массового обслуживания с учетом процессов Split-Join // Известия вузов. Приборостроение. 2019. № 5. С. 419–422.
- Хабаров Р.С., Лохвицкий В.А. Модель оценивания оперативности многопоточной обработки задач в распределенной вычислительной среде с учетом процессов Split-Join // Вестник Российского нового университета. Серия «Сложные системы: модели, анализ, управление». 2019. Вып. 1. C. 26–34. DOI: 10.25586/RNU.V9187.19.01.P.026
- Baccelli F. Two Parallel Queues Created by Arrivals with Two Demands. The M/G/2 Symmetrical Case // Technical report INRIA-Rocquencourt. 1985. No. 426.
- Baccelli F., Makowski A.M., Shwartz A. The Fork-Join Queue and Related Systems with Synchronization Constraints: Stochastic Ordering and Computable Bounds // Advances in Applied Probability. 1989. Vol. 21. Pp. 629–660. DOI: 10.2307/1427640
- Fiorini P., Lipsky L. Exact Analysis of Some Split-Merge Queues // Performance Evaluation Review. 2015. Vol. 43, no. 2. Pp. 51–53.
- Flatto L., Hahn S. Two Parallel Queues Created by Arrivals with Two Demands // SIAM Journal on Applied Mathematics. 1979. Vol. 44. Pp. 1041–1053.
- Harrison P.G., Zertal S. Queueing Models with Maxima of Service Times // Computer Performance Evaluation. Modelling Techiniques and Tools: Proceedings of the 13th International Conference, TOOLS 2003, Urbana, IL, USA, 2–5th of September 2003. Pp. 152–168.
- Nelson R., Tantawi A.N. Approximate Analysis of Fork-Join Synchronization in Parallel Queues // IEEE Transactions on Computers. 1988. Vol. 37. Pp. 739–743.
- Olvera-Cravioto M., Ruiz-Lacedelli O. Parallel Queues with Synchronization // arXiv preprint arXiv:1501.00186. 2014. Pp. 1–37 [Digital Resource]. URL: https://arxiv.org/abs/1501.00186 (date of the аpplication: 23.04.2021).