Метод оценки качества услуг связи, предоставляемых провайдерами фиксированной связи

Автор: Акчурин Э.А., Родионов сВ.

Журнал: Инфокоммуникационные технологии @ikt-psuti

Рубрика: Новые информационные технологии

Статья в выпуске: 1 т.8, 2010 года.

Бесплатный доступ

Данная статья посвящена методам оценки и определению оптимального показателя доступности клиентских сервисов провайдера, а также надежности его транспортной сети в целом, с учетом требований, предъявляемых к данной сфере услуг. Приведенная методика может использоваться как провайдером услуг, его партнерами и клиентами для обоюдного контроля SLA.

Короткий адрес: https://sciup.org/140191379

IDR: 140191379

Текст обзорной статьи Метод оценки качества услуг связи, предоставляемых провайдерами фиксированной связи

В условиях конкуренции для провайдера фиксированной связи качество услуги и надежность ее предоставления, позволяет не только сохранить существующих клиентов, но и использовать данные характеристики в маркетинговых акциях. Одной из характеристик надежности услуги является ее доступность, позволяющая определить не только ее работоспособность, но и функциональность всей транспортной сети, правильность построения архитектуры и безопасность ее топологии.

Определение SLA

Согласно определению TM F orum, договор SLA – это формальное соглашение между оператором связи (и/или провайдером услуг) и потребителем либо между двумя операто-рами,по которому гарантируется некоторый заданный набор показателей обслуживания.

В SLA могут входить самые разные показатели, в том числе: показатели качества обслуживания, тарифы, включая тарифы подключения и ставки взаиморасчетов, взаимную отчетность, обязательства и штрафные санкции за их нарушение [3].

В соответствии с расширенной картой процессов (eTOM), которая является стандартом и системой координат для бизнес-процессов операторов связи, обеспечение SLA это главная цель сквозного процесса «Обеспечение» и затрагивает также процессы «Выполнение» и «Биллинг» (рис. 1). TM F orum, развивая концепцию МСЭ-Т (Е.860, Е.800, G.1 000 и др.), предлагает выстраивать область «Операционные процессы», исходя из потребностей клиента и его восприятия QoS.

Обеспечение

Обработка Проблем Кгыента

Взаимодействием

Управление Качеством услуг и Уровнем Обслуживания Клиента

Управление Проблемами Сервисов

Управление Проблемами с ресурсами

Управление Производительностью ресурсов

Управление Качеством Сервисов

1 Распределение Данных о Ресурсах

Управление Производительностью

Управление Проблемами и Отчетами

Рис. 1. Отображение SLA на карте eTOM

имодействием с Поставщиками и Партнера (и

В предоставлении услуги клиенту, как правило, участвуют несколько провайдеров/постав-щиков. Сквозное качество услуги в этом случае определяется следующими типами SLA:

  • -    внутреннее – соглашение между функциональными подразделениями внутри оператора (для выстраивания сквозного процесса «Обеспечение»);

  • -    партнерское – часть договора между партнером-поставщиком сервисов и оператором для обеспечения сквозного QoS;

  • -    клиентское – формальный договор между клиентом и оператором, направленный на повышение лояльности клиента.

Доступность услуг

Доступность услуги является базовым показателем оценки качества сервиса со стороны клиента. В общем случае под доступностью сервиса понимается возможность пользования сервисом с определением граничных условий его качества. Доступность (SA%) выражается через процент времени, в течение которого сервис был работоспособен в данных точках доступа к сервису (Service Access Point). Доступность определяется через простой сервиса (SUA%) по следующей формуле:

SA%=\OQ%-SUA%.

Простой сервиса определяется как отношение суммы интервалов простоя ti к общему времени активности сервиса Ts. Время активности сервиса Ts вычисляется как разница между текущим временем и временем активации услуги и начале ее биллинга. В случае если SLA обеспечивается только в заданные промежутки времени (например, в рабочие дни с 9:00 по 18:00), время активности определяется как сумма интервалов покрытия SLA [1]:

SUA% = х 1 оо%.

Ts

Простой сервиса целиком зависит от производительности сети, ее отказоустойчивости и эффективности работы службы эксплуатации. Высокий показатель доступности услуг достигается за счет минимизации времени простоя сети.

Доступность сервиса может также зависеть от множества факторов, не имеющих отношения к производительности сети, которые также должны быть учтены провайдером при взаимодействии с заказчиком. Например:

  • -    DDoS атаки на сервисы;

  • -    ошибки службы эксплуатации провайдера в настройке пользовательского подключения;

  • -    отключение пользовательского оборудования по вине заказчика (сбой в питании и прочее) при услуге managed CPE.

При вычислении текущего коэффициента доступности услуги необходимо учитывать также простои за счет регламентных технических работ на оборудовании сети. Время на эти работы и время их выполнения должны быть оговорены в клиентском SLA и не учитываться при калькуляции простоя.

Учет времени простоя по услугам должен производиться следующими способами:

  • -    автоматическая фиксация нарушений и длительности нарушения заданных пороговых значений от подсистем тестирования; по каждому классу от подсистемы тестирования транспортной сети;

  • -    для услуги управляемого CPE: автоматическая фиксация нарушений и длительности нарушения заданных пороговых значений по каждому классу от подсистемы тестирования участка CE-CE;

  • -    учет обращений в системе обслуживания абонентов (Service Desk). Началом времени простоя в этом случае будет момент идентификации сотрудниками службы поддержки отсутствия сервиса в данной SAP. Окончанием интервала простоя является подтверждение клиентом возобновления работы услуги;

  • -    регистрация проблем с точкой подключения сервиса системой активного мониторинга последней мили, baseline-мониторинг, мониторинг параметров QoS на клиентском подключении.

Третий тип простоев возможен в случаях, когда проблема заключается в подключении на стороне клиента (интерфейс/модуль). Оно не управляется и не тестируется провайдером (например, зависание модуля или интерфейса, дефект в ПО маршрутизатора приводящий к неверной работе политики QoS) [1].

Степень деградации сервиса

Степень нарушение качества сервиса характеризуется сопутствующим показателем «Фактор деградации сервиса» (SDF). Фактор деградации сервиса является коэффициентом, характеризующим степень простоя сервиса,и может принимать значения от 0 (сервис доступен) до 1 (сервис недоступен).

Учет SDF в общем простое сервиса SUA определяется следующим образом:

еттло/ 'Lt^SDF

SU А % = ----- х 1 оо %

Ts где SDF принимает значение от 0 до 1. Примеры параметров сервисов по уровням деградации сервиса приведены в таблице 1.

Показатель доступности сети

Поскольку надежность и непрерывность предоставления услуг является ключевым фактором, определяющим лояльность клиента, стратегия эксплуатации и развития сетевой инфраструктуры должна следовать концепции «Высокой надежности».

Концепцию «Высокой надежности» системы характеризуют три основных понятия: надежность, восстанавливаемость и доступность.

Таблица 1. Примеры уровней

Сервис

SDF

Тип события

Enterprise и VoIP

1

Порт SAP не функционирует на уровне L1/L2.

Потеря пакетов по сервисам 100%.

0,5

Потеря пакетов по классам: - Standart > 10%;

  • -    Premium > 1%;

  • -    Real time > 1%.

Задержка по классу:

Real time > 300ms.

MOS:

MOS < 2.

0,2

Потеря пакетов по классам: - l%

  • -    0,1%

  • -    0,l%

Задержка по классу:

  • -    100ms

MOS:

MOS < 2.

0

Параметры качества в норме

Lite

1

Порт SAP не функционирует на уровне L1/L2.

Потеря пакетов по сервисам 100%.

0,5

Потеря пакетов по классу Standart > 10%.

Надежность – это вероятность того, что система не выйдет из строя в течение заданного периода времени. Восстанавливаемость – это способность системы вернуться в первоначальное рабочее состояние после сбоя или простоя. Доступность – это отношение времени рабочего состояния системы к ее общему времени эксплуатации.

Доступность может быть выражена следующей математической формулой через величины среднее время между сбоями (MTBF) и среднее время восстановления (MTTR):

Availability = MTBF/(MTBF+MTTR).

MTBF характеризует надежность системы, в то время как MTTR ее восстанавливаемость. MTBF определяет средний ожидаемый интервал времени между сбоями компонента и его устой- чивой работы. В качестве примера, модули Cisco спроектированы и прошли тестирование с MTBF как минимум 100.000 часов, или до 200.000 часов для простых изделий с малым количеством компонент.

Второй фактор, влияющий на доступность сети MTTR, определяет, сколько в среднем времени необходимо техническому операционному персоналу для диагностики, нахождения, устранения и замены неработающего элемента узла и восстановления работоспособности сети. Сюда входит и время доставки компоненты на замену с резервного склада. «Время восстановления» не всегда зависит от человеческого фактора. На наиболее критичных узлах сети при использовании современных схем резервирования и технологий «Высокой готовности» процессоры способны сами определить проблему, переключится на резервный программно-аппаратный экземпляр без видимого перерыва в сервисе для конечного пользователя [2].

Как правило, диагностические процедуры локализации неисправности занимают на порядок меньше времени, чем доставка и замена сбойной компоненты, поэтому основным фактором, влияющим на восстанавливаемость системы, является оперативность доставки резерва со склада.

Таким образом, доступность системы возрастает с увеличением надежности и/или восстанавливаемости. Доступность обычно выражают в процентах времени доступности или простоя системы за год. Оба метода выражения доступности эквивалентны и соотносятся между собой как показано в таблице 2 [1].

Таблица 2. Методы выражения доступности

Доступность

Время простоя в год

Тип системы

90,0000%

36 дней 12 час

99,0000%

87 час. 36 мин.

Факс-машины, принтеры

99,9000%

8 час. 46 мин.

Dial-Up сервис-провайдеры

99,9900%

52 мин. 30 сек.

Центры хранения данных

99,9990%

5 мин. 15 сек.

Резервные массивы хранения данных

99,9999%

31,5 сек.

Военные системы ПВО

Определение доступности хорошо подходит для простых систем (систем, состоящих из одного компонента). Сеть представляет собой сложную систему из большого количества каналов и узлов. Выход из строя одной из компонент не приводит к простою системы в целом. Перерыв в сервисе в результате таких сбоев имеет место только для подмножества клиентов, в то время как другие пользователи продолжают нормально работать. Далее, выход из строя одного компонента (модуля) внутри сетевого узла приведет к перерыву в сервисе только для клиентов, непосредственно подключенных к этому интерфейсу. Таким образом, доступность определяется по отношению к отдельному пользователю сетевым ресурсом. Поэтому, чтобы вычислить доступность системы, необходимо принимать во внимание все компоненты, участвующие в предоставлении сервиса единичному пользователю (все сетевые ресурсы, через которые проходит трафик).

Современная распределенная сетевая инфраструктура включает в себя большое количество параллельных и последовательных элементов (узлов, каналов и модулей). Если компоненты расположены последовательно, то общая доступность системы будет зависеть от доступности каждой отдельной компоненты и будет гораздо меньше доступности самого ненадежного компонента. При параллельной структуре резервирования компонентов, доступность системы будет много выше, чем доступность самого надежного компонента.

Таким образом, для операторов фиксированной связи уровень доступности услуг должен быть не менее одной девятки после запятой (99,9%), при этом по всем типам сервисов максимальное время нарушения SLA должно составлять не более 530 мин. за год или 45 мин. в месяц.

Вывод

Рассмотренный комплексный метод оценки качества услуг оператора позволяет клиенту сделать независимую оценку о качестве сервиса и позволяет использовать данную информацию для корректировки стоимости услуги и коррекции ее биллинга. Для поставщиков услуг данная методика позволит локализовать проблемы в сети и, решив которые, оператор сможет поднять качество сервиса на новый уровень.

Список литературы Метод оценки качества услуг связи, предоставляемых провайдерами фиксированной связи

  • ITU Rec. G.1010: «Enduser multimedia QoS categories» 11/2001 http://www.itu.int>.
  • ITU Rec. G.827: «Availability performance parameters and objectives for end-to-end international constant bitrate digital paths» 09/2003 http://www.itu.int>.
  • TM Forum, SLA Management «SLA Handbook Solution Suite Version 2.0» 02/2009 http://www>. tmforum.org http://tmforum.org>.
Статья обзорная