Использование интеллектуальных технологий для решения проблемы автоматизации в продвижении интернет-ресурсов

Автор: Ващук И.Н., Заельская Н.А., Надточий Н.С.

Журнал: Теория и практика современной науки @modern-j

Рубрика: Математика, информатика и инженерия

Статья в выпуске: 6 (84), 2022 года.

Бесплатный доступ

В статье рассматриваются актуальные вопросы, связанные с разработкой системы правил, которые позволили бы осуществить автоматизацию в процессе оптимизации предоставления услуг платного хостинга, что позволит разбивать тарифные планы на классы.

Продвижение сайтов, интеллектуальные технологии, интеллектуальное поисковое продвижение

Короткий адрес: https://sciup.org/140294536

IDR: 140294536

Текст научной статьи Использование интеллектуальных технологий для решения проблемы автоматизации в продвижении интернет-ресурсов

Автоматизация процессов в продвижении сайтов - тема, которая становится все более актуальной с каждым годом, поскольку с развитием поисковых алгоритмов SEO-специалистам приходится работать с растущим количеством факторов, влияющих на позиции сайта в выдаче. Если десять лет назад конкуренция между сайтами в интернете была ниже и структура сайтов - проще, то сегодня оптимизаторам зачастую приходится продвигать сайты с определенной «историей болезни», с огромным числом накопленных за годы страниц и т.д.

Автоматизация процессов в SEO-компании решает как минимум три ключевые задачи: экономия времени специалистов, которым без роботов приходится вручную проводить много рутинной работы; повышение качества услуг (робот, в отличие от человека, не может пропустить что-то важное по невнимательности, также мощности, объемы обрабатываемых роботом данных дают более точную аналитическую картину, нежели проведенный вручную анализ небольшой выборки сайтов); масштабируемость бизнеса (автоматизированные процессы позволяют, во-первых, увеличивать в разы количество проектов, находящихся в одновременной работе, во-вторых, решают проблемы, которые возникают обычно при уходе специалиста или при расширении штата).

В основу мы предлагаем разработку системы правил, которые позволили бы осуществить автоматизацию в процессе оптимизации предоставления услуг платного хостинга, что позволит разбивать тарифные планы на классы. Цель -классификация тарифных планов на услуги хостинга.

Исходные данные определяются такими переменными, как Цена в месяц = [0.99; 49], Цена в год = [10.15; 499], Объем = [5;2500], Трафик = [0.4;1000], Количество сервисов = [1;4], Виртуальных серверов = [1;1000], FTP входов = [1;1000].

Промежуточные цели определяются следующими переменными: Compl = большая, средняя, малая; Comp2 = большая, средняя, малая, Comp3 = большая, средняя, малая.

Для проведения анализа использовался метод главных компонент, что дало возможность по p исходным признакам выделить в общем случае р главных компонент

Введем исходные данные в программу STATISTICA (50x7). Исходная сводка анализа метода главных компонент (МГК) представлена в таблице 1.

Таблица 1 -Исходная сводка МГК

Component Number

Eigen Value

Percent of Variance

Cumulative Percentage

1

3.10802

44.400

44.400

2

1.45952

20.850

65.251

3

0.913763

13.054

78.304

4

0.797564

11.394

89.698

5

0.506804

7.240

96.938

6

0.20519

2.931

99.870

7

0.00913

0.130

100.000

Number of complete cases : 50

Из полученной сводки заключаем, что анализу подвергаются переменные цена/месяц, цена/год, количество сервисов, количество ftp входов, объем, трафик, количество виртуальных серверов и что число объектов составляет 50.

Далее следует информация непосредственно МГК собственные значения главных компонент, упорядоченные по величине (Eigenvalue), процент дисперсии, приходящийся на каждую выделенную главную компоненту (Percent of Variance), накопленный процент дисперсии (Cumulative Percentage).

Приведенные цифры говорят о том, что уже первые три главные компоненты описывают 78,304 % дисперсии исходных данных.

Для более детального анализа проделали еще ряд операций. Получили веса признаков в главных компонентах, таблица2.

Таблица 2 -Веса признаков в главных компонентах

Component1

Component2

Component3

Цена/мес

0.5386

0.1130

0.0844

Цена/год

0.5258

0.1691

0.0541

Объем

0.51509

-0.02169

0.103268

Трафик

0.1791

0.5622

-0.1295

FTP входов

0.1571

-0.6791

-0.1488

Виртуальных серверов

0.2588

-0.2142

-0.7796

Сервисов

0.21025

-0.3672

0.5766

Как следует из полученных цифр, в первой компоненте наблюдается наибольшая зависимость от цены за месяц, цены за год, и объема. Во второй главной компоненте наблюдается обратно пропорциональная зависимость от количества ftp входов и количества сервисов, а также прямо пропорциональная зависимость от трафика. В третьей главной компоненте наблюдается прямо пропорциональная зависимость от количества сервисов, а также обратно пропорциональная зависимость от количества виртуальных серверов.

Выбор значащих компонент и определение названия для них представлено ниже.

  • 1)    Выберем p =3 главных компонент.

E j w , ]

  • 2)    Определим названия для них по формуле: Ки■ = —------

  • Е j wj] i=1
  • 0.5386

    0.1130

    0.0844

    0.5258

    0.1691

    0.0541

    0.51509

    -0.02169

    0.103268

    0.1791

    0.5622

    -0.1295

    0.1571

    -0.6791

    -0.1488

    0.2588

    -0.2142

    -0.7796

    0.21025

    -0.3672

    0.5766

где [wkj] – подмножество участвующих в названии весовых коэффициентов j-й компоненты;

[ w j ] – все весовые коэффициенты j -й компоненты.

wi

Для первой, второй и третьей компоненты имеем соответственно:

n

Е W n2 = 1

i = 1

n

E W 2 2 = 1

i 2

i = 1

n

E w z- з2 = 1

i 3

i = 1

Е Wi2 = 0,8318733

У w- 2 = 0.9120815

i 2

у w, 2 = 0.9402437 i 3

i = 1,2,3

i = 4,5,7

i = 6,7

Ки! = 0,8318733

Киг = 0.9120815

Ки3 = 0.940243 7

K принадлежит интервалу [0,75; 0,95], значит, первая главная компонента определяется (более чем на 83,1%) следующими показателями: цена за месяц, цена за год, и объема выделяемой памяти.

K принадлежит интервалу [0,75; 0,95], значит, вторая главная компонента определяется (более чем на 91,2%) следующими показателями: трафик, количество ftp входов, и количество сервисов.

K принадлежит интервалу [0,75; 0,95], значит, третья главная компонента определяется (более чем на 94%) следующими показателями: количество виртуальных серверов и количество сервисов.

Учитывая зависимость компонент от признаков, охарактеризуем каждый из классов.

В первый класс входят тарифы с малой ценой, малым размером выделяемой памяти, различным лимитом на трафик, различным количеством ftp входов, различным количеством сервисов и различным количеством виртуальных серверов.

Во второй класс входят тарифы с средней ценой, средним размером выделяемой памяти, различным лимитом на трафик, различным количеством ftp входов, высоким количеством сервисов и средним количеством виртуальных серверов.

В третий класс входят тарифы с высокой ценой, высоким размером выделяемой памяти, различным лимитом на трафик, различным количеством ftp входов, высоким количеством сервисов и высоким количеством виртуальных серверов.

Таким образом мы можем говорить о возможности построения дерева решений для интеллектуального поискового продвижения.

Список литературы Использование интеллектуальных технологий для решения проблемы автоматизации в продвижении интернет-ресурсов

  • Brett Lantz. Machine Learning with R. Packt Publishing, Birmingham - Mumbai, 2013.
  • Quinlan J.R. C4.5: Programs for Machine learning // Morgan Kaufmann Publishers. 1993.
  • Quinlan, J. R. Induction of Decision Trees // Machine Learning. Kluwer Academic Publishers. 1986. № 1. Р. 81-106.
  • Шахиди А. Деревья решений - общие принципы работы. URL: http://www.basegroup.ru/library/analysis/tree/description.
Статья научная