Обзор инструментов кластеризации в SEO-проектировании

Бесплатный доступ

В статье приведена краткая характеристика методов кластеризации, рассмотрен ряд инструментов кластеризации ключевых слов в SEO – проектировании в соответствии с методами кластеризации: логической группировки, семантической группировки и группировки по топам поисковой выдачи. Отмечается, что для каждого метода кластеризации предусмотрен ряд специальных инструментов, даны рекомендации для успешного разделения ключевых слов на кластеры. Рекомендуется первоначально разбить ключи с помощью утилит на основе семантической схожести и определить интент, а затем соотнести результаты с результатами группировки по топам поисковой выдачи той системы, под которую будет оптимизирован ресурс. Далее на основе корреляции результатов вносятся изменения в кластеры.

Еще

Семантическое ядро, кластеризация, логическая группировка, группировка по топам SERP, группировка по семантической схожести, инструменты кластеризации

Короткий адрес: https://sciup.org/14123743

IDR: 14123743   |   DOI: 10.47813/2782-5280-2022-1-1-0229-0237

Текст статьи Обзор инструментов кластеризации в SEO-проектировании

DOI:

Вопросам семантического поиска, классификации, структуризации и интеграции информации в контексте SEO – проектирования уделяется достаточно много внимания исследователями в области информационных технологий [1-3]. Одним из первых этапов разработки сайта является именно этап SEO – проектирования, в рамках которого закладывают основу для последующей индексации и продвижения ресурса через SERP. На этапе SEO – проектирования составляют семантическое ядро из ключевых слов, характеризующих тематику ресурса и распределяемых на кластеры в соответствии с общим свойством группируемых слов.

Выделяют три метода кластеризации: логическая группировка, семантическая группировка, группировка по топам поисковой выдачи. Метод кластеризации ключевых слов выбирают исходя из объема семантического ядра, тематики и типа сайта и полноты соответствия общему свойству, заданному в качестве тематического маркера [4].

Рассмотрим инструменты группировки ключевых слов на кластеры в соответствии с разбивкой по методам кластеризации.

ЛОГИЧЕСКАЯ ГРУППИРОВКА

Метод логической группировки используют для простых коммерческих сайтов, (сайт-визитка, лендинг, веб-портфолио, промо-сайт, сайт-витрина), семантические ядра которых содержат до нескольких сотен ключевых слов.

Группировка проводится вручную в одну или несколько итераций: выбирается тематический маркер, который, как правило, является одним из высокочастотных ключей из семантического ядра. При условии наличия смысловой близости с тематическим маркером ключевое слово добавляется в кластер [5]

Для группировки ключевых слов в ручном режиме используют облачные и локальные табличные процессоры [ табличные процессоры – это комплекс прикладных программ, предназначенных для обработки информации, проведения расчетов и визуального представления результатов расчетов в виде графиков и диаграмм], наиболее популярными среди которых являются: Google Sheets, Microsoft Excel, LibreOffice Calc и OpenOffice Calc [6, 7].

Google Sheets

Microsoft Excel LibreOffice Calc OpenOffice Calc

Рисунок 1. Облачные и локальные табличные процессоры.

Figure 1. Cloud and local spreadsheets.

В табличный процессор загружают список ключевых слов и сортируют по частотности, которую определяют с помощью разных сервисов, к примеру, Яндекс. Вордстата. Слова, которые обладают самой высокой частотностью, используют в качестве общих свойств, т.е. тематических маркеров, вокруг которых выстраивают средне – и низкочастотные ключевые слова с разделением по коммерческому и информационному интенту ключевых слов.

Существуют отдельные плагины и надстройки для табличных процессоров. К примеру, для Microsoft Excel был разработан плагин, который позволял обрабатывать разные по размеру семантические ядра. Кластеризация сводилась к следующему: в табличный процессор загружается семантическое ядро с указанием частотности ключевых слов, вычисляются доли весов, формируется справочная таблица с весами слов, выделяются леммы для слов, вычисляют вес лемм, формируют справочную таблицу с леммами, проводят первичную кластеризацию, укрупняют полученные группы.

На основе плагина создана надстройка Power Query, автоматизирующая механические действия плагина и сокращающая время обработки данных [8].

Иногда для логической кластеризации используют ментальные карты, к примеру, XMind или MindMeister.

Рисунок 2. Пример кластеризации в виде ментальной карты.

Figure 2. An example of clustering in the form of a mental map.

Логическая группировка дает достаточно точный результат, но не рекомендуется использовать этот метод для кластеризации семантических ядер, которые содержат более несколько сотен слов, т.к. легко сбиться с принципа группировки, пропустить ключ или некорректно определить поисковой интент.

ГРУППИРОВКА ПО СЕМАНТИЧЕСКОЙ СХОЖЕСТИ

Метод группировки по семантической схожести применяют преимущественно для крупных коммерческих сайтов (агрегаторов, интернет-магазинов, сайтов услуг, маркетплейсов), семантические ядра которых включают в себя тысячи ключевых слов, т.к. метод основан на применении нейросетевых алгоритмов, что требует долгосрочной и дорогостоящей разработки формул и обучения нейросети для обработки и сегментации ключевых слов в автоматическом режиме.

Суть кластеризации заключается в разделении ключевых слов с учетом весовых коэффициентов на кластеры по смысловому совпадению. Выбирается тематический маркер с тяжелым весом, как и в случае с логической группировкой, маркер является одним из высокочастотных ключей из семантического ядра. При условии пересечения с маркером с тяжелым весом в кластер попадут семантические близкие ключи. В некоторых алгоритмах помимо требования семантической схожести может быть установлено дополнительное свойство для вхождения в кластер по морфологическому признаку.

Несмотря на то, что метод семантической схожести сложен в разработке, существует ряд упрощенных приложений, основанных на семантической кластеризации, к которым относятся Cluster Army, SpyFu, Simple SEO tool [9].

Следует учитывать, что автоматическая группировка дает достаточно точный результат, но кластеризация по семантической схожести не учитывает поисковый интент, поэтому определять интент ключей на коммерческость необходимо вручную или посредством сервиса определения процента коммерциализации.

ГРУППИРОВКА ПО ТОПАМ ПОИСКОВОЙ ВЫДАЧИ

Группировка по топам SERP поисковых систем может проводиться тремя способами: soft (мягкая), middle / moderate (умеренная) и hard (строгая). Мягкая кластеризация применяется в двух случаях: тематика сайта неконкурентная или для ресурса важно количество визитов, но не качество трафика. Строгая кластеризация используется для продвижения крупных коммерческих ресурсов и высококонкурентных тематик. Умеренную кластеризацию рекомендуют применять для продвижения коммерческих ресурсов в определенном регионе.

Суть кластеризации заключается в поиске пересечений ключевых слов на страницах сайтов, находящихся в топе поисковой выдачи. Поисковые системы формируют SERP на основании факторов ранжирования. Параметры, по которым оценивается сайт и определяется его позиция в органической выдаче, для каждой поисковой системы индивидуальны. Поэтому ключевые слова из семантического ядра поочередно проверяются и по каждому ключу составляется топ SERP в рамках конкретной поисковой системы. Результаты поиска по каждому из ключевых слов сравнивают с тематическим маркером на предмет одинаковых адресов страниц и в зависимости от установленного порога пересечений ключевые слова объединяют в кластер.

При мягкой кластеризации ключевое слово попадет в кластер, если при сравнении с тематическим маркером количество общих адресов в топе SERP будет соответствовать установленному порогу пересечений. В кластере все ключевые слова связаны с маркером, но между собой по количеству общих адресов могут не пересекаться. При строгой кластеризации, как и при мягкой, ключевые слова сравниваются с маркером, но и дополнительно между собой. Для включения в группу ключи должны пересекаться не только с маркером по установленному порогу пересечений, но и между собой. При умеренной кластеризации ключевые слова связаны с маркером по установленному порогу пересечений, между собой обязательно связаны, но в разных парах количество общих адресов – разное [10].

К ряду основных инструментов кластеризации по топам SERP относятся онлайн

– сервисы, среди которых наиболее популярными являются Serpstat, SERanking, Rush

Analytics, SeoQuick, Topvisor и ПиксельТулс. Общий принцип работы данных сервисов заключается в загрузке в систему списка ключевых слов, выбора способа кластеризации, установке порога пересечений и выбора поисковой системы.

Serpstat

SE Ranking

Rush Analytics

SERanking

Topvisor

ПиксельТулс

SeoQuick

Рисунок 3. Инструменты кластеризации для SERP.

Figure 3. Clustering tools for SERP.

ЗАКЛЮЧЕНИЕ

Отметим, что для каждого метода кластеризации предусмотрены определенные инструменты. Но для успешного разделения ключевых слов на кластеры рекомендуется использовать следующую комбинацию: первоначально разбить ключи с помощью утилит на основе семантической схожести и определить интент, а затем соотнести результаты с результатами группировки по топам поисковой выдачи той системы, под которую будет оптимизирован ресурс. На основе корреляции результатов внести изменения в кластеры.

Статья