Интеллектуальный анализ данных

Автор: Хорсова А.В.

Журнал: Теория и практика современной науки @modern-j

Рубрика: Основной раздел

Статья в выпуске: 7 (13), 2016 года.

Бесплатный доступ

Статья посвящена интеллектуальному анализу данных. Рассматриваются: процесс анализа, модели, основные методы и сферы применения.

Интеллектуальный анализ данных, информация, ассоциация, искусственный интеллект, статистика, визуализация, прогнозирование

Короткий адрес: https://sciup.org/140269584

IDR: 140269584

Текст научной статьи Интеллектуальный анализ данных

С каждым годом количество разнообразной информации увеличивается, в связи с этим возрастает популярность интеллектуального анализа. Работая с большими наборами данных, становится недостаточно относительно простой и прямолинейной статистики. Возникла необходимость перехода от простого поиска и статистического анализа данных к более сложному интеллектуальному анализу данных, который позволит построить такую модель для описания информации, которая в конечном итоге приведет к созданию результирующего отчета.

Интеллектуальный анализ данных (ИАД)— мультидисциплинарная область, на (рис.1) представлена совокупность наук, которые обеспечили возникновение интеллектуального анализа.

Рисунок 1 - База наук, обеспечивших возникновение и развитие интеллектуального анализа данных. [1]

Качественная обработка информации, выявление в ней закономерностей и трендов для принятия правильного своевременного решения – основные задачи интеллектуального анализа. Эти закономерности и тренды можно собрать вместе и определить, как модель интеллектуального анализа данных. Модели интеллектуального анализа данных применяются к конкретным сценариям (рис.2).

Главным достоинством интеллектуального анализа является возможность представлять результаты вычислений наглядно, это позволяет использовать инструментарий людьми, которые не имеют специальной математической подготовки. Выполнение интеллектуального анализа возможно с непрезентабельными системами баз данных и простыми инструментами, охватывая создание своих собственных, или же с использованием готовых пакетов программного обеспечения.

Прогнозирование

•оценка продаж;

•прогнозирование нагрузки сервера или времени

простоя сервера.

Риск и вероятность

Рекомендации

выбор наиболее подходящих заказчиков для целевой рассылки;

определение точки равновесия для рискованных сценариев;

назначение вероятностей диагнозам или другим

результатам

определение продуктов, которые с высокой долей вероятности могут быть проданы вместе;

1 создание рекомендаций.

Поиск последовательностей

•анализ выбора заказчиков во время совершения покупок;

•прогнозирование следующего возможного . события.

•разделение заказчиков или событий на кластеры Группирование связанных элементов;

•анализ и прогнозирование общих черт. _________

Рисунок 2 - Сценарии для интеллектуального анализа данных [2]

На (рис.3) представлена схема процесса интеллектуального анализа

данных. Первым шагом является определение проблемы. Особенность

процесса ИАД - цикличность.

Рисунок 3 - Схема процесса [1]

Существует множество различных методов для интеллектуального анализа данных, позволяющих описать тип анализа и операцию по восстановлению данных. Рассмотрим основные методы ИАД. [3]

Ассоциация - наиболее простой и распространенный метод. Основывается на сопоставлении двух или более элементов одного и того же типа. Применяется при составлении шаблонов покупок в магазинах -анализ потребительской корзины. Например, отслеживая привычки покупки, можно заметить, что вместе с мобильным устройством обычно приобретают sim-карту. Информация, которую можно получить, благодаря такому анализу, поможет выработать маркетинговую или рекламную стратегию. [3]

Классификация - метод используемый для определения типа объектов по его характеристикам. Наиболее часто его применяют к покупателям, например, классифицируя их по полу, возрасту, доходу и социальному статусу.

Кластеризация – метод, который используется для поиска независимых кластеров и их характеристик во всем множестве анализируемых данных. Например, проведение анализа базы клиентов для дальнейшего формирования специальных предложений для выделенной группы.

Прогнозирование – метод, который основывается на анализе прошлых событий для более точного предсказания будущего. Наиболее часто его используют в период сезонных колебаний.

Последовательные модели – метод для анализа долгосрочных данных. Используется для выявления тенденций, или регулярных повторений подобных событий.

Деревья решений – метод, используемый в рамках критериев отбора, или же помощи выбора конкретных данных в рамках совместной структуры. Дерево решений начинается с вопроса, который содержит два или более ответов, затем каждый ответ приводит к следующему вопросу, тем самым этот метод помогает систематизировать и идентифицировать данные или же создавать прогнозы. [3]

На сегодняшний день интеллектуальный анализ везде, где имеются какие-либо данные – торговля, медицина, генная инженерия, телекоммуникации, банковская сфера и др. Он пользуются наибольшим спросом у коммерческих предприятий, развертывающих проекты на основе информационных хранилищ данных. Благодаря интеллектуальному анализу, аналитики и руководители, получают значительные преимущества в конкурентной борьбе.

Список литературы Интеллектуальный анализ данных

  • Чернышева Г.Ю. Интеллектуальный анализ данных. - Саратов: СГСЭУ, 2012. - с.92
  • Основные понятия интеллектуального анализа данных/Режим доступа: https://msdn.microsoft.com/ru-ru/library/ms174949(v=sql.120).aspx
  • Салмин А.А. Анализ данных. Конспект лекций. - Самара: ФГБОУ ВПО «ПГУТИ», 2013. - с.111
Статья научная