Интеллектуальный анализ данных
Автор: Хорсова А.В.
Журнал: Теория и практика современной науки @modern-j
Рубрика: Основной раздел
Статья в выпуске: 7 (13), 2016 года.
Бесплатный доступ
Статья посвящена интеллектуальному анализу данных. Рассматриваются: процесс анализа, модели, основные методы и сферы применения.
Интеллектуальный анализ данных, информация, ассоциация, искусственный интеллект, статистика, визуализация, прогнозирование
Короткий адрес: https://sciup.org/140269584
IDR: 140269584
Текст научной статьи Интеллектуальный анализ данных
С каждым годом количество разнообразной информации увеличивается, в связи с этим возрастает популярность интеллектуального анализа. Работая с большими наборами данных, становится недостаточно относительно простой и прямолинейной статистики. Возникла необходимость перехода от простого поиска и статистического анализа данных к более сложному интеллектуальному анализу данных, который позволит построить такую модель для описания информации, которая в конечном итоге приведет к созданию результирующего отчета.
Интеллектуальный анализ данных (ИАД)— мультидисциплинарная область, на (рис.1) представлена совокупность наук, которые обеспечили возникновение интеллектуального анализа.

Рисунок 1 - База наук, обеспечивших возникновение и развитие интеллектуального анализа данных. [1]
Качественная обработка информации, выявление в ней закономерностей и трендов для принятия правильного своевременного решения – основные задачи интеллектуального анализа. Эти закономерности и тренды можно собрать вместе и определить, как модель интеллектуального анализа данных. Модели интеллектуального анализа данных применяются к конкретным сценариям (рис.2).
Главным достоинством интеллектуального анализа является возможность представлять результаты вычислений наглядно, это позволяет использовать инструментарий людьми, которые не имеют специальной математической подготовки. Выполнение интеллектуального анализа возможно с непрезентабельными системами баз данных и простыми инструментами, охватывая создание своих собственных, или же с использованием готовых пакетов программного обеспечения.

Прогнозирование |
•оценка продаж; •прогнозирование нагрузки сервера или времени простоя сервера. |
•
Риск и вероятность
Рекомендации
•
•
выбор наиболее подходящих заказчиков для целевой рассылки;
определение точки равновесия для рискованных сценариев;
назначение вероятностей диагнозам или другим
результатам
•
•
определение продуктов, которые с высокой долей вероятности могут быть проданы вместе;
1 создание рекомендаций.
Поиск последовательностей
•анализ выбора заказчиков во время совершения покупок;
•прогнозирование следующего возможного . события.
•разделение заказчиков или событий на кластеры Группирование связанных элементов;
•анализ и прогнозирование общих черт. _________
Рисунок 2 - Сценарии для интеллектуального анализа данных [2]
На (рис.3) представлена схема процесса интеллектуального анализа
данных. Первым шагом является определение проблемы. Особенность
процесса ИАД - цикличность.

Рисунок 3 - Схема процесса [1]
Существует множество различных методов для интеллектуального анализа данных, позволяющих описать тип анализа и операцию по восстановлению данных. Рассмотрим основные методы ИАД. [3]
Ассоциация - наиболее простой и распространенный метод. Основывается на сопоставлении двух или более элементов одного и того же типа. Применяется при составлении шаблонов покупок в магазинах -анализ потребительской корзины. Например, отслеживая привычки покупки, можно заметить, что вместе с мобильным устройством обычно приобретают sim-карту. Информация, которую можно получить, благодаря такому анализу, поможет выработать маркетинговую или рекламную стратегию. [3]
Классификация - метод используемый для определения типа объектов по его характеристикам. Наиболее часто его применяют к покупателям, например, классифицируя их по полу, возрасту, доходу и социальному статусу.
Кластеризация – метод, который используется для поиска независимых кластеров и их характеристик во всем множестве анализируемых данных. Например, проведение анализа базы клиентов для дальнейшего формирования специальных предложений для выделенной группы.
Прогнозирование – метод, который основывается на анализе прошлых событий для более точного предсказания будущего. Наиболее часто его используют в период сезонных колебаний.
Последовательные модели – метод для анализа долгосрочных данных. Используется для выявления тенденций, или регулярных повторений подобных событий.
Деревья решений – метод, используемый в рамках критериев отбора, или же помощи выбора конкретных данных в рамках совместной структуры. Дерево решений начинается с вопроса, который содержит два или более ответов, затем каждый ответ приводит к следующему вопросу, тем самым этот метод помогает систематизировать и идентифицировать данные или же создавать прогнозы. [3]
На сегодняшний день интеллектуальный анализ везде, где имеются какие-либо данные – торговля, медицина, генная инженерия, телекоммуникации, банковская сфера и др. Он пользуются наибольшим спросом у коммерческих предприятий, развертывающих проекты на основе информационных хранилищ данных. Благодаря интеллектуальному анализу, аналитики и руководители, получают значительные преимущества в конкурентной борьбе.
Список литературы Интеллектуальный анализ данных
- Чернышева Г.Ю. Интеллектуальный анализ данных. - Саратов: СГСЭУ, 2012. - с.92
- Основные понятия интеллектуального анализа данных/Режим доступа: https://msdn.microsoft.com/ru-ru/library/ms174949(v=sql.120).aspx
- Салмин А.А. Анализ данных. Конспект лекций. - Самара: ФГБОУ ВПО «ПГУТИ», 2013. - с.111