Большие данные. Расширение области практического применения

Автор: Поддымникова А.Е., Воробьева К.Р., Мастилин А.Е.

Журнал: Экономика и социум @ekonomika-socium

Рубрика: Основной раздел

Статья в выпуске: 5 (48), 2018 года.

Бесплатный доступ

В статье рассмотрена технология Big Data, а также причины ее публичного распространения. На примере компании «Amazon» было проанализировано как возникают такие большие объемы данных, как их собирают и делают выводы на их основе. Так же была выявлена проблема публичной обработки персональных данных и пути их решения.

Большие данные, анализ, поведение, маркетинг

Короткий адрес: https://sciup.org/140239109

IDR: 140239109

Текст научной статьи Большие данные. Расширение области практического применения

Термин Big Data или «Большие данные» не имеют строгого определения, а также нельзя провести четкий диапазон границ объема созданных и реплицированных данных. Несмотря на это, есть устоявшееся мнение, что большие данные – совокупность технологий, которые должны совершать три операции: обрабатывать большие объемы данных, уметь работать с быстро поступающими данными в больших объемах, а также уметь работать со структурированными и плохо структурированными данными, то есть с данными, которые не имеют заранее определенной структуры или не организованы в определенном порядке, параллельно в разных отношениях. В сущности, Big Data предполагает работу с информацией огромного объема и разнообразного состава, которая очень часто обновляется для увеличения эффективности работы и повышения конкурентоспособности. Огромные объемы данных обрабатываются для того, чтобы человек мог получить нужные ему результаты для их дальнейшего применения [1].

Появление больших данных в публичном пространстве было связано с тем, что эти данные затронули практически всех людей, а не только научное сообщество. В публичную сферу технологии больших данных вышли, когда речь начала идти о числе жителей планеты. Около семи миллиардов человек, собирающихся в различных социальных сетях и других проектах, которые объединяют людей. YouTube, Facebook, ВКонтакте, Одноклассники, где количество людей измеряется миллиардами, а количество операций, которые они одновременно совершают, колоссально велико. Поток данных в этом случае — это пользовательские действия.

В нашей жизни все больше аппаратных средств и программ начинают генерировать большое количество данных — например, «интернет вещей». Вещи уже сейчас генерируют огромные потоки информации. Полицейская система «Поток» отправляет информацию со всех камер и позволяет находить машины по этим данным. Набирает обороты мода на различные фитнес-браслеты, GPS-трекеры и другие вещи, которые помогают человеку решать определенные задачи.

По мере развития технологий, связанных с Big Data, всё большее внимание привлекает к себе «менеджмент на основе анализа данных» – моментальный анализ большого массива данных, отражающих поведение клиентов в целях постоянного выявления новых деловых возможностей.

На сегодняшний день любой товар приобретается по отзывам других в социальных сетях и на сайтах, а не из-за удачной рекламной кампании предприятия. Поэтому для того, чтобы заниматься маркетингом, нужно обязательно анализировать действия каждого потребителя и как следствие анализировать огромные объёмы данных. Но настоящие возможности обработки данных с использованием искусственного интеллекта (ИИ) позволили осуществлять моментальный анализ больших массивов данных.

Разберем пример. На портале электронной торговли «Amazon» каждому покупателю предлагается раздел рекомендаций «Те, кто приобрели данный товар, также купили и это». Для того, чтобы рекомендацию дать верно, «Amazon» осуществляет по каждому пользователю индексацию всех товаров:

  • —    покупатель ознакомился с описанием товара - присваивается код «1»;

  • —    покупатель приобрёл товар - «5»;

  • —    пользователь не предпринял никаких действий - «0».

Компанией «Amazon» были созданы такие платформы, как вебсайты электронной коммерции, поисковые сайты и социальные сети. Это им позволяет искусно собирать данные своих пользователей и, ограничивая использование этих сведений, получать всё новые данные, расширяя свой бизнес [3].

Таким образом даже при минимальном количестве покупок и просмотров конкретным покупателем, имея покупателей со схожим шаблоном поведения, появляется возможность рекомендовать товары, приобретённые другими людьми со сходными интересами. Данный процесс анализа массива данных называется «покупательское поведение».

Не стоит забывать и о том, что чем мощнее и значимее технология, тем больше появляется побочных эффектов при её использовании. Знать эти слабые стороны необходимо не только разработчикам, но и тем, кто пользуется технологией.

Вновь обратимся к «Amazon». У них рекомендации строятся путем догадок на основании данных о других пользователях. Однако это очень похоже на нарушение границ частной жизни, несмотря на свои благие намерения. Поэтому все персональные данные и приватность должны защищаться как законом, так и технологически. Что касается законодательного аспекта, то в мае 2017 года вступил в силу закон о защите личных данных с внесенными поправки с учётом предполагаемого использования больших данных. Если говорить о технологической защите, то компаниям, которые пользуются Bid Date, необходимо применять процедуру деидентификации данных - исключение возможности извлечения персональных данных, а также шифровать данные, причем несколькими этапами, разными уровнями сложности [2].

Список литературы Большие данные. Расширение области практического применения

  • Будзко В. И. Системы высокой доступности и Большие Данные//Большие данные в национальной экономике 2013.
  • Короткова Т. «EMC Data Lake 2.0 -средство перехода к аналитике больших данных и цифровой экономике» http://bigdata.cnews.ru/news/line/2015-12-03_emc_data_lake_20_pomozhet_perejti_k_analitike (Дата обращения 20.05.2018).
  • Кувахар Рик. Можно ли эффективно использовать «большие данные» без свободы действий на местах? https://www.nippon.com/ru/features/c04601/(Дата обращения 20.05.2018).
Статья научная