Автоматизация анализа и поиска статистических закономерностей в решении задач эмпирической социологии

Автор: Ласточкина Мария Александровна, Ласточкин Александр Николаевич

Журнал: Социальное пространство @socialarea

Рубрика: Социально-экономические исследования

Статья в выпуске: 3 (5), 2016 года.

Бесплатный доступ

В последнее время быстрое развитие информационных компьютерных технологий сильно повлияло на стиль и на методологию обработки данных, способствуя созданию и практическому использованию применяемого инструментария, разработке новых методик работы с информационной базой. Стоит отметить, что информационно-коммуникационные технологии обеспечивают исследователям более широкие возможности, такие как рост эффективности работы за счет быстроты обработки данных, систематическое накопление, хранение и передача, в том числе и по сети Интернет, любых массивов данных. Важная роль в мировом экономическом развитии, несомненно, принадлежит глобальному внедрению информационно-коммуникационных технологий. Их активное распространение в экономической и социальной жизни является источником роста как экономики самой страны, так и ее конкурентоспособности на международном рынке. В статье проанализированы современные тенденции развития информационно-коммуникационных технологий. Обозначены основные исторические этапы развития информационных технологий, начиная с 1940-х годов и до настоящего момента...

Еще

Социологические данные, информационные системы, анализ, математические методы, индексы, коэффициенты

Короткий адрес: https://sciup.org/147224701

IDR: 147224701

Текст научной статьи Автоматизация анализа и поиска статистических закономерностей в решении задач эмпирической социологии

В последнее время быстрое развитие информационных компьютерных технологий сильно повлияло на стиль и на методологию обработки данных, способствуя созданию и практическому использованию применяемого инструментария, разработке новых методик работы с информационной базой. Стоит отметить, что информационно-коммуникационные технологии обеспечивают исследователям более широкие возможности, такие как рост эффективности работы за счет быстроты обработки данных, систематическое накопление, хранение и передача, в том числе и по сети Интернет, любых массивов данных. Важная роль в мировом экономическом развитии, несомненно, принадлежит глобальному внедрению информационно-коммуникационных технологий. Их активное распространение в экономической и социальной жизни является источником роста как экономики самой страны, так и ее конкурентоспособности на международном рынке. В статье проанализированы современные тенденции развития информационно-коммуникационных технологий. Обозначены основные исторические этапы развития информаци- онных технологий, начиная с 1940-х годов и до настоящего момента. Цель данной работы показать, что инновационные и технологические разработки расширяют возможности для исследователей и научных коммуникаций, упрощают решение многих задач. Поставленные задачи: обзор основных этапов развития информационных технологий, раскрытие преимуществ использования компьютерных технологий, этапы проектирования информационно-аналитической системы РИСКиМ, выявление зависимости модернизационного развития территории и социокультурных характеристик населения региона. Предложены основные принципы проектирования информационно-аналитической системы мониторинга социокультурного развития и уровней модернизации регионов России «Региональное исследование социокультурных изменений и модернизации». С ее помощью показаны возможности применения компьютерных технологий в социологических исследованиях, в частности, при слиянии анализа статистических и социологических данных. К преимуществам внедрения информационно-коммуникационных технологий в социологические исследования можно отнести ускорение вычислений, массовый доступ к базам данных и программному обеспечению, совершенствование инструментального аппарата исследований. Планируемое применение интернета для дальнейшего развития ИС «РИСКиМ» позволит осуществить более широкий обмен научной информацией среди исследователей.

Социологические данные, информационные системы, анализ, математические методы, индексы, коэффициенты.

Важная роль в мировом экономическом развитии, несомненно, принадлежит глобальному внедрению информационно-коммуникационных технологий (ИКТ). Их активное распространение в экономической и социальной жизни является источником роста как экономики самой страны, так и ее конкурентоспособности на международном рынке. Предикторами ИКТ служили телекоммуникационные технологии, которые позволили людям стать более информированными и мобильными. Изобретение радио, телеграфа, телефона, телевидения, компьютера, интернета, мобильной связи явились знаменательными историческими моментами. В результате научно-технической революции, распространения цифровых технологий, развития микроэлектроники стала возможна всеобщая доступность для населения информационных ресурсов [2].

Обозначим основные исторические этапы развития информационных технологий [4]:

  • 1.    1940-е годы: создание электронно-вычислительных машин (ЭВМ).

  • 2.    1950 – 1960-е годы: ЭВМ доступны только профессионалам, ученым, исследователям. Происходит развитие машинных

  • 3.    1960 – 1970-е годы: разработка операционных систем, распараллеливание процесса обработки информации, множественность заданий. Количество ЭВМ в мире измеряется десятками тысяч.

  • 4.    1970 – 1980-е годы: развитие программного обеспечения, изобретение более компактных ЭВМ. Носителями информации служат гибкие и лазерные диски. Были разработаны и вошли в применение большие интегральные схемы (БИС), что привело к снижению стоимости производства компьютеров. Появились первые персональные компьютеры (ПК) – IBM PC.

  • 5.    1980 – 1990-е годы: качественный рост технологии разработки программного обеспечения. Основным аспектом информационной

  • 6.    1990 – 2000-е годы: появляются гибкие высокоавтоматизированные системы на базе ЭВМ. Рост продуктивности и скорости доступа к информации, расширение сферы использования запоминающих устройств. Развиваются искусственные нейронные сети, модульное программное обеспечение, моделирование, роботостроение, он-лайн-игры. Происходит распространение электронных системы в самых различных отраслях производства и жизнедеятельности общества. Представлен первый стандарт цифровой сотовой связи GSM, стандарт пакетной передачи данных GPRS.

  • 7.    2000 – 2010-е годы: разработка программного обеспечения с открытым исходным кодом, первого IPad, широкое распространение мобильной связи и беспроводного интернета.

  • 8.    2010-е годы: развитие сети 5G с ожидаемым социально-экономическим эффектом в таких областях, как электронная медицина, подключенные дома, безопасный транспорт, интеллектуальные энергетические сети, индустрия развлечений [3]. Распространение социальных сетей и систем виртуальной реальности.

языков. Информация хранится на перфо-карте2 или перфоленте3.

технологии является представление и обработка знаний. Создаются большие базы и банки знаний, экспертные системы. Происходит глобальное распространение ПК.

Таким образом, развитие информационно-коммуникационных технологий (ИКТ) сопровождается активным проникновением их во все сферы жизнедеятельности общества. Без использования компьютера очень сложно представить и проведение научных исследований. Многие результаты таких работ хранятся, обрабатываются или анализируются с помощью ИКТ. Разнообразное программное обеспечение также существенно упростило процедуры сбора, хранения и анализа различных данных, их наглядное представление, свод и публикацию [10]. Инновационные и технологические разработки в данной сфере расширяют возможности для исследователей и научных коммуникаций, упрощают решение многие задач [1]. Остановимся на плюсах, которые предоставляют ИКТ для социологических исследований. В первую очередь все больше появляется потребность анализа больших баз данных социологических опросов. Второе – необходимость более глубокого и многоаспектного рассмотрения происходящих явлений в изучаемом социуме. Решение этих задач достигается благодаря использованию соответствующего программного обеспечения и пакетов прикладных программ. Выявление тенденций и закономерностей развития на основе проведения корреляционного, регрессионного, кластерного, факторного и других видов анализа уже стало неотъемлемой частью большинства исследований. Информационные и компьютерные технологии представляют целый ряд преимуществ, который не ограничивается представленным ниже списком:

  • –    удаленная (дистанционная) работа исследователей;

  • –    графическое и картографическое изображение данных;

  • –    различные виды представления данных (печатный, электронный), а также их передача, тиражирование;

  • –    надежность хранения и быстрота работы с большими массивами информации;

    – расширение и углубление анализа данных (первичный, вторичный анализы), построение прогнозов.

Не вдаваясь в подробности описания подготовительных этапов работы (формулировка задач исследования, предварительное изучение объекта исследования, разработка программы исследования, анкеты и т. д.) и даже самого метода анкетирования, обратимся к процедуре сбора ответов респондентов в базу данных и к анализу результатов. Основными техническими средствами, используемыми на данном этапе, являются компьютер и соответствующее программное обеспечение. Одним из популярных пакетов статистической обработки данных в социологических исследованиях является SPSS (Statistical Package for the Social Sciences – статистический пакет для общественных наук). В частности, все базы данных социологических исследований, проводимые Институтом социально-экономического развития территорий РАН (ИСЭРТ РАН), формируются с помощью SPSS DE, работающего под DOS. Интерфейс программы создан таким образом, что все данные анкеты заполняются в одном диалоговом окне, что дает наглядность и быстроту работы для заполнения данных опроса в распределенном режиме. Предварительно инженером создается форма для ввода анкеты (под каждый социологический опрос своя), в которой указываются правила для их заполнения. Более современные модули SPSS Data Entry (Station), являющиеся приложением Microsoft Windows, не используются в силу (как отмечают лаборанты, заполняющие данные в формы) потери наглядности ввода данных по сравнению с предыдущей версией программного обеспечения. В качестве хранилища для архива используется сервер ИСЭРТ РАН, кроме того, каждая база проходит патентование в Роспатенте. Данные сохраняются в виде файлов с расширением .sys и .sav, которые впоследствии используются для анализа, могут быть импортированы в Microsoft Excel. Соответственно, изучение статистических закономерностей можно проводить как c помощью SPSS, так и с помощью Excel. Зачастую задачи исследователей ориентированы на построение кросс-таблиц, вычисление индексов, корреляционно-регрессионный анализ, кластерный или факторный анализ.

В данной статье рассмотрим задачу выявления зависимости модернизационного развития территории и социокультурных характеристик населения региона. Поставленная задача была выполнена с помощью SPSS и информационно-аналитической системы «Модернизация» [6; 12]. Социокультурные характеристики населения определялись с помощью коэффициентов, рассчитанных по данным социологического исследования общественного мнения, оценок населением основных параметров их жизнедеятельности в регионах Северо-Западного федерального округа (ИСЭРТ РАН, 2013 г.). Выборочная совокупность составила 4032 человека в десяти регионах Северо-Западного федерального округа (Архангельская, Вологодская, Калининградская, Ленинградская, Мурманская, Новгородская, Псковская области, Республики Карелия и Коми, г. Санкт-Петербург). Объем выборки по каждому региону составляет не менее 400 респондентов, что позволяет с высокой степенью достоверности (ошибка выборки не более 5% при вероятности 95%)4 судить о социокультурной обстановке в каждом субъекте СЗФО и осуществлять межрегиональные сопоставления (анкеты и база формировались с помощью SPSS). Социокультурные коэффициенты в зависимости от шкалы измерения были рассчитаны двумя способами:

  • 1.    Взвешенные средние баллы (18 коэффициентов):

    – коэффициент удовлетворенности (жизнью);

    – коэффициент уверенности;

    – коэффициент карьеризма;

    – коэффициент управления;

    – коэффициент ценностных предпочтений (14 ценностей: семья, порядок, общительность, жизнь человека, традиция, свобода, независимость, работа, инициативность, жертвенность, благополучие, нравственность, властность, своевольность) [5].

  • 2.    Доля респондентов, ответивших утвердительно (3 коэффициента):

    – коэффициент среднего слоя;

    – коэффициент новаторства.

    – коэффициент мобильности (коэффи-

  • циент соотношения между восходящей и нисходящей мобильностью) [9].

Модернизированность территории СЗФО рассчитывалась с помощью индекса вторичной модернизации (ВМ), вычисленного в Информационно-аналитической системе мониторинга параметров модернизации регионов России (ИС «Модернизация») [13], в соответствии с методологическими разработками Центра исследования социокультурных изменений Института философии РАН [7]. ВМ представляет собой тип модернизации, при котором осуществляется переход социальноэкономической системы в информационное общество, приоритетными становятся инновации, знания, производство высокотехнологичной продукции. Оцениваются четыре области: трансляция знаний, качество жизни, инновации в знаниях, качество экономики [14; 15].

С целью изучения социокультурных изменений в регионах России, обработки статистических и социологических данных и аналитической деятельности для дистанционного взаимодействия пользователей была разработана тестовая версия (на примере регионов Северо-Западного федерального округа) информационно-аналитической системы мониторинга социокультурного развития и уровней модернизации регионов России «Региональное исследование социокультурных изменений и модернизации» (ИС «РИСКиМ»).

Данная система обеспечивает возможность выполнения следующих основных функций:

– автоматизация расчета необходимых выборок;

– формирование отчетов в задаваемой форме;

– формированиекартосхем и графиков.

Сервисные функции:

– загрузка исходных данных из файловых источников формата xls;

– регистрация новых пользователей;

– редактирование списка регионов;

– редактирование списка индексов;

– редактирование списка коэффициентов.

Кроме того, ИС «РИСКиМ» имеет возможность расширения, т.е. дополнения списка переменных и функций.

Таблицы данных импортируются в файле формата xls, содержащем следующие сведения: год, названия индексов, коэффициентов, коды территорий, значения индексов, коэффициентов. Для работы с «РИСКиМ» созданы две категории пользователей:

– администратор системы (имеет полный доступ к функциональности и сервисным настройкам);

– пользователь (имеет право только на просмотр результатов обработки данных).

Надежное функционирование ИС «РИСКиМ» обеспечивается процедурой резервного копирования и восстановления информации базы данных после сбоев (вопросы резервного копирования и восстановления информации после сбоев решаются средствами системы управления базой данных (СУБД). ИС «РИСКиМ» разработана на основе технологии открытых систем, трехзвенной архитектуры клиент-сервера (рабочая станция Web-сервер СУБД) и на основе стандартов языка SQL.

ИС «РИСКиМ» позволяет определять тесноту и направление корреляционной связи между выбранными переменными, строить поле корреляции. Существует возможность построения кросстаблиц, которые дают наглядное представление о распределении территорий по уровням модернизиро-ванности и социокультурных характеристик населения.

Сложность социальных явлений приводит к затруднительному представлению смысловых идей о них. Так как модели, которые строятся для описания действительности, основываются на определенных методах анализа, то они зачастую бывают слишком приблизительны, и прогнозы не осуществляются. Часто построенные модели необъективны, поэтому исследователь может получить результаты, которые неудовлетворительно отражают действительность. Вслед- ствие этого он обязан периодически проверять, какая же модель лучше аппроксимирует изучаемое явление [8]. Поэтому процесс разработки основных идей модели в социологии занимает немало времени и требует скрупулезности от специалиста. Далее в статье мы опишем начальные шаги по поставленной проблеме. При этом лимитируем только основные аспекты, также заранее оговоримся, что это только стартовые шаги, а для состоятельного анализ требуется более глубокое изучение вопроса.

В первую очередь проанализируем поля корреляции. Среди построенных полей корреляции опишем случаи, когда можно сделать предварительный вывод о форме зависимости величин. Так, существует положительная (корреляционная) связь между индексом ВМ и коэффициентами мобильности, управления (рис. 1), удовлетворенности жизнью, уверенности и новатораства. Как правило, в регионах, где выше индекс ВМ, выше и мобильность населения, управляющая компонента.

Разнонаправленные векторы видим при соотнесении индекса ВМ с удовлетворенностью жизнью населения, уверенностью в будущем, новаторством (рис. 2). То есть регионы идут двумя путями модернизационного и социокультурного развития. Эта ситуация требует более глубокого и содержательного анализа (что не предусмотрено задачами данной статьи).

Среди построенных полей корреляции опишем случаи, когда можно сделать предварительный вывод о форме зависимости величин. Так, существует положительная связь между индексом ВМ и коэффициентами мобильности, управления, удовлетворенности жизнью, уверенности и новато-раства. Как правило, в регионах, где выше индекс ВМ, выше и мобильность населения, управляющая компонента.

Построение кросстаблиц с помощью «РИСКиМ» дает наглядность распределения регионов по группам. Так, анализируя рис. 3, отметим: чем выше уровень вторичной модернизации территории, тем выше

Иоффеце»*!

Ceiep*-3

Рис. 1. Скриншот информационно-аналитической системы «РИСКиМ» - поле корреляции индекса вторичной модернизации и коэффициента управления (регионы СЗФО, построение графиков)

Источник: Информационно-аналитическая система «РИСКиМ».

■ Республик Коля. 11

С диет Петербург. 78

Сееере-Здлддим! федеральный оерут. 201

Рис. 2. Скриншот информационно-аналитической системы «РИСКиМ» – поле корреляции индекса вторичной модернизации и коэффициента новаторства (регионы СЗФО, построение графиков)

Источник: Информационно-аналитическая система «РИСКиМ».

■ Иепередеке еблест». 53

структурная мобильность. Группу с низким уровнем мобильности и ниже среднего уровнем индекса ВМ составляют 4 региона Северо-Западного федерального округа (Калининградская, Новгородская, Вологодская и Псковская области), в основном это аграрно-промышленные территории. Данные депрессивные субъекты характеризуются более низкими, чем в среднем по стране, показателями социально-экономического развития, хотя у них и имеется достаточный уровень научно-технического потенциала и квалификации кадров. Однако снижение конкурентоспособности производимой на их территории продукции, истощение материальной базы, сдвиги в рыночной экономике ввели их в депрессивное состояние.

Следующая группа (добывающие регионы) – регионы со средним уровнем мобильности населения и индексом ВМ (Мурманская и Архангельская области, республики Коми и Карелия, а также СЗФО в целом). На эти территории так же, как и на предыду- щие, негативное влияние оказали последствия финансово-экономического кризиса, однако их результаты более успешно нивелированы.

Санкт-Петербург имеет высокие уровни по рассматриваемым показателям. Это объясняется концентрацией в городе производственно-технического и научного потенциала, а также исторически сформировавшимся приоритетом в финансовом, техническом и потребительском обеспечении. Из общей картины выбивается Ленинградская область, которая не вписывается в эту схему, имея уровень индекса ВМ ниже среднего и высокий коэффициент структурной мобильности. Последнее обеспечивается близостью города федерального значения, с помощью которого обеспечивается хорошая работа социальных лифтов в области.

В данной работе мы показали некоторые возможности применения компьютерных технологий в социологических исследованиях, в частности, при слиянии анализа статистических и социологических данных.

Рис. 3. Скриншот информационно-аналитической системы «РИСКиМ» – кросстаблица индекса вторичной модернизации и коэффициента структурной мобильности (регионы СЗФО, построение таблиц)

Источник: Информационно-аналитическая система «РИСКиМ».

К преимуществам внедрения ИКТ в социологические исследования можно отнести ускорение вычислений, массовый доступ к базам данных и программному обеспечению, совершенствование инструментального аппарата исследований.

В последнее время быстрое развитие информационных компьютерных технологий сильно повлияло на стиль и на методологию обработки данных, способствуя созданию и практическому использованию применяемого инструментария, разработке новых методик работы с информационной базой. Стоит отметить, что ИКТ обеспечивают исследователям более широкие возможности, такие как рост эффективности работы за счет быстроты обработки данных, систематическое накопление, хранение и передача, в том числе и по сети Интернет, любых массивов данных. Отметим также, что задача построения модели, соответствующей окружающей действительности, очень сложна. Формирование суждений, которые служат основными идеями измеряемых признаков, весьма сложно и требует постоянной корректировки.

Список литературы Автоматизация анализа и поиска статистических закономерностей в решении задач эмпирической социологии

  • Бистерфельд, О. А. Новая трактовка моделирования ресурсов данных в информационных системах /О. А. Бистерфельд//В мире научных открытий. -2014. -№ 10. -С. 41-49.
  • Джеева, Г. В. Сектор информационно-коммуникационных технологий России: история и перспективы развития /Г. В. Джеева//Новый университет. Серия «Экономика и право». -2012. -№ 1 (11). -С. 10-13. -Режим доступа: http://cyberleninka.ru/viewer_images/15624723/p/1.png
  • Ермолич, П. Сети 4G LTE и перспективы появления и развития сетей мобильной связи пятого поколения (5G) /П. Ермолич. -Режим доступа: http://json.tv/ict_telecom_analytics_view/seti-4g-lte-i-perspektivy-poyavleniya-i-razvitiya-setey-mobilnoy-svyazi-pyatogo-pokoleniya-5g
  • История развития ИТ . -Режим доступа: http://technologies.su
  • Лапин, Н. И. Программа и типовой инструментарий «Социокультурный портрет региона России» (Модификация -2010) /Н. И. Лапин, Л. А. Беляева//Рос. акад. наук, Ин-т философии. -М.: ИФРАН, 2010. -111 с.
  • Ласточкина, М. А. Развитие методологии и инструментария оценки модернизированности регионов России /М. А. Ласточкина//Проблемы развития территории. -2015. -№ 4 (78). -С. 69-79.
  • Проблемы социокультурной модернизации регионов России /сост. и общ. ред. Л. А. Беляевой, Н. И. Лапина. -Гл. 15. -М.: Academia, 2013. -416 с.
  • Толстова, Ю. Н. Анализ социологических данных. Методология, дескриптивная статистика, изучение связей между номинальными признаками /Ю. Н. Толстова. -М.: Научный мир, 2000. -352 с.
  • Шабунова, А. А. Социальная структура и мобильность в российском обществе /А. А. Шабунова, Т. С. Соловьева, М. А. Ласточкина; под научн. рук. д.э.н., проф. В. А. Ильина. -Вологда: ИСЭРТ РАН, 2015. -172 с.
  • Яхина, Е. П. Методы оценки информационных систем /Е. П. Яхина//В мире научных открытий. -2010. -№ 3-1. -С. 63-67.
  • Belousova, A. I. Study of problems organization of knowledge in the field of information technology /A. I. Belousova, D. A. Pavlov//International Journal of Advanced Studies. -Vol. 3. -№ 4 (2013). -P. 13-17.
  • Lastochkina, M. Development of the tools to assess the level of modernization of Russia's regions /M. Lastochkina//IJAS. -2015. -Vol. 5. -№ 3. -P. 85-89.
  • Lastochkina, M. Socio-cultural modernization of Vologda region /M. Lastochkina//Proceedings. -2013. -P. 88-94.
  • Research Group for China Modernization Report. China Modernization Report 2001: Modernization and Evaluation. -Beijing: Peking University Press, 2001.
  • Zhang, F. World Modernization Indexes 1950 to 2010 /F. Zhang, C. He//Proceedings. -2013. -P. 68-87.
Еще
Статья научная