Библиографический поиск в исследованиях брачного поведения

Автор: Зырянова А.Н.

Журнал: Форум молодых ученых @forum-nauka

Статья в выпуске: 12-2 (28), 2018 года.

Бесплатный доступ

В статье рассмотрены основные принципы и приёмы библиографического поиска, описан алгоритм работы с программой VosViewer для анализа библиографической информации на примере темы брачного поведения. В результате анализа были выделены возможности и ограничения онлайн-инструментов анализа библиографических данных.

Библиографический поиск, брачное поведение, сбор данных, поиск информации

Короткий адрес: https://sciup.org/140281075

IDR: 140281075

Текст научной статьи Библиографический поиск в исследованиях брачного поведения

Библиографический поиск представляет собой информационный отбор релевантных источников для достижения какой-либо цели, основывающийся на библиографических данных. К таким данным относят совокупность сведений, включаемых в библиографическое описание научного документа, которое отражает сведения об авторе, заголовке, месте издания, годе издания и т.д. [1]

К числу основных задач, для которых используется библиографический поиск, относится: поиск необходимых сведений о каком-либо источнике; поиск непосредственно информационных источников (научных статей, документов); поиск фактических сведений, содержащихся в этих источниках (факты, даты и другая информация). Все три вышеперечисленные цели необходимы для достижения в том числе при поиске научной информации для написания рефератов, научных статей, диссертаций.

Библиографический поиск осуществляется в 3 основных этапа:

  • I.    Поиск и отбор библиографических баз, которые представляют собой базы данных по научным публикациям, в которых обрабатываются библиографии работ, аннотации к ним и списки используемой литературы. На основании этой информации из баз данных формируются различные наукометрические показатели (цитируемость, индекс Хирша и т.д.). Основными базами данных подобной информации считаются РИНЦ, Scopus, Web of Science [2].

База данных Scopus (SciVerse Scopus) индексирует научные журналы, материалы конференций и сериальные книжные издания (всего около 18000 названий научных изданий по техническим, медицинским и гуманитарным наукам). Web of Science предоставляет возможность для отслеживания цитируемости статей, опубликованных в научных изданиях. Главное отличие от Scopus — широта и глубина охвата индексируемых источников (индексирует более 12000 журналов и 148000 материалов конференций в области естественных, общественных, гуманитарных наук). Российский индекс научного цитирования (РИНЦ) — включает более 4 млн. публикаций российских авторов, информацию о цитировании этих публикаций. База РИНЦ позволяет осуществлять оценку результативности и эффективности деятельности научноисследовательских организаций, авторов, уровень научных журналов и т.д.

  • II.    После выбранной (выбранных) библиографических баз необходимо определить способ отбора источников. Изначально исследователями выделялось три основных метода отбора источников:

  • 1.    Выборочный — просмотр библиографических источников, отобранных из общего массива на основании субъективного признака (основания).

  • 2.    Ограниченно сплошной — просмотр выделенной группы источников или определенного раздела.

  • 3.    Сплошной — полистный просмотр библиографических источников.

Также используются и общедисциплинарные методы:

  • 1.    Аналитико-синтетический метод — выделение значимых элементов библиографической информации, их анализ, терминологическая обработка (автор, название, год, издательство и т.д.).

  • 2.    Метод идеализации — объектом поиска выступает не сам документ, а его идеальный поисковый образ — мысленное представление о документе, отвечающее определенным поисковым характеристикам.

  • 3.    Ассоциация и актуализация — восстановление и выбор той информации об осуществленных ранее библиографических поисках, которая по ряду признаков имеет сходство с возникшей библиографической проблемой и может подсказать путь ее решения.

  • 4.    Инверсия — выделение и перемещение элементов библиографического описания, изменение порядка слов и словосочетаний, перестановка букв в слове (может применяться в случае искажения фамилий и пр.)

  • 5.    Категоризация — отнесение объекта библиографического поиска к некоторой группе документов по какому-либо признаку [3].

  • III.    Анализ полученных результатов. Для полноценного анализа необходимо использование алгоритмических методов, позволяющих работать сразу с большим количеством библиографического материала различных источников.

Одной из широкоиспользуемых программ для анализа информации подобного рода является инструмент VosViewer, который с помощью кластеризации позволяет отражать «библиометрические сети», или взаимосвязь авторов и их научных работ (журналов, статей и т.п.), на основе цитируемости их друг другом, а также отражать взаимосвязь использования ключевых терминов какой-либо области научной литературы [4].

Далее можно рассмотреть пример работы с программой для библиографического поиска по теме «Брачное поведение», который впоследствии может дать новую информацию об источниках знаний в этой области. К примеру, для написания научных работ в области социологии семьи и демографии, в частности брачного поведения, наиболее подходящими ключевыми категории выступят следующие термины: брачность, брак, брачное поведение, структура брачного поведения. С помощью этих терминов возможно осуществить сплошной и аналитикосинтетический метод библиографического поиска. В качестве библиографической базы будет использован ресурс Web of Science, который в отличие от РИНЦ предполагает содержание публикаций более высокого уровня (статуса), и который, в отличии от базы Scopus, располагает большим количеством материалов для анализа. В данной работе будут рассмотрен пример работы с программой и анализ полученных результатов на примере двух категорий: брак (marriage) и брачное поведение (marital behavior).

Для поисковых запросов «marriage» и «marital behavior» в системе Web of Science были установлены следующие критерии: публикации за последние 5 лет (желательны новые публикации по этой теме, новые и актуальные исследования); категории — исследования в области семьи («family studies») и социология («sociology»); а также критерий свободного доступа («all open access»).

В открытом доступе по запросу «marriage» оказалось 340 публикаций, чьи библиографические данные позволили с помощью VosViewer выделить 134 наиболее релевантные и часто встречающиеся категории, связи между ними, а также образованные в ходе анализа некоторые кластеры этих категорий. Для более удачного анализа выделенные категории были ограничены интервалом от 10 до 80 (3 в последствие исключены: article, way, idea), что составляет около 60% релевантных тем, необходимых для анализа, согласно рекомендациям VosViewer.

Наиболее часто встречающиеся категории в результате поискового запроса представлены на рис. 1. Данные таблицы позволяют говорить о релевантных запросу результатах. Преобладают такие термины как: жена, сожительство, муж, что соотносится и с индексом релевантности, который

Create Map

в      целом совпадает с рейтингом по упоминаний и соответствует жена, супруг, статус и т.д.

Verify selected terms

Selected

Term

Occurrences v

Relevance

0

transition

41

1.00

0'

spouse

33

2.24

0

'A' ife

28

2.67

10

cohabitation

28

0.76

(0

paper

28

0.35

0'

birth

27

0.49

(0

husband

26

2.76

10

interview

25

0.86

|0|

period

24

0.18

10

sex

23

1.33

10

quality

23

0.52

0'

trend

23

0.36

0

practice

23

0.32

0'

variation

22

1.19

0

adulthood

22

1.10

01

attitude

22

0.21

0

intervention

21

1.54

1

( < Back ] Next >  [j Finish j [ Cancel ]

частоте ему: муж, брачный

(рис. 1).

Рисунок 1. Частота и релевантность категорий в поисковом запросе «Marriage»

На рис. 2 представлена визуализация взаимосвязи терминов, отобранных в результате кластеризации и создания библиометрических сетей VosViewer, что позволило программно выделить 4 кластера: 1) обобщенные термины, связанные с демографией (фертильность, образование, развод, семья, условия и т.д.); 2) термины, связанные непосредственно с семьей и браком на микроуровне (пара, отношения, партнер, муж,

youth parenthood adulthood romantic ^Uti о г similarity increase majority first marriage period int^yle’i educati perception condition spouse country

JttiWde birth society paper transition m6®ure couple partner divorce W intervention husband quality violence understanding sex couple sex sex marriage b

Рисунок 2. поискового запроса «Marriage» по терминам

конфликт и т.д.); 3) социальные факторы (установки, мнения, религия и т.д.); 4) малый кластер, включающий, на наш взгляд, термины, не вошедшие в другие кластеры (молодёжь, прибавление, национальные исследования, совершеннолетие и т.д.).

Поисковый запрос «Marriage» с теми же критериями (кроме диапазона значений — от 10 до 41, устанавливаемых программой) и условиями по авторам публикаций отражает связи основных исследователей по этой теме и цитируемость их другими авторами (рис.3). К примеру, в данном случае наиболее включенным в процесс цитирования является Г. Эспинг-Андерсон («Повторная теоретизация демографии семьи»), чья статья теоретического характера (теории фаз брака и снижения рождаемости) способна вызвать обсуждения и дополнения со стороны научного сообщества. Аналогичный вывод можно распространить и относительно второго по цитируемости автора в рамках этого запроса — Вэнди Д. Мэннинг, которая основывает свои научные выводы, используя национальный обзор роста семьи.

Анализируя предложенные программой варианты решений (связи и кластеры), стоит отметить, что несмотря на некоторые возможные

Create Map

/vf\-: Verify selected terms

Selected                   Term                  Occurrencesv      Relevance

0

couple

71

0.51

a

family

69

0.54

9

parent

55

0.73

a

context

55

0.26

9

mother

52

0.47

0

disease

45

1.20

9

symptom

43

0.41

0

physical activity

39

1.36

9

confidence interval

39

1.33

V

adolescent

38

0.74

9

marriage

37

0.48

®

odds ratio

36

1.54

9

process

36

0.42

V

hiv

34

1.51

9

implication

34

0.28

01

conflict

33

0.90

9

logistic regression model

31

1.06

[ < Back | | Next > | [i Finish j] [ Cancel [

Selected

Term

Occurrences

Relevance v

9

diabete

13

3.28 |p|

0

hypertension

12

3,26

9

diabetes

13

2.57 |

0

chronic disease

22

2.39 U

9

hiv infection

12

2.31

0

health status

25

2.05

9

suicide attempt

11

2.04

0

condom use

14

1.84

9

hiv aids

12

1.71

0'

higher odd

14

1.70

9

condom

14

1.61

0,

odds ratio

36

1.54

9

south africa

11

1.52

0

hiv

34

1.51

9

smoker

22

1.49

1.44

0

children

13

a

category

18

1.37

espmg-.

неточности, связанные со спецификой английского языка и спецификой терминов зарубежной социологии семьи и демографии, — обнаруженные би бл

Рисунок 3. Визуализация поискового запроса «Marriage» по авторам иографические сведения будут полезны и применимы для написания собственных научных работ, учитывая тот факт, что большинство авторов и их работ не были известны нам за время исследования и изучения данной предметной области.

Следующим поисковым запросом была категория «Marital behavior», что более точно отражает искомую информацию по теме. Всего по этому запросу в Web of Science было выдано 2597 публикаций, 1002 из них — в открытом доступе. По функционалу ресурса было скачало 500 файлов с библиографическими данными (авторы, названия, аннотация). Анализ в программе VosViewer был осуществлен на терминах, количество которых было ограничено диапазоном с 10 до 80, как и в предыдущем случае, что

Рисунок 4. Количество цитирований терминов и их релевантность при поисковом запросе

«Marital behavior»

связано с возможностью более удобного анализа и читабельной визуализации. Интересно, что ранжированные термины по количеству цитирований, на наш взгляд, наиболее релевантны запросу, нежели ранжирование категорий по релевантности, предлагаемое программой (рис. 4). Если в первом случае в топ-листе находятся такие категории как: пара, семья, родители, cвязь и т.д.), то во втором — диабет, гипертония, хронические заболевания и т.д., что напрямую не связано с темой поиска.

Алгоритмическая кластеризация терминов (рис. 5) подтвердила существование нескольких тем в полученных ключевых категориях: 1) первый кластер включает в основном такие понятия как: болезнь, ожирение, курение, статус здоровья и т.п.; 2) второй кластер включает термины, связанные с семьей: мать, отец, конфликт, дети, родители и т.д.; 3) третий кластер включат в большинстве понятия, связанные с браком:

му ж, же на, раз во д, па ра, бр ач ны е

отношения и др.; 4) четвертый кластер включат понятия, связанные со здоровьем и безопасностью в отношениях: ВИЧ, презерватив, инфекция и т.д.

Наибольшим «ссылочным весом» обладают термины «пара» и

«семья», относящиеся разным кластерам, тесто связанные между собой, при этом связи с последним кластером о здоровье и безопасности достаточно слабы, как и с кластером №3. С одной стороны, это подтверждает наше мнение о недостаточной точности результатов поиска и выявление малорелевантных категорий брачному поведению, но с другой стороны — программа учитывает это и выделяет 2 кластера, очевидно отдаленных от двух основных с помощью визуальной составляющей. На наш взгляд, в этом оказывается преимущество данной программы: отображать всевозможные связи с различными областями и темами, на первый взгляд неподходящими запросу, но делать акцент на непрочности этих связей в визуальной части анализа.

Далее был произведен анализ по авторам в рамках поискового запроса «Marital behavior» (в критериях было установлено до 80 авторов для более компактного и точного анализа). Исходя из полученной визуализации (рис. 6), очевидна непрочная и нетесная связь с Дж. Кэрролл, опубликовавшей работу в области медицины (или, возможно, социологии здоровья) о массе тела и диетических нормах. «Связующим звеном» между темой здоровья и брачного поведения являются такие авторы, как С. Кеннет, совмещающие в своих публикациях эти две темы (к примеру, статья «Влияние брака на риск возникновения расстройства употребления алкоголя»).

Дж. Лавнер, согласно представленной визуализации, имеет наибольшее количество статей, релевантных поисковому запросу, при этом имеет малое количество связей с другими авторами, что говорит о низкой вовлеченности в процесс цитирования (других — цитирует мало). Остальные авторы, не выделенные большими окружностями, наоборот — имеют большое количество связей с популярными авторами, что отражает высокую долю преемственности и цитирований этих «крупных» авторов. Исходя из этой визуализации можно понять, кто является основным исследователем в области брачного поведения, чьи работы обязательны к ________________________________________________________________ ФОРУМ МОЛОДЫХ .УЧЕНЫХ №12(28) !и 120,6)       forum-nauka.ru ознакомлению, а также увидеть фамилии последователей или критиков этих авторов.

При осуществлении анализа результатов библиографического поиска были выделены следующие сложности:

  • 1.    Специальная подготовка для работы с базой библиографических данных: из всех поддерживаемых свободной программой баз наиболее знакомой и понятной оказалась только база Web of Science, доступ к которой возможно получить только в «партнёрских» организациях, в том числе в университете, что может создавать некоторые трудности с получением своевременной и актуальной информацией. Стоит отметить, что ресурс предполагает домашнюю авторизацию в течение некоторого времени после регистрации и авторизации в университете, что является несомненным достоинством.

  • 2.    Изучение и освоение инструментов программы для анализа библиографических данных. Для наиболее точной настройки результатов поиска необходимо было изучение дополнительной литературы и видео. Интерпретация визуальной части анализа также не являлась возможной без опоры на содержащие такой анализ работы.

  • 3.    Сложность интерпретации выделенных программой кластеров, которые либо ввиду многозначной англоязычной терминологии были искажены своим разнородным наполнением, либо их внутренне наполнение действительно не имело общей смысловой нагрузки между собой.

  • 4.    Сложность адаптации русских терминов на английский язык – возможны специфические термины или особые названия тех или иных процессов, которые могут в некоторой степени искажать смысл. К примеру – брачное поведение адаптируется на английский язык не как «marriage

behavior», а как «marital behavior», что дословно означает семейное поведение, которое в русской терминологии означает более широкую категорию, включающую в себя само брачное поведение как разновидность. Именно поэтому в большинстве нельзя рассчитывать на «легкий и быстрый» анализ библиографической информации – необходима заблаговременная и тщательная подготовка к релевантному переводу ключевых категорий.

К числу достоинств можно отнести получение абсолютно нового и полезного знания о существовании тех или иных работ высокого уровня и их авторов; визуального отражения (взаимо-)цитирования, связей между работами и авторами; более комплексного анализа поискового запроса, включающего не только непосредственную область изучаемого предмета, но и смежные с другими отраслями исследования.

Список литературы Библиографический поиск в исследованиях брачного поведения

  • Библиографическое описание документа (по ГОСТам 7.80-2000, 7.1-2003 и 7.82-2001) // Государственное бюджетное учреждение культуры «Амурская областная научная библиотека имени Н.Н. Муравьева-Амурского». URL: www.libamur.ru/sites/libamur/files/ bo.rtf (дата обращения: 15.09.2018).
  • Библиографические и реферативные базы данных РИНЦ, Scopus и Web of Science // РАНХиГС. В помощь исследователю. URL: http://zf.ranepa.ru/nauka/issled_help/bibl_ref_ DB.php (дата обращения: 15.09.2018).
  • Галанцева Е.И. Методы библиографического поиска в справочно-библиографическом обслуживании // ПОУНБ. URL: http://pskovlib.ru/about/reports /texts/20464 (дата обращения: 10.09.2018).
  • Vosviewer. Highlights. URL: http://www.vosviewer.com/ (дата обращения: 15.09.2018).
Статья научная