Библиографический поиск в исследованиях брачного поведения
Автор: Зырянова А.Н.
Журнал: Форум молодых ученых @forum-nauka
Статья в выпуске: 12-2 (28), 2018 года.
Бесплатный доступ
В статье рассмотрены основные принципы и приёмы библиографического поиска, описан алгоритм работы с программой VosViewer для анализа библиографической информации на примере темы брачного поведения. В результате анализа были выделены возможности и ограничения онлайн-инструментов анализа библиографических данных.
Библиографический поиск, брачное поведение, сбор данных, поиск информации
Короткий адрес: https://sciup.org/140281075
IDR: 140281075
Текст научной статьи Библиографический поиск в исследованиях брачного поведения
Библиографический поиск представляет собой информационный отбор релевантных источников для достижения какой-либо цели, основывающийся на библиографических данных. К таким данным относят совокупность сведений, включаемых в библиографическое описание научного документа, которое отражает сведения об авторе, заголовке, месте издания, годе издания и т.д. [1]
К числу основных задач, для которых используется библиографический поиск, относится: поиск необходимых сведений о каком-либо источнике; поиск непосредственно информационных источников (научных статей, документов); поиск фактических сведений, содержащихся в этих источниках (факты, даты и другая информация). Все три вышеперечисленные цели необходимы для достижения в том числе при поиске научной информации для написания рефератов, научных статей, диссертаций.
Библиографический поиск осуществляется в 3 основных этапа:
-
I. Поиск и отбор библиографических баз, которые представляют собой базы данных по научным публикациям, в которых обрабатываются библиографии работ, аннотации к ним и списки используемой литературы. На основании этой информации из баз данных формируются различные наукометрические показатели (цитируемость, индекс Хирша и т.д.). Основными базами данных подобной информации считаются РИНЦ, Scopus, Web of Science [2].
База данных Scopus (SciVerse Scopus) индексирует научные журналы, материалы конференций и сериальные книжные издания (всего около 18000 названий научных изданий по техническим, медицинским и гуманитарным наукам). Web of Science предоставляет возможность для отслеживания цитируемости статей, опубликованных в научных изданиях. Главное отличие от Scopus — широта и глубина охвата индексируемых источников (индексирует более 12000 журналов и 148000 материалов конференций в области естественных, общественных, гуманитарных наук). Российский индекс научного цитирования (РИНЦ) — включает более 4 млн. публикаций российских авторов, информацию о цитировании этих публикаций. База РИНЦ позволяет осуществлять оценку результативности и эффективности деятельности научноисследовательских организаций, авторов, уровень научных журналов и т.д.
-
II. После выбранной (выбранных) библиографических баз необходимо определить способ отбора источников. Изначально исследователями выделялось три основных метода отбора источников:
-
1. Выборочный — просмотр библиографических источников, отобранных из общего массива на основании субъективного признака (основания).
-
2. Ограниченно сплошной — просмотр выделенной группы источников или определенного раздела.
-
3. Сплошной — полистный просмотр библиографических источников.
Также используются и общедисциплинарные методы:
-
1. Аналитико-синтетический метод — выделение значимых элементов библиографической информации, их анализ, терминологическая обработка (автор, название, год, издательство и т.д.).
-
2. Метод идеализации — объектом поиска выступает не сам документ, а его идеальный поисковый образ — мысленное представление о документе, отвечающее определенным поисковым характеристикам.
-
3. Ассоциация и актуализация — восстановление и выбор той информации об осуществленных ранее библиографических поисках, которая по ряду признаков имеет сходство с возникшей библиографической проблемой и может подсказать путь ее решения.
-
4. Инверсия — выделение и перемещение элементов библиографического описания, изменение порядка слов и словосочетаний, перестановка букв в слове (может применяться в случае искажения фамилий и пр.)
-
5. Категоризация — отнесение объекта библиографического поиска к некоторой группе документов по какому-либо признаку [3].
-
III. Анализ полученных результатов. Для полноценного анализа необходимо использование алгоритмических методов, позволяющих работать сразу с большим количеством библиографического материала различных источников.
Одной из широкоиспользуемых программ для анализа информации подобного рода является инструмент VosViewer, который с помощью кластеризации позволяет отражать «библиометрические сети», или взаимосвязь авторов и их научных работ (журналов, статей и т.п.), на основе цитируемости их друг другом, а также отражать взаимосвязь использования ключевых терминов какой-либо области научной литературы [4].
Далее можно рассмотреть пример работы с программой для библиографического поиска по теме «Брачное поведение», который впоследствии может дать новую информацию об источниках знаний в этой области. К примеру, для написания научных работ в области социологии семьи и демографии, в частности брачного поведения, наиболее подходящими ключевыми категории выступят следующие термины: брачность, брак, брачное поведение, структура брачного поведения. С помощью этих терминов возможно осуществить сплошной и аналитикосинтетический метод библиографического поиска. В качестве библиографической базы будет использован ресурс Web of Science, который в отличие от РИНЦ предполагает содержание публикаций более высокого уровня (статуса), и который, в отличии от базы Scopus, располагает большим количеством материалов для анализа. В данной работе будут рассмотрен пример работы с программой и анализ полученных результатов на примере двух категорий: брак (marriage) и брачное поведение (marital behavior).
Для поисковых запросов «marriage» и «marital behavior» в системе Web of Science были установлены следующие критерии: публикации за последние 5 лет (желательны новые публикации по этой теме, новые и актуальные исследования); категории — исследования в области семьи («family studies») и социология («sociology»); а также критерий свободного доступа («all open access»).
В открытом доступе по запросу «marriage» оказалось 340 публикаций, чьи библиографические данные позволили с помощью VosViewer выделить 134 наиболее релевантные и часто встречающиеся категории, связи между ними, а также образованные в ходе анализа некоторые кластеры этих категорий. Для более удачного анализа выделенные категории были ограничены интервалом от 10 до 80 (3 в последствие исключены: article, way, idea), что составляет около 60% релевантных тем, необходимых для анализа, согласно рекомендациям VosViewer.
Наиболее часто встречающиеся категории в результате поискового запроса представлены на рис. 1. Данные таблицы позволяют говорить о релевантных запросу результатах. Преобладают такие термины как: жена, сожительство, муж, что соотносится и с индексом релевантности, который
Create Map
в целом совпадает с рейтингом по упоминаний и соответствует жена, супруг, статус и т.д.
Verify selected terms
Selected |
Term |
Occurrences v |
Relevance |
|
0 |
transition |
41 |
1.00 |
|
0' |
spouse |
33 |
2.24 |
|
0 |
'A' ife |
28 |
2.67 |
|
10 |
cohabitation |
28 |
0.76 |
|
(0 |
paper |
28 |
0.35 |
|
0' |
birth |
27 |
0.49 |
|
(0 |
husband |
26 |
2.76 |
|
10 |
interview |
25 |
0.86 |
|
|0| |
period |
24 |
0.18 |
|
10 |
sex |
23 |
1.33 |
|
10 |
quality |
23 |
0.52 |
|
0' |
trend |
23 |
0.36 |
|
0 |
practice |
23 |
0.32 |
|
0' |
variation |
22 |
1.19 |
|
0 |
adulthood |
22 |
1.10 |
|
01 |
attitude |
22 |
0.21 |
|
0 |
intervention |
21 |
1.54 |
|
1 |
( < Back ] Next > [j Finish j [ Cancel ]
частоте ему: муж, брачный
(рис. 1).
Рисунок 1. Частота и релевантность категорий в поисковом запросе «Marriage»
На рис. 2 представлена визуализация взаимосвязи терминов, отобранных в результате кластеризации и создания библиометрических сетей VosViewer, что позволило программно выделить 4 кластера: 1) обобщенные термины, связанные с демографией (фертильность, образование, развод, семья, условия и т.д.); 2) термины, связанные непосредственно с семьей и браком на микроуровне (пара, отношения, партнер, муж,

youth parenthood adulthood romantic ^Uti о г similarity increase majority first marriage period int^yle’i educati perception condition spouse country
JttiWde birth society paper transition m6®ure couple partner divorce W intervention husband quality violence understanding sex couple sex sex marriage b Рисунок 2. поискового запроса «Marriage» по терминам конфликт и т.д.); 3) социальные факторы (установки, мнения, религия и т.д.); 4) малый кластер, включающий, на наш взгляд, термины, не вошедшие в другие кластеры (молодёжь, прибавление, национальные исследования, совершеннолетие и т.д.). Поисковый запрос «Marriage» с теми же критериями (кроме диапазона значений — от 10 до 41, устанавливаемых программой) и условиями по авторам публикаций отражает связи основных исследователей по этой теме и цитируемость их другими авторами (рис.3). К примеру, в данном случае наиболее включенным в процесс цитирования является Г. Эспинг-Андерсон («Повторная теоретизация демографии семьи»), чья статья теоретического характера (теории фаз брака и снижения рождаемости) способна вызвать обсуждения и дополнения со стороны научного сообщества. Аналогичный вывод можно распространить и относительно второго по цитируемости автора в рамках этого запроса — Вэнди Д. Мэннинг, которая основывает свои научные выводы, используя национальный обзор роста семьи. Анализируя предложенные программой варианты решений (связи и кластеры), стоит отметить, что несмотря на некоторые возможные Create Map /vf\-: Verify selected terms Selected Term Occurrencesv Relevance 0 couple 71 0.51 a family 69 0.54 9 parent 55 0.73 a context 55 0.26 9 mother 52 0.47 0 disease 45 1.20 9 symptom 43 0.41 0 physical activity 39 1.36 9 confidence interval 39 1.33 V adolescent 38 0.74 9 marriage 37 0.48 ® odds ratio 36 1.54 9 process 36 0.42 V hiv 34 1.51 9 implication 34 0.28 01 conflict 33 0.90 9 logistic regression model 31 1.06 [ < Back | | Next > | [i Finish j] [ Cancel [ Selected Term Occurrences Relevance v 9 diabete 13 3.28 |p| 0 hypertension 12 3,26 9 diabetes 13 2.57 | 0 chronic disease 22 2.39 U 9 hiv infection 12 2.31 0 health status 25 2.05 9 suicide attempt 11 2.04 0 condom use 14 1.84 9 hiv aids 12 1.71 0' higher odd 14 1.70 9 condom 14 1.61 0, odds ratio 36 1.54 9 south africa 11 1.52 0 hiv 34 1.51 9 smoker 22 1.49 1.44 0 children 13 a category 18 1.37 espmg-. неточности, связанные со спецификой английского языка и спецификой терминов зарубежной социологии семьи и демографии, — обнаруженные би бл Рисунок 3. Визуализация поискового запроса «Marriage» по авторам иографические сведения будут полезны и применимы для написания собственных научных работ, учитывая тот факт, что большинство авторов и их работ не были известны нам за время исследования и изучения данной предметной области. Следующим поисковым запросом была категория «Marital behavior», что более точно отражает искомую информацию по теме. Всего по этому запросу в Web of Science было выдано 2597 публикаций, 1002 из них — в открытом доступе. По функционалу ресурса было скачало 500 файлов с библиографическими данными (авторы, названия, аннотация). Анализ в программе VosViewer был осуществлен на терминах, количество которых было ограничено диапазоном с 10 до 80, как и в предыдущем случае, что Рисунок 4. Количество цитирований терминов и их релевантность при поисковом запросе «Marital behavior» связано с возможностью более удобного анализа и читабельной визуализации. Интересно, что ранжированные термины по количеству цитирований, на наш взгляд, наиболее релевантны запросу, нежели ранжирование категорий по релевантности, предлагаемое программой (рис. 4). Если в первом случае в топ-листе находятся такие категории как: пара, семья, родители, cвязь и т.д.), то во втором — диабет, гипертония, хронические заболевания и т.д., что напрямую не связано с темой поиска. Алгоритмическая кластеризация терминов (рис. 5) подтвердила существование нескольких тем в полученных ключевых категориях: 1) первый кластер включает в основном такие понятия как: болезнь, ожирение, курение, статус здоровья и т.п.; 2) второй кластер включает термины, связанные с семьей: мать, отец, конфликт, дети, родители и т.д.; 3) третий кластер включат в большинстве понятия, связанные с браком: му ж, же на, раз во д, па ра, бр ач ны е отношения и др.; 4) четвертый кластер включат понятия, связанные со здоровьем и безопасностью в отношениях: ВИЧ, презерватив, инфекция и т.д. Наибольшим «ссылочным весом» обладают термины «пара» и «семья», относящиеся разным кластерам, тесто связанные между собой, при этом связи с последним кластером о здоровье и безопасности достаточно слабы, как и с кластером №3. С одной стороны, это подтверждает наше мнение о недостаточной точности результатов поиска и выявление малорелевантных категорий брачному поведению, но с другой стороны — программа учитывает это и выделяет 2 кластера, очевидно отдаленных от двух основных с помощью визуальной составляющей. На наш взгляд, в этом оказывается преимущество данной программы: отображать всевозможные связи с различными областями и темами, на первый взгляд неподходящими запросу, но делать акцент на непрочности этих связей в визуальной части анализа. Далее был произведен анализ по авторам в рамках поискового запроса «Marital behavior» (в критериях было установлено до 80 авторов для более компактного и точного анализа). Исходя из полученной визуализации (рис. 6), очевидна непрочная и нетесная связь с Дж. Кэрролл, опубликовавшей работу в области медицины (или, возможно, социологии здоровья) о массе тела и диетических нормах. «Связующим звеном» между темой здоровья и брачного поведения являются такие авторы, как С. Кеннет, совмещающие в своих публикациях эти две темы (к примеру, статья «Влияние брака на риск возникновения расстройства употребления алкоголя»). Дж. Лавнер, согласно представленной визуализации, имеет наибольшее количество статей, релевантных поисковому запросу, при этом имеет малое количество связей с другими авторами, что говорит о низкой вовлеченности в процесс цитирования (других — цитирует мало). Остальные авторы, не выделенные большими окружностями, наоборот — имеют большое количество связей с популярными авторами, что отражает высокую долю преемственности и цитирований этих «крупных» авторов. Исходя из этой визуализации можно понять, кто является основным исследователем в области брачного поведения, чьи работы обязательны к ________________________________________________________________ ФОРУМ МОЛОДЫХ .УЧЕНЫХ №12(28) !и 120,6) forum-nauka.ru ознакомлению, а также увидеть фамилии последователей или критиков этих авторов. При осуществлении анализа результатов библиографического поиска были выделены следующие сложности: 1. Специальная подготовка для работы с базой библиографических данных: из всех поддерживаемых свободной программой баз наиболее знакомой и понятной оказалась только база Web of Science, доступ к которой возможно получить только в «партнёрских» организациях, в том числе в университете, что может создавать некоторые трудности с получением своевременной и актуальной информацией. Стоит отметить, что ресурс предполагает домашнюю авторизацию в течение некоторого времени после регистрации и авторизации в университете, что является несомненным достоинством. 2. Изучение и освоение инструментов программы для анализа библиографических данных. Для наиболее точной настройки результатов поиска необходимо было изучение дополнительной литературы и видео. Интерпретация визуальной части анализа также не являлась возможной без опоры на содержащие такой анализ работы. 3. Сложность интерпретации выделенных программой кластеров, которые либо ввиду многозначной англоязычной терминологии были искажены своим разнородным наполнением, либо их внутренне наполнение действительно не имело общей смысловой нагрузки между собой. 4. Сложность адаптации русских терминов на английский язык – возможны специфические термины или особые названия тех или иных процессов, которые могут в некоторой степени искажать смысл. К примеру – брачное поведение адаптируется на английский язык не как «marriage behavior», а как «marital behavior», что дословно означает семейное поведение, которое в русской терминологии означает более широкую категорию, включающую в себя само брачное поведение как разновидность. Именно поэтому в большинстве нельзя рассчитывать на «легкий и быстрый» анализ библиографической информации – необходима заблаговременная и тщательная подготовка к релевантному переводу ключевых категорий. К числу достоинств можно отнести получение абсолютно нового и полезного знания о существовании тех или иных работ высокого уровня и их авторов; визуального отражения (взаимо-)цитирования, связей между работами и авторами; более комплексного анализа поискового запроса, включающего не только непосредственную область изучаемого предмета, но и смежные с другими отраслями исследования.
Список литературы Библиографический поиск в исследованиях брачного поведения
- Библиографическое описание документа (по ГОСТам 7.80-2000, 7.1-2003 и 7.82-2001) // Государственное бюджетное учреждение культуры «Амурская областная научная библиотека имени Н.Н. Муравьева-Амурского». URL: www.libamur.ru/sites/libamur/files/ bo.rtf (дата обращения: 15.09.2018).
- Библиографические и реферативные базы данных РИНЦ, Scopus и Web of Science // РАНХиГС. В помощь исследователю. URL: http://zf.ranepa.ru/nauka/issled_help/bibl_ref_ DB.php (дата обращения: 15.09.2018).
- Галанцева Е.И. Методы библиографического поиска в справочно-библиографическом обслуживании // ПОУНБ. URL: http://pskovlib.ru/about/reports /texts/20464 (дата обращения: 10.09.2018).
- Vosviewer. Highlights. URL: http://www.vosviewer.com/ (дата обращения: 15.09.2018).