Особенности индексирования документов в OPAC-Global: проблемы и возможности
Автор: Соколова Ж.В.
Журнал: Культура: теория и практика @theoryofculture
Рубрика: Научные коммуникации и информационно-аналитическое обеспечение науки
Статья в выпуске: 1 (56), 2024 года.
Бесплатный доступ
Рассматриваются особенности индексирования документов по проблематике агропромышленного комплекса с использованием информационно-поисковых языков: Информационно-поискового тезауруса, Отраслевого рубрикатора по сельскому хозяйству и продовольствию, Универсальной десятичной классификации и языка ключевых слов в автоматизированной информационно-библиотечной системе OPAC-Global, позволяющей создавать библиографические записи в формате RUSMARC. Приводятся описание полей формата и особенности их заполнения в процессе индексирования документов на конкретных примерах. Освещаются преимущества и недостатки системы OPAC-Global при использовании в работе индексатора.
Апк, обработка информации, индексирование, информационно-поисковые языки, автоматизированные системы, информационные системы, цнсхб
Короткий адрес: https://sciup.org/144162953
IDR: 144162953
Текст научной статьи Особенности индексирования документов в OPAC-Global: проблемы и возможности
НАУЧНЫЕ КОММУНИКАЦИИ И ИНФОРМАЦИОННОАНАЛИТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ НАУКИ. СОКОЛОВА Ж.В. ОСОБЕННОСТИ ИНДЕКСИРОВАНИЯ ДОКУМЕНТОВ В OPAC-GLOBAL: ПРОБЛЕМЫ И ВОЗМОЖНОСТИ
Введение. Автоматизированная библиотечно-информационная система (АБИС) обеспечивает функционирование библиотеки в современных условиях. Она включает электронные информационные ресурсы, программные и лингвистические средства их обработки, формирования, структурирования и поиска в них. Программные средства АБИС обеспечивают все технологические процессы библиотеки. Поэтому АБИС объединяет в себе функции автоматизированной системы для управления работой библиотеки и инструменты для создания информационных ресурсов и организации доступа к ним. Наличие АБИС является сегодня обязательным условием продуктивной работы библиотеки, а умение работы в АБИС стало неотъемлемой частью списка профессиональных компетенций библиотечного специалиста [1]. С 2023 г. Федеральное государственное бюджетное научное учреждения «Центральная научная сельскохозяйственная библиотека» (ЦНСХБ) перешла с программных средств АБИС собственной разработки на единую платформу на основе веб-технологий – АБИС OPAC-Global. АБИС OPAC-Global предназначена для создания «Электронных библиотек без границ» за счет предоставления пользователям Интернет собственных и импортируемых информационных ресурсов через стандартные браузеры в системе национальных форматов RUSMARC на основе гибкой системы санкционированного доступа. Система позволяет осуществлять каталогизацию документов в режиме реального времени, использовать национальные и собственные авторитетные и справочные файлы в качестве информационно-поисковых языков (ИПЯ) в единой программной среде, создавать массивы полнотекстовых цифровых документов, поиск которых возможен через поиск связанных с ними библиографических записей, осуществлять электронную доставку документов [4].
В ЦНСХБ была проведена работа по внедрению и адаптации АБИС OPAC-Global к технологическим процессам библиотеки. Хотелось бы остановиться на одном их них – индексировании документов.
Целью исследования является анализ особенностей индексирования документов по проблематике АПК в АБИС ЦНСХБ OPAC-Global.
Отделом Аналитико-синтетической обработки документов и поддержки лингвистических средств осуществляется семантическая обработка документов по проблематике АПК, заключающаяся в научном анализе и оценке, отборе, сопоставлении, обобщении и преобразовании наиболее ценной информации в более сжатые формы. В процессе аналитикосинтетической обработки документа происходит раскрытие его смыслового содержания и свертывание информации, содержащейся в нем, до аннотации и/или реферата на русском языке, перевод информации с естественного языка на ИПЯ.
Библиографические записи создаются в Российском коммуникативном формате представления библиографических записей в машиночитаемой форме (RUSMARC) [6]. Используемый формат определяет содержание, форму и структуру записи.
Существующая в ЦНСХБ технология раздельного ввода информации о документе (создание библиографической записи) сотрудниками разных подразделений библиотеки включена и адаптирована в АБИС OPAC-Global. Если ранее создание библиографической записи на книги и статьи происходило в разных автоматизированных программах (на книги – в MARC SQL, а на статьи – в автоматизированной системе АСАРД на программных средствах собственной разработки), то в АБИС OPAC-Global это происходит на единых программных средствах.
После всестороннего анализа документа (статьи из журнала или сборника, книги) индексатором необходимо перейти к заполнению полей формата, раскрывающего его содержание. В АБИС OPAC-Global для этого нужно перейти в модуль «Каталогизация» и осуществить поиск нужного документа любым удобным способом: по штрих-коду, шифру хранения, инвентарному номеру, заглавию и т. д. (рисунок 1, 2).
После нахождения необходимого документа, например, статьи из журнала, переход в него осуществляется после активации кнопки Редактировать (рисунок 3).
Для дальнейшей работы со статьей необходимо ее локализовать, чтобы добавить необходимые для заполнения поля формата (рисунок 4).

Рисунок 1 - Поиск документа в модуле «Каталогизация»

Рисунок 2 - Результат поиска в модуле «Каталогизация»

Рисунок 3 – Выбор конкретной статьи

Рисунок 4 - Добавление полей формата
Остановимся подробнее на полях формата RUSMARC, которые необходимо заполнить. Для раскрытия смыслового содержания документа используются маркеры записей: 3- Блок примечаний, 6 - Блок анализа содержания и библиографической истории. Маркер записей 9 - Блок локального использования - для служебных пометок.
Поле 330 Резюме или реферат может содержать текст аннотации или реферата к данному ресурсу, является факультативным, повторяющимся, если, например, необходимо привести реферат на разных языках. Имеет подполя $a Текст примечания , $8 Язык текста ( для рефератов ) , $9 Реферат .
„ =|@|
Проиллюстрируем заполнение поля 330 на примере (рисунок © OPAC-Global X Ж X | 0 Формат R.USMARC представления X | М Статья - blackdahlia6419@gmail.K X +
Чтобы обновлять Google Chrome, нужна Windows 10 или более поздней версии. У вас установлена Windows 7.
XI
I
I
I
I
Редактирование записи
База данных: Необработанные статьи
Уровень готовности: Незаконченный
Идентификатор: CNSHB-ARTICLE-0000013299-5-2023-27-7
Лист ввода: Статья
Маркер: 00000паа2 220000031450
Слить ▼ Просмотр БК Закрыть
Записать Локализовать Проверить Поля
101 |
0 |
# |
$arus$deng |
200 |
1 |
# |
ЖаВлияние применения фосфорного удобрения на варьирование прибавок урожайности сельскохозяйственных культур в условиях Заура лья$£Волынкина О .В. |
300 |
# |
# |
ЖаРез. рус., англ. |
320 |
# |
# |
ЖаБиблиогр.: с. |
$а $6 $7 $8 $9 |
|||
330 |
[-^ |
$аИсследования в зернопропашном севообороте |
|
461 |
# |
0 |
$ 100001284nasl 22004091 450 $1001П2627$1011##$а0002-1881$12001#$аАгрохимия$1899#ЛаЦНСХБ$Ц12627 |
463 |
0 |
$100000000пат2 220000031450 S1001CNSHB-BIBL-0000013299$12000#$aN5$vC. 27$1210##$d2023$1899##$p04233069$1899##$p04233093 |
|
600 |
* |
0 |
Г ZL |
en н ® & ^ в а р ® ф 02^24 *
Рисунок 5 – Заполнение поля 330
В данном случае в поле 330 добавляется краткая аннотация для уточнения некоторых аспектов документа. При индексировании документов на иностранных языках аннотация на русском языке обязательна, так как помогает пользователю понять основное содержание работы, а также дает дополнительные возможности для поиска.
Поле 600 Имя лица как предмет может содержать имя лица, являющегося одним из объектов рассмотрения в ресурсе, представленное в форме точки доступа. Поле является факультативным, повторяющимся. Имеет подполя $a Начальный элемент ввода (часть имени, используемая как начальный элемент ввода), $b Часть имени, кроме начального элемента ввода (остаток имени от начального элемента ввода – фамилии или родового имени), $2 Источник данных.
Проиллюстрируем заполнение поля 600 на примере (рисунок 6).

Рисунок 6 – Заполнение поля 600
В поле 600 вводятся фамилия и инициалы лица, являющегося объектом рассмотрения в документе. Поле неконтролируемое, поэтому в качестве источника данных используется нестандартный список кодов.
Поле 606 Наименование темы как предмет должно содержать слово или словосочетание, отражающее содержание ресурса, представленное в форме точки доступа. Поле содержит данные, записываемые в соответствии с правилами, принятыми в системе индексирования. В поле могут быть записаны названия объектов, продуктов, растений, животных, абстрактные понятия и т. д. Поле является факультативным, повторяющимся. Имеет подполя $a Наименование темы (дескриптор в форме, определяемой используемой системой индексирования), $2 Источник данных (код системы предметных рубрик или тезауруса, по правилам которой построены предметная рубрика/дескриптор), $3 Идентификатор связанной авторитетной записи.
Проиллюстрируем заполнение поля 606 на примере (рисунок 7).

Рисунок 7 – Заполнение поля 606
В поле 606 записываются дескрипторы (разрешенные для индексирования термины) ИПТ, максимально конкретно выражающие смысловое содержание документа. Дескриптор выбирается из авторитетной записи посредством строгого поиска или поиска с усечением окончаний слов или словосочетаний. Строгий поиск предполагает написание слов или словосочетаний без усечения. Особенностью заполнения данного поля является то, что терминов тезауруса может быть довольно много (в отдельных случаях до 10-15), а каждое введенное понятие после выбора из авторитетной записи должно быть связано с библиографической записью посредством активации кнопки Связать . Здесь было бы уместнее иметь возможность связывать все выбранные понятия активацией одной кнопки, что значительно сократило бы время на обработку документа.
Поле 607 Географическое наименование как предмет может содержать название географического объекта, являющегося одним из предметов рассмотрения в ресурсе, представленное в форме точки доступа. Поле является факультативным, повторяющимся. Имеет подполя $a Географическое наименование (географическое понятие в форме, определяемой используемой системой индексирования), $2 Источник данных (код системы предметных рубрик или тезауруса, по правилам которой построены предметная рубрика/дескриптор), $3 Идентификатор связанной авторитетной записи.
Проиллюстрируем заполнение поля 607 на примере (рисунок 8).

Рисунок 8 – Заполнение поля 607
В поле 607 записываются географические объекты (страны, области и зоны Российской Федерации, названия гор, рек, озер, равнин и т. д.). Данные понятия выбираются из тезауруса.
Поле 610 Неконтролируемые предметные термины может содержать в форме точки доступа предметные термины, заимствованные не из контролируемых списков предметных рубрик или дескрипторных словарей. Поле является факультативным, повторяющимся. Имеет подполе $а Предметный термин (ключевые слова ) .
Проиллюстрируем заполнение поля 610 на примере (рисунок 9).
В поле 610 вводятся ключевые слова – понятия, отсутствующие в тезаурусе, но необходимые для использования при индексировании документов.
Поле 615 Предметная категория должно содержать вышестоящий уровень предметной категории в текстовой и/или кодированной форме. Поле является факультативным, повторяющимся. Имеет подполя $a Начальный элемент ввода вышестоящей предметной категории в текстовой форме (термин в форме, предписываемой используемой системой индексирования), $п Начальный элемент ввода вышестоящей предметной категории в кодированной форме (кодированное представление предметной категории), $2 Источник данных (код системы, являющейся источником предметной категории), $3 Идентификатор связанной авторитетной записи.
Проиллюстрируем заполнение поля 615 на примере (рисунок 10).

Рисунок 9 – Заполнение поля 610

Рисунок 10 – Заполнение поля 615
В поле 615 записываются цифровые коды одной или нескольких рубрик (но не более трех) ОР для отражения основных аспектов содержания документа. Коды выбираются из авторитетной записи посредством строгого поиска или поиска с усечением. Строгий поиск предполагает написание рубрик без усечения.
Проиллюстрируем заполнение поля 675 на примере (рисунок 11).

Рисунок 11 – Заполнение поля 675
Готовая библиографическая запись, созданная индексатором в формате RUSMARC, выглядит следующим образом (рисунок 12).

Рисунок 12 – Готовая библиографическая запись в формате RUSMARC
Индексирование книг, а также статей из журналов и сборников в АБИС OPAC-Global осуществляется одинаковым образом за исключением локализации документа. В случае индексирования книг при локализации выбирается лист ввода для разных видов документов: монография, том, часть, продолжающее издание, автореферат, электронный ресурс (рисунок 13).
® OPAC-Global X W X | 0 Формат RUSMARC представ. X | M Статья • blackdahlia6419@g x ® Новая вкладка X | + v ■ а ।---L
Выводы . Индексирование документов в АБИС OPAC-Global позволяет формировать библиографические записи в формате RUSMARC с использованием авторитетных данных, таких как тезаурус и рубрикатор, что необходимо для адекватного раскрытия смыслового содержания документов и их дальнейшего поиска в электронном каталоге и БД «АГРОС». Процесс индексирования документов в данной системе выстроен логично и в целом соответствует заявленным задачам, но не совсем удобен в практической работе и имеет ряд недостатков, требующих исправления и доработок.
Список литературы Особенности индексирования документов в OPAC-Global: проблемы и возможности
- Грибов В. Т. Библиотека и АБИС: нам не жить друг без друга? // Университетская книга. - 2022. - № 9. - С. 59-63. EDN: WQBGWZ
- Зупарова Л. Б., Зайцева Т. А., Сазонова Л. И. Библиотечная обработка документа: учеб. - метод. пособие. - Москва: Либерея, 2003. - 208 с. EDN: QTOXYN
- Индексирование документов базы данных ЦНСХБ. Методические указания // состав. Пирумова Л. Н., Харченко Л. Т. - Москва, 1995. - 35 с.
- Логинов Б. Р. Новая технология OPAC-Global для глобальных онлайновых электронных библиотек // Электронные библиотеки. - 2001. - Т. 4, № 3. - С. 10. EDN: HRNZWP
- Пирумова Л. Н., Харченко Л. Т. Тезаурус по сельскому хозяйству и продовольствию: индексирование документов и поиск информации в БД АГРОС. (Методические материалы) - Москва, 2001. - 70 с.
- Российский коммуникативный формат представления библиографических записей в машиночитаемой форме: (российская версия UNIMARC) / М-во культуры Рос. Федерации, Рос. библ. ассоц. - URL: http://rusmarc.ru/rusmarc/format.html (дата обращения: 20.12.2023).