Моделирование ИТ-инфраструктуры научной библиотеки

Автор: Редькина Н.С.

Журнал: Культура: теория и практика @theoryofculture

Статья в выпуске: 2 (11), 2016 года.

Бесплатный доступ

В статье дается обоснование компонентов ИТ-инфраструктуры библиотеки (компьютеры, сетевое и телекоммуникационное оборудование, системное и прикладное программное обеспечение). Предложены подходы к моделированию ИТ-инфраструктуры научной библиотеки.

Научные библиотеки, ит-инфраструктура, модель

Короткий адрес: https://sciup.org/144159837

IDR: 144159837

Текст научной статьи Моделирование ИТ-инфраструктуры научной библиотеки

К Л.Н.ПИРУМОВА, И.А.МИЛЕВСКАЯ ВОПРОСУ О СЕМАНТИЧЕСКОЙ ОБРАБОТКЕ ДОКУМЕНТОВ В НАУЧНОЙ БИБЛИОТЕКЕ

Одной из важнейших задач научной обработки в научной сельскохозяйственной библиотеке является отбор наиболее ценной и актуальной научно-технической информации по проблемам АПК, которая должна обеспечить удовлетворение информационных потребностей пользователей путем получения ими релевантной и пертинентной информации, необходимой для выполнения научных исследований и научно-технических разработок.

Научная обработка документов по сельскому хозяйству и пищевой промышленности предполагает: научный анализ и научную оценку входного документного потока, отбор из него наиболее ценной информации, сопоставление, обобщение, преобразование ее в более сжатые формы, определение места данного документа в информационных ресурсах и создание вторичных документов. В Федеральном государственном бюджетном научном учреждении «Центральная научная сельскохозяйственная библиотека» (ЦНСХБ) используется аналитико-синтетическая обработка документов, которая призвана сделать наиболее ценную и актуальную информацию доступной пользователю, представить ее в удобной форме в базе данных «АГРОС», и обеспечить возможность быстрого и эффективного поиска в ней. Аналитико-синтетическая обработка подразумевает разнообразие и совокупность процессов по обработке и преобразованию исходных документов (аннотирование, реферирование, индексирование) путем их анализа и синтеза.

Одной из проблем научной обработки является вопрос, какую именно информацию считать научной, актуальной, значимой или ценной. Безусловно, необходимо стремиться к максимальному исключению субъективизма при его решении, однако полностью исключить этот фактор невозможно, поскольку при оценке документа включаются личный опыт, квалификация и образование индексатора. Очевидно, что главный фактор, влияющий на субъективное решение – это опыт. Опыт включает: знание потока публикаций по конкретной области знаний, которое позволяет определять тенденции, выявлять перспективные направления, а также наиболее популярные, обсуждаемые в научной печати вопросы; базовое образование индексатора, т.е. тот багаж знаний, который позволяет ему ориентироваться в предмете. Поэтому так важно, чтобы семантической обработкой, в т.ч. отбором (по значимости) документов по определенной области знания, занимались специалисты в данной области знания. Это -определяющее положение, позволяющее снизить процент ошибок в процессе аналитико-синтетической обработки документов. Таким образом, от подготовленности, опыта, знаний индексатора зависит качество отбора документов в информационный продукт. А снизить процент субъективизма помогают методические указания, инструкции, которыми должны руководствоваться аналитики. Поскольку входной документный поток включает документы на русском и иностранных языках, то крайне важно для индексатора знание иностранных языков.

Итак, в семантической обработке документов используются научные методы исследования документа: анализ и синтез. В свою очередь анализ разделяется на внешний и внутренний. В процессе внешнего анализа устанавливаются вид документа, его форма, время и место его появления, авторы, цели создания, надежность и достоверность его контекста. Эти данные используются в процессе создания библиографического описания документов. При внутреннем анализе исследуется смысловое содержание документа для создания аннотаций, рефератов и перевода информации на естественном языке на ИПЯ, выраженные их лексическими единицами (индексами, кодами, дескрипторами), составляющими поисковый образ документа (ПОД). Таким образом, аналитик, осуществляя анализ документа, раскрывает его содержание, выявляет его основные темы и переводит это содержание в более сжатую форму, т.е. производит свертывание информации и представление в той форме и теми средствами, которые обеспечат в дальнейшем эффективный поиск. Задачи свертывания информации: освободить пользователя от необходимости при поиске прочитывать или просматривать полные тексты документов, повысить скорость поиска.

На этапе внутреннего анализа документа в книжном издании изучаются заглавие документа, издательская аннотация, оглавление/содержание, введение, заключение, а в аналитическом документе (статье) - аннотация/реферат.

В ЦНСХБ осуществляется принцип одноразовой обработки и многократного использования информации, который требует при раскрытии документа максимально полно выявить все его аспекты и определить его место в тех информационных продуктах, которые создает библиотека. Поэтому в процессе аналитико-синтетической обработки аналитик определяет место конкретного документа в базе данных «АГРОС», в проблемно-ориентированных базах данных ЦНСХБ, а также в 2 текущих и 5 реферативных изданиях. Отметим, что для этого аналитик должен знать схемы этих информационных продуктов. Аналитико-синтетическая обработка – процесс трудоемкий, но зато его результаты затем многократно и разнообразно используются в различных сферах информационной деятельности. Важнейшая проблема научной обработки – эффективная технология, позволяющая экономить финансовые и трудовые затраты на ее осуществление. В настоящее время автоматизированная система обработки книг (АИБС MARC-SQL) в ЦНСХБ обеспечила автоматизированный ввод информации в систему и принесла свои плоды, в том числе и сокращение сроков обработки.

Семантическая обработка документа подразумевает полноту и точность перевода информации, содержащейся в документе с естественного языка на информационно-поисковый язык (ИПЯ), которые зависят от структуры, лексической наполненности и других возможностей ИПЯ.

Аналитико-синтетическая обработка документов тесно связана с информационным поиском, поскольку ее задача снабдить документ поисковым образом, по которому в дальнейшем и будет производиться поиск. Результаты поиска зависят от качества индексирования и от поисковых возможностей информационно-поискового языка (ИПЯ), используемого при индексировании документов, а также от правильности его использования во время научной обработки. Поэтому наличие и использование методик, методических руководств и т.п. необходимое условие обеспечения качества семантической обработки документов в научной библиотеке.

Поэтому индексаторы заинтересованы в развитии и совершенствовании информационнопоисковых языков. С одной стороны ИПЯ создаются для использования в процессе обработки документов, поскольку именно ИПЯ являются ее инструментом, а с другой – сам ИПЯ пополняется в ходе обработки документов, когда выявляются новые термины, новые направления в науке, которые затем, выраженные нормализованной научной лексикой, пройдут мониторинг, лексическую обработку и уже в качестве лексических единиц пополнят данный ИПЯ. От того насколько богата лексика ИПЯ, насколько адекватно она отражает современное состояние аграрной науки и практики, зависит возможность ИПЯ точно и полно отображать содержание документов.

ИПЯ структурируют, формируют и систематизируют информационные массивы. Именно ИПЯ обеспечивают эффективный релевантный и пертинентный тематический поиск в информационных массивах. Кроме того, ИПЯ обеспечивают унификацию процесса индексирования документов и использование нормализованной лексики в информационных массивах.

Список литературы Моделирование ИТ-инфраструктуры научной библиотеки

  • Редькина, Н. С. Стратегическое развитие информационных технологий в библиотеке: монография/Н. С. Редькина; Гос. публич. науч.-техн. б-ка Сиб. отд-ния Рос. акад. наук; науч. ред. Б. С. Елепов. -Новосибирск: ГПНТБ СО РАН, 2012. -224 с.
  • Редькина, Н. С. Эффективность информационных технологий в библиотеках/Н. С. Редькина//Библиосфера. -2011. -№ 2. -С. 24-31.
  • Ахлаков, Ш. Уровни зрелости ИТ-инфраструктуры предприятия/Ш. Ахлаков. -URL:http://www.iteam.ru/publications/it/section_91/article_3182.
Статья научная