Научный поиск в интернете

Автор: Смирнов Ю.В.

Журнал: Культура: теория и практика @theoryofculture

Статья в выпуске: 3 (12), 2016 года.

Бесплатный доступ

В статье проводится анализ поисковой системы Google, а также систем научного поиска: Академии Google и Web of Science. Отмечаются важность систематического поиска, и основные трудности при его реализации в поисковых системах Интернета. В конце статьи делается вывод о необходимости обучения людей, как улучшить релевантность поиска.

Поисковые системы, академия google, каталогизация интернет-сайтов

Короткий адрес: https://sciup.org/144159843

IDR: 144159843

Текст научной статьи Научный поиск в интернете

Ю.В.СМИРНОВ НАУЧНЫЙ ПОИСК В ИНТЕРНЕТЕ

При написании научных работ, от небольших статей до монографий для научных работников, очень важно иметь не только доступ к информации, но и удобные поисковые средства, которых в настоящее время достаточно много.

Одним из основных типов поиска на сегодняшний день является поиск в Интернете, в котором практически монопольное положение занимает поисковая система Google. Ее популярность может продемонстрировать не только статистика, но и большинство языков мира, в которых уже появилось слово «загуглить», означающее «поиск в Интернете с помощью Google».

Причина такой популярности кроется в таких достоинствах как:

  • -    простота и удобство использования;- сортировка результатов поиска от наиболее релевантных к менее;

  • -    отображение не только адреса страницы (сайта), но и заголовка страницы с небольшим экстрактом, содержащим поисковый запрос, который позволяет составить первое впечатление о релевантности страницы;

  • -    возможность уточнения запроса, к которой можно отнести:

  • -    уточнение запроса по типу информации (Все, Новости, Картинки, Карты, Видео, Книги, Авиабилеты, Приложения);

  • -    уточнение языка отображаемых результатов поиска;

  • -    уточнение временных рамок запроса (выбрать из списка период создания страниц, либо задать собственный временной интервал);

  • -    возможность использования расширенного поиска;

  • -    уточнение запроса с помощью специальных операторов и пунктуации (например: символ «*» (звездочка) служит для замены любого слова в запросе);

  • -    возможность включить/отключить безопасный поиск, который исключает неприемлемый контент и изображения сексуального характера из результатов.

Другие поисковые системы также обладают одним или несколькими вышеперечисленными достоинствами, однако каждая поисковая система обладает и собственным алгоритмом поиска, что и делает ее уникальной.

Алгоритм поиска Google учитывает такие особенности естественных языков как синонимичность, избыточность и многозначность. Логика сортировки результатов по релевантности в поисковой системе Google кратко и емко описана в книге «Электронные библиотеки. Информационнокоммуникационная среда обитания»: «Логика ранжирования результатов основана на предположении, что все люди имеют схожие проблемы и вопросы, и вам, вероятнее всего, нужно то же, что и другим таким же. Комбинирование этих двух методов – формулирования запросов на естественном языке и выдачи результатов в соответствии с популярностью – оказалось чрезвычайно эффективным.» [1, с. 155] Кроме поиска по просторам Интернета, компания Google предлагает и систему научного поиска – Google Scholar [2], которая предоставляет доступ к полным текстам статей из многих рецензируемых журналов. В этой системе реализованы очень полезные для научных работников функции:

  • -    формирование библиографического описания;

  • -    импорт цитат в программы для управления библиографической информацией (например: EndNote, BibTeX и др.)

  • -    индексы цитирования.

Однако у Академии Google также есть ряд недостатков:

  • -    отсутствие данных об охвате индексируемых научных журналов;

  • -    отсутствие информации о частоте обновления базы данных;

  • -    отсутствие тематического поиска;

  • -    недостаточное развитие системы уточнения запросов.

В отличие от Академии Google, для поисковой системы сайта Web of Science [3], представляющего собой реферативную базу данных публикаций в научных журналах и разрабатываемую компанией Thomson Reuters, была создана удобная система уточнения запросов. Все доступные типы уточнения поиска располагаются в боковой панели слева (например: базы данных, направления исследования, авторы, годы публикаций, языки, страны/территории и т.д.)

В каждом из этих типов предлагается небольшой список наиболее часто встречающихся вариантов во всех документах основного запроса.

Кроме вышеуказанной системы уточнения запросов, в этой поисковой системе предоставлена возможность воспользоваться операторами поиска (например: «AND» для поиска записей содержащих все условия) и символами усечения (например: «*» (звездочка) для замены любого количества символов в том числе и нулевого).

По многим параметрам Академия Google и Web of Science схожи, однако стоит учитывать, что только первая предоставляет полнотекстовый поиск, в то время как вторая предоставляет поиск только по библиографическим данным и не содержит полных текстов индексируемых публикаций.

Обе описанные нами поисковые системы, также как и большинство других подобных им являются системами вербального поиска, т. е. базирующиеся на естественном языке. Некоторые системы в своих поисковых алгоритмах (например: Google) стараются учесть особенности естественных языков такие как синонимичность, избыточность и многозначность, что несомненно улучшает релевантность результата поиска, однако отсутствие систематического поиска усложняет поиск информации.

В качестве подтверждения этих слов приведем один из тезисов учебника «Аналитикосинтетическая переработка информации»: «Отечественные библиотековеды считают, что именно систематический поиск естественен для читателей, так как вся система образования построена по систематическому принципу и обучение ведется не по "ключевым словам", а по "дисциплинам", отраслям знания, областям науки и практической деятельности.» [4, с. 178]

Некоторые поисковые системы Интернета пытаются создавать каталоги интернет-сайтов (например: Каталог Яндекса [5], который представляет собой аннотированные ссылки на сайты, собранные вручную редакторами компании Яндекс) или делать собственные тематические указатели (например: направления исследований в Web of Science). Однако этот исключительно интеллектуальный труд требует затрат на содержание штата сотрудников, к чему большинство поисковых систем Интернета пока не готовы.

Использование кодированных ИПЯ несет для авторов некоторые трудности, поскольку индексированию документов обучают только учащихся и студентов библиотечных специальностей, а практику индексирования многие проходят по месту работы. Также стоит отметить, что многие выпускники этих специальностей не всегда могут сами проставить классификационный индекс.

Но и эти трудности решаемы. Необходимо либо ввести факультативный курс по месту учебы по использованию кодированных ИПЯ, включающий как теорию, так и практику индексирования, либо создать недорогие и несложные учебные пособия.

Говоря о введении подобного курса необходимо отметить, что многие пользователи поисковых систем Интернета, в частности Google, не знакомы с такими функциями как уточнение запроса с помощью специальных операторов и пунктуации, которые могут значительно улучшить релевантность поиска. Поэтому нам кажется целесообразным вводить комплексный курс по информационному поиску.

С этим предложением согласятся не все, но не стоит забывать, что с появлением Интернета количество произведенной человечеством информации постоянно увеличивается, а без умения быстро получать релевантную информацию человек в ней просто «утонет».

Список литературы Научный поиск в интернете

  • Земсков, А. И. Электронные библиотеки. Информационно-коммуникационная среда обитания: учебн. пособие / А. И. Земсков, Я. Л. Шрайберг. - М.: ГПНТБ России, 2012. - 402 с.
  • Академия Google. URL: https://scholar.google.ru/ (Дата обращения: 02.02.2016)
  • Web of Science. URL: http://apps.webofknowledge.com/ (Дата обращения: 02.02.2016)
  • Аналитико-синтетическая переработка информации: учебник / Н. И. Гендина и др.; науч. Ред. А. В. Соколов; координатор проекта Л. В. Трапезникова. - Санкт-Петербург: Профессия, 2013. - 336 с.
  • Яндекс каталог. URL: https://yaca.yandex.ru/ (Дата обращения: 02.02.2016)
Статья научная