Сравнительный анализ современных систем поиска графической информации
Автор: Дегтярев Ю.С., Шпирюк К.С.
Журнал: Экономика и социум @ekonomika-socium
Статья в выпуске: 10 (41), 2017 года.
Бесплатный доступ
В статье рассмотрено понятие поисковой системы и ее основные задачи. Выделены методы поиска, на которых основываются системы поиска графической информации. Построена развернутая модель гомеостата, позволяющая рассматривать различные способы поиска изображений. Также построена универсальная схема взаимодействия, показывающая процесс оценки эффективности сравниваемых поисковых систем. Результатом статьи является сравнительный анализ систем поиска графической информации.
Поисковая система, поиск изображений, поиск графической информации, контекстный поиск, контентный поиск
Короткий адрес: https://sciup.org/140234785
IDR: 140234785
Текст научной статьи Сравнительный анализ современных систем поиска графической информации
Визуальная информация сегодня занимает не меньшую долю в общем количестве доступной информации, чем текстовая. Появились огромные, постоянно растущие базы данных изображений, как у отдельного пользователя, так и у различных организаций. Непрерывно расширяющимся электронным архивом является и глобальная сеть Интернет. В этих условиях весьма актуальными становятся вопросы навигации среди этой массы информации, а также быстрого и точного поиска нужных пользователю изображений. Основной целью статьи является анализ существующих систем поиска изображений.
Под поисковой системой понимается программное обеспечение, состоящее из базы данных документов, снабженной пользовательским интерфейсом, позволяющим пользователю получить упорядоченное подмножество этих документов как ответ на его поисковый запрос. Основная задача поисковой системы заключается в выборе наилучшего возможного подмножества в ответ на конкретный запрос, т.е. множества документов, которые наиболее соответствуют тому, что ищет пользователь (обычно в порядке убывания релевантности) [1].
Системы, реализующие возможность поиска графической информации, в настоящий момент используют методы поиска, которые могут быть разделены на два направления:
-
1. контентный поиск (поиск по содержанию) - поиск изображений на основе визуальных особенностей, таких как цвет и текстура [2];
-
2. контекстный поиск (поиск по текстовым аннотациям) - поиск изображений на основе обработки и анализа текстовой информации, формировании описаний и присвоении этого описания соответствующим изображениям [3].
При помощи развернутой модели гомеостата (способ построения которой описан в [4]) можно сформировать модель процесса поиска изображений (рис. 1). Из данной модели видно, что: высший орган управления (ВОУ) - пользователь поисковой системы; местный регулятор (МР) - поисковая система; регулятор и исполнитель (РИ) 1 - блок контекстного поиска; РИ 2 - блок контентного поиска; объект, над которым ведется работа (О) - работа с поисковой системой; блок дополнительной активации и адаптации (БДАА) - справочная информация по работе с системой.

Рис. 1. Развернутая модель гомеостата
Для блока контекстного поиска регулятором и исполнителем являются текстовый запрос и результат, для блока контентного поиска – признаки изображения и результат. Выражение работы с поисковой системой в модели гомеостата позволяет рассматривать различные способы поиска изображений.
Таблица 1
Рейтинг популярности поисковых систем за 2016 год (в %)
01. 2016 |
02. 2016 |
03. 2016 |
04. 2016 |
05. 2016 |
06. 2016 |
07. 2016 |
08. 2016 |
09. 2016 |
10. 2016 |
11. 2016 |
|
Яндекс |
49,8 |
50,3 |
50,3 |
51,1 |
50,5 |
49,7 |
49,6 |
49,2 |
48,5 |
48,1 |
47,8 |
|
41,9 |
41,7 |
41,8 |
41,9 |
42,5 |
44,3 |
43,6 |
45,6 |
36,4 |
46,8 |
46,8 |
Mail.ru |
6,01 |
5,97 |
5,76 |
5,56 |
5,57 |
5,55 |
4,85 |
3,81 |
3,82 |
3,88 |
3,99 |
Рамблер |
1,69 |
1,68 |
1,67 |
0,60 |
0,60 |
0,57 |
0,57 |
0,49 |
0,50 |
0,46 |
0,50 |
Bing |
0,70 |
0,53 |
0,48 |
0,41 |
0,40 |
0,42 |
0,37 |
0,38 |
0,34 |
0,35 |
0,33 |
Yahoo! |
0,19 |
0,19 |
0,18 |
0,27 |
0,29 |
0,32 |
0,28 |
0,28 |
0,19 |
0,28 |
0,26 |
QIP |
0,09 |
0,09 |
0,09 |
0,10 |
0,11 |
0,11 |
0,09 |
0,05 |
0,06 |
0,07 |
0,08 |
Как видно из таблицы 1 – в настоящее время существует достаточно систем поиска изображений. В связи с этим следует провести сравнительный анализ популярных систем с целью выявления наиболее часто реализуемого подхода и других функций, облегчающих поиск изображений.
Процесс оценки эффективности сравниваемых систем представлен на рис. 2 в виде универсальной схемы взаимодействия (способ построения которой описан в [4]).

Рис. 2. Универсальная схема взаимодействия
Для сравнительного анализа были выбраны поисковые системы, описанные ниже.
-
1) Яндекс – поисковая система компании Яндекс. Наиболее популярна в России. Реализует как контекстный, так и контентный подходы. Результаты поиска могут быть отфильтрованы по следующим параметрам: размер изображения, ориентация, тип, цвет, формат файла, время появления, поиск на определенном сайте. На результаты поиска можно накладывать фильтры для ограничения показа нежелательного контента.
-
2) Google – поисковая система компании Google. Представляет реализацию контекстного и контентного подходов. Поиск осуществляется по всем сайтам, которые входят в базу данных Google. При контекстном поиске система находит все изображения, так или иначе помеченные искомым словосочетанием. Контентный поиск можно произвести, указав путь к изображению или выбрав изображение на локальном диске компьютера. Поисковая система поддерживает поиск идентичных изображений с другими размерами. Результаты поиска могут быть отфильтрованы по ряду параметров: размер изображения, цвет, тип, тема, время появления. Присутствует возможность фильтрации нежелательного контента.
-
3) Mail – поисковая система компании Mail.ru. Представляет собой реализацию контекстного подхода. Набор параметров фильтрации результатов поиска достаточно небольшой: размер изображения и цвет. Безопасного поиска не предусмотрено. В настоящее время для поиска изображений портал Mail.ru использует разработки компании Google.
-
4) Rambler – поисковая система компании Rambler. Реализация только контекстного подхода. Реализована возможность ввода голосовых запросов. Результаты поиска могут быть отфильтрованы по ряду параметров: размер изображения, время появления, цвет. Присутствует безопасный поиск, именуемый в данном случае семейным фильтром. В настоящее время поиск
по изображениям в Rambler осуществляется с использованием разработок компании Яндекс.
-
5) Bing – поисковая система компании Microsoft. Представляет собой реализацию только контекстного подхода. Результаты поиска могут быть отфильтрованы по ряду параметров: размер изображения, цвет, стиль, макет, люди. Поисковая система Bing оснащена механизмом безопасного поиска, предотвращающего выдачу нежелательного контента. Присутствует возможность поиска изображений, идентичных найденному, но другого размера. Сотрудниками компании Microsoft также опубликовано большое количество работ, посвященных вопросам поиска и обработки изображений.
-
6) Yahoo! – поисковая система компании «Yahoo!». Реализован только контекстный подход. Результаты поиска могут быть отфильтрованы по ряду параметров: время появления, размер изображения, цвет. Сотрудниками и при участии Yahoo! опубликовано большое количество работ, посвященных вопросам поиска изображений.
-
7) QIP – поисковая система компании МедиаМир. Реализованы как контекстный, так и контентный подходы. Результаты поиска могут быть отфильтрованы по цвету и размеру. Предусмотрен безопасный поиск.
-
8) TinEye – специализированная поисковая система, осуществляющая поиск изображений по визуальному образцу. В качестве результатов поиска пользователь получает список найденных изображений и их краткую характеристику. В специальном окне можно сравнить искомое и найденное изображения. Результаты поиска могут быть упорядочены по: наибольшему соответствию, наибольшему отличию, наибольшему разрешению. Поиск осуществляется по изображениям, наиболее похожим на оригинал.
-
9) PicSearch – поисковая система компании Picsearch. Позволяет пользователю при помощи введенных ключевых слов находить соответствующие изображения. Предоставляется также возможность
производить поиск по анимациям или определенным размерам изображений, используя функции расширенного поиска.
Сравнительный анализ рассматриваемых систем поиска графической информации представлен в таблице 2.
Таблица 2
Сравнительный анализ систем поиска графической информации
Система |
Характеристики |
||||||||
Контекст-ный поиск |
Контент-ный поиск |
Анализ содержания |
Поиск по макету |
Поиск по дате |
Поиск по типу лицензии |
Поиск по людям |
Поиск на сайте |
Безопасный поиск |
|
Яндекс |
+ |
+ |
+ |
+ |
+ |
- |
+ |
+ |
+ |
|
+ |
+ |
+ |
+ |
+ |
+ |
+ |
+ |
+ |
Mail.ru |
+ |
- |
+ |
- |
- |
- |
- |
- |
- |
Рамблер |
+ |
- |
+ |
+ |
- |
- |
+ |
+ |
+ |
Bing |
+ |
- |
+ |
+ |
+ |
+ |
+ |
- |
+ |
Yahoo! |
+ |
- |
+ |
- |
- |
- |
- |
- |
+ |
QIP |
+ |
+ |
+ |
- |
- |
- |
- |
- |
+ |
TinEye |
- |
+ |
- |
- |
+ |
- |
- |
- |
- |
PicSearch |
+ |
- |
- |
+ |
- |
- |
+ |
- |
- |
Сравнительный анализ систем поиска изображений показал, что в основе большинства систем лежит контекстный подход. Тем не менее, эти системы в той или иной степени проводят анализ содержания найденных изображений. Подобный анализ используется для выбора изображений определенной цветовой гаммы, определенного содержания и т.д.
Поиск изображений по типу лицензии реализован лишь в поисковых системах Google и Bing. Данный вид поиска позволяет искать изображения, которые выложены в открытый доступ с возможностью использования сторонними лицами и компаниями. Наличие поиска по типу лицензии весьма полезно для владельцев веб-сайтов (компаний и частных лиц), следовательно, создание поисковых систем, реализующих такой поиск остается актуальным.
Возможность поиска изображений по определенному сайту или домену предоставляют только Яндекс, Google и Рамблер. В большинстве случаев эти поисковые системы справляются со своей задачей лучше, чем встроенный поиск на сайтах. Развитие этого вида поиска в остальных поисковых системах является рациональным решением.
В результате сравнительного анализа становится очевидным, что поисковая система от корпорации Google предоставляет широчайший набор инструментов для поиска графической информации и является самой совершенной на сегодняшний день.
Список литературы Сравнительный анализ современных систем поиска графической информации
- Кириллов А. Поисковые системы: компоненты, логика и методы ранжирования//Бизнес-информатика. -2009. -№4. -С. 51-59.
- Devireddy S.K. Content Based Image Retieval//Computer Sciences and Telecommunications. -2009. -№5. -P. 10-27.
- Десятников И., Утробин В. Построение архитектуры баз данных для задачи поиска изображений//Вестник Нижегородского университета им. Н.И. Лобачевского. -2012. -№5-2. -С. 321-327.
- Разумов В.И. Категориально-системная методология в подготовке ученых: Учеб. пособие. -Омск: Омск. гос. ун-т, 2004. -277 с.
- Рейтинг поисковых систем на 2016 год//SEO-AUDITOR . URL: http://www.gs.seo-auditor.com.ru/sep/2016/(дата обращения 04.01.2017)