Новые системы поиска и распознавания
Бесплатный доступ
В данной статье рассматриваются методологическая проблематика систем поиска и распознавания и методы ее решения. Исследуются методы распознавания и системы поиска данных, их плюсы и минусы.
Нейронные сети, базы данных, поиск, идентификация, поисковые системы
Короткий адрес: https://sciup.org/140278491
IDR: 140278491
Текст научной статьи Новые системы поиска и распознавания
This article discusses the methodological problems of search and recognition systems and methods for solving it. The methods of recognition and data search systems, their pros and cons are explored.
С течением времени объемы информации постоянно увеличиваются, вследствие этого усложняется процесс поиска нужных данных. Проблема возникает не в отсутствии той или иной информации, а в возможности ее отыскать. У современного человека нет достаточного количества времени для долгого поиска ответа на интересующий вопрос. Ответ нужен сразу, и он должен быть верным. Тут встает вопрос о необходимости усовершенствования поисковых систем так, чтобы сам процесс поиска занимал как можно меньше времени. В настоящее время идет усиленное внедрение новых технологий в процесс поиска информации.
Самая перспективная технология, представленная на рынке - это Нейронные сети. Впервые понятие нейронные сети было сформулировано в 1943 году Маккалоком и Питтсом, основанное на работе с вакуумными лампами. Нейронные сети решают множество задач по обработке и анализу данных – распознавание и дальнейшая классификация полученных образов, прогнозирование поведения и так далее.
Развитие нейросетей началось с 2012 года. Первый прорыв сделала сеть под названием «AlexNet». Она победила в международном соревновании «ImageNet» в 1012 году. Сеть являлась достаточно небольшой, она включала в себя всего лишь 650 тысяч нейронов, имеющих 650 миллионов параметров. Проблема была в том, что в тот момент не существовало большой базы данных для достаточного обучения. Из самых больших баз данных можно было выделить «Pascal VOC», она включала в себя 20 категорий объектов и «Caltech 101», имеющая 101 категорию. Вскоре появилось решение этой проблемы – база данных «ImageNet». Она обладала 15 миллионами изображений с 22 тысячами категорий. Теперь если вы имеете академический адрес, то вы можете получить доступ к данной базе и обучить свою нейронную сеть.

Number of
Labeled Images
SUN, 1ИК №ми< M(
LabelMe, 37K
PASCAL VOC. ЗОК
Caltech 101, 9K
NET15M
(Deng et al. '09]
Сейчас технологии шагнули далеко вперед, и нейросети внедряют в привычные для нас технологии, в пример можно привести поисковые системы. Компания «Яндекс» интегрировала в свой поисковик технологию семантического поиска основанный на машинном обучении. Данный алгоритм носит название «Матрикснет». Обучение происходит за счет коллективного разума пользователей, чем чаще происходит запрос, тем лучше машина начинает понимать, что хочет от нее тот или иной пользователь, вводящий свой вопрос поисковику. Такой же принцип работает с поиском по картинке, машина с помощью нейросетей преобразовывает изображение, делает то же самое с запросом, он может быть как в текстовом виде, так и изображением, далее они сравниваются между собой и поисковик выдает вам результат. Все это дает пользователю удобнейший процесс поиска любой интересующей его информации, сокращается время поиска, информация подается более точно.
Также существуют системы поиска людей, они представляют собой сервера с огромной базой данных, дающие возможность поиска определенных людей в сети Интернет. Данные поступают из открытых источников, в частности берется информация с Email адресов. Пользователь указывает фамилию, имя и отчество и в итоге сможет получить нужный email адрес данного человека. Данная технология может применяться для связи людей по каким-либо важным делам, не имея прямых контактных данных.
В Национальной лаборатории физики Великобритании ученые изобрели новую биометрическую систему распознавания человека. Огромное преимущество данной технологии заключается в том, что она способна идентифицировать человека, просто гуляющего на улице. Алгоритмы обрабатывают силуэт человека, его походку, одежду. На основе этих данных осуществляется распознавание. Все это происходит посредством уличных камер наружного наблюдения. Данный метод распознавания имеет множество возможностей и сфер применения. К примеру, с помощью такой системы идентификации можно распознать грабителя, скрывшего свое лицо. Данная технология является очень спорной и вызывает бурное обсуждение среди населения, ведь такие методы слежения могу нарушать гражданскую конституцию.
Одна их перспективных технологий в данной сфере является продукт под названием «Find Face». Алгоритмы данной разработки позволяют находить человека в социальных сетях по фотографии. Нейронная сеть получает изображение человека, распознает лицо на фотографии и получает характерный вектор признаков описывающий индивидуальность лица.
Данный вектор далее сравнивается с имеющимися векторами в базе данных и после этого предоставляется отсылка на конкретного человека. По статистике 1 миллиард фотографий обрабатывается за 0.5 секунд, а точность определения варьируется около 95 процентов.
Поиск по базе данных

Технологии сейчас развиваются в бешеном темпе. Но проблема поиска информации будет возникать постоянно, поэтому каждый раз способы ее получения буду совершенствоваться. И пока эта тема остается актуальной, будут создаваться новые технологии, которые будут заменять устаревшие.
Список литературы Новые системы поиска и распознавания
- Контент-студия Tech Media. Нейронные сети: практическое применение // HABRAHABR.RU: Хабрахабр, 2017. URL: https://habrahabr.ru/post/322392/ (Дата обращения:01.05.2017.)
- Яндекс. Искусственный интеллект в поиске. // HABRAHABR.RU: Хабрахабр, 2017. URL: https://habrahabr.ru/company/yandex/blog/314222/ (Дата обращения:11.04.2017.)