Поиск сходства интернет-документов с помощью синтаксических и лексических методов составления образов документов

Автор: Акеньшин Д.А.

Журнал: Экономика и социум @ekonomika-socium

Статья в выпуске: 2-1 (15), 2015 года.

Бесплатный доступ

Цель статьи - проанализировать существующий алгоритм построение сходства документов и кластеров сходных документов для поиска кластеров дубликатов с использованием синтаксических и лексических методов составления образов документов

Короткий адрес: https://sciup.org/140111796

IDR: 140111796

Список литературы Поиск сходства интернет-документов с помощью синтаксических и лексических методов составления образов документов

  • Distributed Version Control Systems: A Not-So-Quick Guide Through . Режим доступа (свободный): http://www.infoq.com/articles/dvcs-guide. -(Дата обращения: 25.03.2015).
  • Article feedback tool . Режим доступа (свободный): http://en.wikipedia.org/w/index.php?title=Wikipedia%3AArticle_Feedback_Tool&action=historysubmit&diff=457623055&oldid=456548940. -(Дата обращения: 25.03.2015).
  • C. Hoad, J. Zobel. Methods for identifying versioned and plagiarized documents. -Journal of the American society for information science and technology. Т. 54. С. 203-215, 1 February 2003. Режим доступа (свободный): http://onlinelibrary.wiley.com/doi/10.1002/asi.10170/full. -(Дата обращения: 05.04.2015).
  • Зеленков Ю.Г, Сегалович И.В. Сравнительный анализ методов определения нечетких дубликатов для Web-документов. Труды девятой всероссийской научной конференции "Электронные библиотеки: перспективные методы и технологии, электронные коллекции" -2007. Режим доступа (свободный): http://rcdl2007.pereslavl.ru/papers/paper_65_v1.pdf. -(Дата обращения: 05.04.2015)
  • Сайт проекта MediaWiki . Режим доступа (свободный): http://mediawiki.org. -(Дата обращения: 12.05.2015).
Еще
Статья научная