Репрезентативно-ролевая модель содержимого веб-страницы

Бесплатный доступ

Автоматический анализ содержимого (контента) веб-страниц является актуальной задачей, при этом анализ может служить самым разнообразным целям. Одной из задач, которая встает на практике, является выявление ролевой структуры контента: можно выделить основную статью, комментарии читателей, рекламу и другие функциональные роли. Решение этой задачи, кроме прочего, является важным шагом в направлении более глубокого автоматического анализа семантики страницы в дальнейшем. Был выбран подход, согласно которому роль фрагмента определяется соответственно тому, как он внешне выглядит на экране, т.е. какова его репрезентация. Это соответствует человеческому способу восприятия. Разработанная модель позволяет выделить фрагменты html-кода, выполняющие роли главного заголовка и основной статьи страницы. При этом основная статья может содержать разнородные элементы: текст, рисунки, таблицы и т.д., из нее удаляются внедренные фрагменты другого назначения (реклама и др.), могут использоваться различные компоновки контента на странице и способы верстки...

Еще

Веб, моделирование, искусственный интеллект

Короткий адрес: https://sciup.org/14116887

IDR: 14116887

Список литературы Репрезентативно-ролевая модель содержимого веб-страницы

  • Приложение для сохранения информации в облаке. Pocket URL: http://getpocket.com.
  • Продукционные модели // Искусственный интеллект: В 3 кн. Кн. 2. Модели и методы: Справочник / Под. ред. Д.А.Поспелова. - М., 1990.
  • Семантика в HTML 5. URL: http://habrahabr.ru/post/49734.
  • Учебник HTML. URL: http://ru.html.net/tutorials/html.
  • Элти Дж., Кумбс М. Экспертные системы: концепции и примеры. - М., 1977.
Статья научная