В данной статье рассматривается алгоритм семантического отслеживания изменений (АСОИ), который позволяет выявить изменения данных в теле HTML-документа, а не изменений разметки документа. Особенностью данного алгоритма является, то что не требуется проводить предобработку документа и знать внутреннюю структуру HTML-страницы. АСОИ может быть использован в различных практических задачах, где требуется манипулировать данными, полученными с веб-сайтов. В качестве основных примеров можно привести семантический веб-клиппинг, кэширование страниц, получение RDF-представление HTML-страниц.
That article is dedicated to describe semantic web-sites change detection algorithm. The main advantages of proposed
algorithm are detection of changes only in data of HTML-page, not presentation part; there is no need to know internal
structure of the page and have a preprocessing of HTML-pages. That algorithm could be used in many practical areas,
where there is a need to proceed data retrieved from web-sites. The main examples of applications are semantic webclipping,
web-pages caching, transforming HTML-pages in RDF form.