Рассматривается метод тематической классификации авторефератов диссертаций. Для этого используется специально построенная мера близости документов, учитывающая специфику предметной области. В качестве шкал для определения меры предлагается брать характеристики структурных атрибутов описания авторефератов
(научная новизна, положения, выносимые на защиту и т. п.). Значения весовых коэффициентов в формуле для вычисления меры близости определяются предполагаемой апостериорной достоверностью данных соответствующей шкалы.
The method of thematic classification of thesis abstracts is considered in the work. For this purpose, a specially constructed measure of the proximity of documents is used, taking into account the specifics of the subject area. As scales for the definition of a measure, it is suggested to take the characteristics of the structural attributes of the description of the author's abstracts (scientific novelty, provisions to be defended, etc.). The values of the weight coefficients in the formula for computing the proximity measure are determined by the assumed a posteriori reliability of the data of the corresponding scale.