Abstract:
Предметом исследования работы были данные полученные при помощи модуля сбора коротких текстов
Целью работы являлось разработать и реализовать алгоритм тоновой классификации коротких текстов. Выбранный метод – Naive Bayes.
В дипломную работу входит введение, 6 глав и итоговое заключение.
Во введении объясняется проблема, решение которой необходимо было найти и работа, которая была проведена для решения этой проблемы.
В первой главе описана постановка задачи, объясняет какие задачи можно решить и для чего это нужно.
Во второй главе анализируется предметная область, и на основе каких данных будет проводиться работа.
Третья глава представляет разработанный модуль сбора коротких текстов.
В четвертой главе представлены алгоритмы и метода классификации.
В пятой главе описан процесс построения классификатора. Пятая глава включает в себя следующие пункты: обучение классификатора, оценка классификатора (точность, полнота), подключение классификатора.
В шестой главе приведены экспериментальные исследования классификатора.
В заключение сформулированы полученные результаты и возможности дальнейшей работы.
Дипломный проект посвящѐн разработке и реализации алгоритма тоновой классификации коротких текстов. Объѐм дипломной работы 20 страниц, на которых размещен 1 рисунок. При написании диплома использовалось 7 источников.
Использовалась БД текстовых сообщений, содержащая: 3 000 сообщений полученных при помощи модуля сбора коротких текстов и 3 000 сообщений для тестирования.