Аннотации:
Квалификационная работа посвящена разработке и реализации алгоритма детектирования ботов в социальных сетях на примере социальной сети Twitter.
В первой главе приведены данные, актуализирующие постановку задачи,
структурированы необходимые понятия предметной области, типизированы виды
социальных ботов.
Во второй главе исследуются и анализируются уже существующие математические
алгоритмы поиска социальных ботов, на основе которых проектируется собственный алгоритм. Делается вывод о том, что подавляющее большинство методов решают задачу классификации, основываясь на атрибутах профилей пользователей и на некоторых поведенческих признаках. Произведен обзор математических методов классификации.
Принято решение использовать мат.аппарат классификаторов: наивный алгоритм Байеса, деревья решений.
В третьей главе описывается выбор признаков, инструментов для решения, решение о модульной архитектуре. Описывается реализация программной системы, состоящая из модуля сбора информации, модуля оценки спама, модуля принятия решений. Система протестирована на 500 профилях Twitter и определяет ботов с точностью 73%. Анализируются полученные результаты и возможности улучшения системы.
Результаты, полученные в работе, с учетом их развития, применимы во множестве
задач анализа социальных сетей, например, в маркетинге и социологии. Методы можно использовать как для инструментов других систем, так и как самостоятельный программный сервис.