Обсуждается проблема автоматического
построения онтологий на основе
семантического анализа текстов на
естественном языке. В качестве метода
предлагается использование лексико-
синтаксических шаблонов. Раскрывается
синтаксис и семантика языка лексико-
синтаксических шаблонов LSPL.
Описывается программный комплекс,
который позволяет:
- хранить шаблоны и корпус текстов на
русском языке в базе данных
- редактировать и проводить валидацию
шаблонов на корпусе русскоязычных
текстов
- проводить семантический анализ текстов
корпуса на основе шаблонов.
Для оценки предложенной методики
семантического анализа предлагается
оценивать результаты применения
методики в приложении к
информационному поиску. Предлагается
модель информационного поиска на основе
метрик TF*IDF, в которой понятие терма
заменяется триплетом (атомарной единицей
результатов семантического анализа).
Обсуждаются результаты применения
предложенной модели поиска к заданиям
семинара РОМИП'2009.
"Электронные библиотеки:
перспективные методы и технологии,
электронные коллекции"
XI Всероссийская научная конференция RCDL’2009
Петрозаводск, 17–21 сентября 2009 г.