Lexical Syntax Pattern Language - Язык Лексико-Синтаксических Шаблонов

Семантический анализ текста на основе лексико-синтаксических шаблонов для информационного поиска

Опубликовано evgeny - пн, 04/20/2009 - 22:02

Рабчевский Евгений, Крупов Сергей, Рожков Михаил, Булатова Гульнара.
Пермский Государственный Университет

Аннотация

Обсуждается проблема автоматического построения онтологий на основе семантического анализа текстов на естественном языке. В качестве метода предлагается использование лексико-синтаксических шаблонов. Раскрывается синтаксис и семантика языка лексико-синтаксических шаблонов LSPL. Приводится программный комплекс, который позволяет
- хранить шаблоны и корпус текстов на русском языке в базе данных
- редактировать и проводить валидацию шаблонов на корпусе
- проводить семантический анализ текстов корпуса на основе шаблонов.
Для оценки предложенной методики семантического анализа предлагаеся оценивать результаты применения методики в приложении к информационному поиску. Предлагается модель информационного поиска на основе метрик TF*IDF, в которой понятие терма заменяется триплетом (атомарной единицей результатов семантического анализа). Обсуждаются результаты оценки предложенной модели поиска на семинаре РОМИП'2009.