SEUS - Search engine using semantics

Как ясно из названия SEUS - проект поисковой системы, использующей семантику.
На данный момент над проектом работают 4 человека, все они с кафедры Компьютерных систем и Телекоммуникаций Пермского Государственного Университета. Это:
Ассистент кафедры Рабчевский Евгений, и студенты 5-го курса Крупов Сергей, Рожков Михаил, Булатова Гульнара.

Система предназначена для поиска по текстовым коллекциям данных, представленным в Интернет.
Особенностью системы является алгоритм автоматического семантического представления текста. В результате использования которого, текст каждого документа представляется соответствующим набором триплетов.
Для ранжирования документов используется классический механизм, основанный на векторном представлении текста и относительных частотах отдельных термов словаря коллекции. Однако вместо вектора используется двумерная матрица 3ХN где N - количество триплетов в коллекции, а вместо компонент вектора (относительных частот) - показатели достоверности триплетов. Подробнее см. здесь.

Система реализуется на базе:
- Синтаксического анализатора Dictum
- Лексико-синтаксических шаблонов
- Поискового движка Lucene

Комментарии

Тематика серьёзная, требующая

Тематика серьёзная, требующая более серьезного рассмотрения. Надеюсь увидим в будущих статьях.