Автор выступил с докладом на семинаре РОМИП'2009 и конференции RCDL'2009, которые проходили в г. Петрозаводске.
Содержание доклада основано на работе, проведенной участниками проекта SEUS за 2008-2009 уч. год.
Доступны презентация доклада и соответствующая статья.
Мы рады Вам сообщить, что для реализации проекта SEUS родная кафедра компьютерных систем и телекоммуникаций выделила нашей команде отдельный сервер
HP Compaq: Intel Pentium D 3 гГц, 1Гб, Windows Server 2003.
На его базе будут проводиться испытания нашего поисковика и отрабатываться решения задач РОМИП'2009.
Демонстрация возможностей поисковика доступна по адресу seus.rabchevsky.name/.
Участники проекта SEUS приняли решение об участии в семинаре РОМИП'2009.
Планируется использовать систему SEUS для решения классической задачи поиска по запросу
- по коллекции нормативно-правовых документов
- по Веб-коллекции.
Как ясно из названия SEUS - проект поисковой системы, использующей семантику.
На данный момент над проектом работают 4 человека, все они с кафедры Компьютерных систем и Телекоммуникаций Пермского Государственного Университета. Это:
Ассистент кафедры Рабчевский Евгений, и студенты 5-го курса Крупов Сергей, Рожков Михаил, Булатова Гульнара.
Приглашение к Участию
Седьмой Российский семинар по Оценке Методов Информационного Поиска (РОМИП'2009)
Февраль 2009 - Сентябрь 2009
http://romip.ru
Первое
информационное письмо
Первое впечатление, моих студентов, которым я читал лекцию про Semantic Web, было пронизано идеей о том, что Semantic Web каким-то хитрым способом, но все-таки поможет сделать поиск в Интернет более качественным. Тем более, как одно из приложений Семантической Паутины, авторы данного проекта указывают поиск с учетом семантики. Думаю, что эта идея посетила большинство из тех, кто что-то слышал о Semantic Web тоже.
Однако, посмотрим, чего реально в этой отрасли добился Semantic Web.
Американский лингвист Джордж Ципф из Гарвардского университета (George Kingsley Zipf) эмпирическим путем обнаружил закономерность распределения частоты слов естественного языка:
Большинство поисковых систем используют векторную модель представления текста. В соответствии с которой, обработка текстов документов коллекции происходит следующим образом:
Курс читался студентам 5-го курса физического факультета с кафедры Компьютерных Систем и Телекоммуникаций.
Объем курса: лекции - 34 часа, практика - 34 часа.
Последние комментарии
1 год 28 недель назад
1 год 28 недель назад