Автор выступил с докладом на семинаре РОМИП'2009 и конференции RCDL'2009, которые проходили в г. Петрозаводске.
Содержание доклада основано на работе, проведенной участниками проекта SEUS за 2008-2009 уч. год.
Доступны презентация доклада и соответствующая статья.
Это - очередная заметка из цикла обзоров технологий компьютерной лингвистики, применяемых в Шеффилдском университете. Алгоритм применяется исследователями из группы Web Intelligence Technologies для автоматизации аннотации ресурсов в Semantic Web. Это - алгоритм адаптивного Извлечения Информации, который выводит символические правила с помощью обучения по размеченному корпусу. Обучение выполняется с помощью обобщения примеров из тренировочного корпуса.
Melita - это интерфейс аннотирования, который использует системы извлечения информации из текста для упрощения аннотирования текста в Semantic Web. Работа с системой аннотации начинается с создания сценария, включающего набор тегов (возможна их организация в виде онтологии) и корпуса текстов для аннотирования. Аннотации вставляются выбором тега из онтологии и идентификации с помощью мыши куска текста для аннотации. Melita работает на базе адаптивного средства для Извлечения Информации Amiclare, которое использует алгоритмы обучения (LP)2.
В продолжение переписки в рассылке сообщества Веба Данных черкну небольшую заметку.
Познакомился с замечательной группой исследователей The Web Intelligence Technologies group все из того же Шефилдского Университета.
Первое впечатление, моих студентов, которым я читал лекцию про Semantic Web, было пронизано идеей о том, что Semantic Web каким-то хитрым способом, но все-таки поможет сделать поиск в Интернет более качественным. Тем более, как одно из приложений Семантической Паутины, авторы данного проекта указывают поиск с учетом семантики. Думаю, что эта идея посетила большинство из тех, кто что-то слышал о Semantic Web тоже.
Однако, посмотрим, чего реально в этой отрасли добился Semantic Web.
Здесь представлены мои основные публикации. Также доступен полный список публикаций.
Курс читался студентам 5-го курса физического факультета с кафедры Компьютерных Систем и Телекоммуникаций.
Объем курса: лекции - 34 часа, практика - 34 часа.
Последние комментарии
1 год 28 недель назад
1 год 28 недель назад