Адаптивный Алгоритм Извлечения Информации - (LP)2 Learning Pattern by Language Processing

Опубликовано evgeny - пн, 03/02/2009 - 19:36

Это - очередная заметка из цикла обзоров технологий компьютерной лингвистики, применяемых в Шеффилдском университете. Алгоритм применяется исследователями из группы Web Intelligence Technologies для автоматизации аннотации ресурсов в Semantic Web. Это - алгоритм адаптивного Извлечения Информации, который выводит символические правила с помощью обучения по размеченному корпусу. Обучение выполняется с помощью обобщения примеров из тренировочного корпуса.

Melita - интрефейс для взаимодействия пользователя и системы автоматического аннотирования для Semantic Web, Amiclare

Опубликовано evgeny - пт, 02/27/2009 - 21:25

Melita - это интерфейс аннотирования, который использует системы извлечения информации из текста для упрощения аннотирования текста в Semantic Web. Работа с системой аннотации начинается с создания сценария, включающего набор тегов (возможна их организация в виде онтологии) и корпуса текстов для аннотирования. Аннотации вставляются выбором тега из онтологии и идентификации с помощью мыши куска текста для аннотации. Melita работает на базе адаптивного средства для Извлечения Информации Amiclare, которое использует алгоритмы обучения (LP)2.