Интеллектуальные агенты 2008-2009

Курс читался студентам 5-го курса физического факультета с кафедры Компьютерных Систем и Телекоммуникаций.
Объем курса: лекции - 34 часа, практика - 34 часа.

Содержание

  1. Цель курса
  2. Требования к студентам по результатам изучения
  3. Содержание курса
  4. Практические задания
  5. Вопросы к теоретическому зачету

Цель курса

Цель данного курса состоит в ознакомлении студентов с Интернет технологиями, которые позволяют создавать ресурсы и системы, основанные на знаниях. Все рассматриваемые технологии и методы лежат в русле подхода Semantic Web. Обсуждаются основы создания интеллектуальных систем. Рассматривается математическое обеспечение средств для представления знаний, онтологий и RDF словарей, подходы к их разработке, а также соответствующие технические средства. Описываются технологии, позволяющие использовать средства для представления знаний в существующей инфраструктуре всемирной паутины. Рассматриваются классические задачи информационного поиска и методы их решения.

Требования к студентам по результатам изучения

Студенты должны владеть подходами к проектированию интеллектуальных систем, уметь представлять знания в виде онтологий и RDF словарей, иметь представление о синтаксисе средств для представления знаний, осознавать положение спецификаций Semantic Web в существующей инфраструктуре WWW, и владеть приемами внедрения интеллектуальных Интернет технологий в существующие ресурсы. Студенты должны знать о программных интерфейсах для работы с семантическими данными, знать модели и структуры данных, которые в них используются, иметь практические навыки работы с ними. А также методы решения задач полнотекстового поиска и соответствующие программные средства.

Содержание курса

  • Основные материалы:
    1. Интеллектуальные системы, представление знаний, логический вывод
    2. Интеллектуальные агенты
    3. Распознавание образов
    4. Генетические алгоритмы
    5. Введение в Semantic Web
    6. Онтологии
    7. GRDDL - Извлечение RDF из XHTML
    8. Веб сервисы, WSDL 2.0
    9. Веб сервисы в Semantic Web
    10. Введение в Jena
    11. Jena: API для RDF
    12. Jena: API для онтологий
    13. Информационный поиск
    14. Lucene - Java API для полнотекстового поиска
  • Дополнительные материалы для выполнения практических заданий:
    1. Язык программирования Java
    2. Сервлеты и J2EE
    3. Контейнер сервлетов Tomcat
    4. Развертывание Веб приложения

Практические задания

  1. Разаработка онтологии по индивидуальной теме, согласно требованиям, в редакторе Protege.
  2. Разработка веб приложения, отображающего все классы, свойства и экземпляры разработанной онтологии, с помощью контейнера сервлетов Tomcat и библиотеки Jena.
  3. Доработка разработанного приложения по индивидуальному заданию.

Вопросы к теоретическому зачету

  1. Концепция семантик Веб, подходы к построению www, взаимодействие людей и машин, необходимые технические средства.
  2. Триплетная модель данных, язык RDF, встраивание RDF в HTML, извлечение, доступ к хранилищам триплетов, общая схема приложения.
  3. Онтологии, что это такое, применение, языки для записи, иерархия языков, известные проекты, инструментарий.
  4. Понятие об искусственном интеллекте, его направления, модели представления знаний, вывод на знаниях, интеллектуальные системы.
  5. Онтологии: применение, определение в различных контекстах, структура, процесс создания, принципы построения, этапы разработки.
  6. GRDDL, связь с XML XHTML XSLT RDF RDF/a. Микроформаты и диалекты языков, примеры. Механизм извлечения, программы извлекающие семантику, инструментарий.
  7. Веб сервисы, WSDL. Определение и реализация сервиса, основные элементы описания. Типы сообщений, интерфейсы, шаблоны передачи сообщений, связывание. Пример.
  8. Семантические Веб сервисы, язык описания, расширения WSDL. Пример.
  9. Jena – применение и возможности. Средства для работы с RDF, работа с БД, логический вывод, интерфейс запросов.
  10. Jena – применение и возможности. Средства для работы с онтологиями, профили языков, модель онтологии и базовый граф, основные классы и методы.
  11. Информационный поиск, предмет поиска, задачи. Структуры данных в задаче поиска, линеаризация. Индекс и матрица представления, ее особенности. Виды индексов и их особенности, степень детализации индекса, сжатие индекса.
  12. Закон Ципфа, оценка релевантности, формула TF*IDF, ранжирование на основе векторного представления. Оценка результатов поиска, метрики.
  13. Поисковая машина – составляющие. Проект Lucene – общие сведения, применение, проекты на его базе. Структура индекса, нумерация документов, сегменты, его составляющие. Типы и атрибуты полей сегмента, их характеристики.
  14. Поисковая машина – составляющие. Проект Lucene – общие сведения, применение, проекты на его базе. Булева модель поиска. Порядок и параметры индексирования. Порядок начисления очков, класс Similarity.
  15. Нейронные сети, модель многослойного персептрона, активирующая функция. Использование в задаче распознавания образов. Обучение нейросети, методы обучения.
  16. Генетические алгоритмы. Применение. Общий вид алгоритма, основные этапы. Особенности размножения, борьба с локальными максимами.