Курс читался студентам 5-го курса физического факультета с кафедры Компьютерных Систем и Телекоммуникаций.
Объем курса: лекции - 34 часа, практика - 34 часа.
Содержание
- Цель курса
- Требования к студентам по результатам изучения
- Содержание курса
- Практические задания
- Вопросы к теоретическому зачету
Цель курса
Цель данного курса состоит в ознакомлении студентов с Интернет технологиями, которые позволяют создавать ресурсы и системы, основанные на знаниях. Все рассматриваемые технологии и методы лежат в русле подхода Semantic Web. Обсуждаются основы создания интеллектуальных систем. Рассматривается математическое обеспечение средств для представления знаний, онтологий и RDF словарей, подходы к их разработке, а также соответствующие технические средства. Описываются технологии, позволяющие использовать средства для представления знаний в существующей инфраструктуре всемирной паутины. Рассматриваются классические задачи информационного поиска и методы их решения.
Требования к студентам по результатам изучения
Студенты должны владеть подходами к проектированию интеллектуальных систем, уметь представлять знания в виде онтологий и RDF словарей, иметь представление о синтаксисе средств для представления знаний, осознавать положение спецификаций Semantic Web в существующей инфраструктуре WWW, и владеть приемами внедрения интеллектуальных Интернет технологий в существующие ресурсы. Студенты должны знать о программных интерфейсах для работы с семантическими данными, знать модели и структуры данных, которые в них используются, иметь практические навыки работы с ними. А также методы решения задач полнотекстового поиска и соответствующие программные средства.
Содержание курса
- Основные материалы:
- Интеллектуальные системы, представление знаний, логический вывод
- Интеллектуальные агенты
- Распознавание образов
- Генетические алгоритмы
- Введение в Semantic Web
- Онтологии
- GRDDL - Извлечение RDF из XHTML
- Веб сервисы, WSDL 2.0
- Веб сервисы в Semantic Web
- Введение в Jena
- Jena: API для RDF
- Jena: API для онтологий
- Информационный поиск
- Lucene - Java API для полнотекстового поиска
- Дополнительные материалы для выполнения практических заданий:
- Язык программирования Java
- Сервлеты и J2EE
- Контейнер сервлетов Tomcat
- Развертывание Веб приложения
Практические задания
- Разаработка онтологии по индивидуальной теме, согласно требованиям, в редакторе Protege.
- Разработка веб приложения, отображающего все классы, свойства и экземпляры разработанной онтологии, с помощью контейнера сервлетов Tomcat и библиотеки Jena.
- Доработка разработанного приложения по индивидуальному заданию.
Вопросы к теоретическому зачету
- Концепция семантик Веб, подходы к построению www, взаимодействие людей и машин, необходимые технические средства.
- Триплетная модель данных, язык RDF, встраивание RDF в HTML, извлечение, доступ к хранилищам триплетов, общая схема приложения.
- Онтологии, что это такое, применение, языки для записи, иерархия языков, известные проекты, инструментарий.
- Понятие об искусственном интеллекте, его направления, модели представления знаний, вывод на знаниях, интеллектуальные системы.
- Онтологии: применение, определение в различных контекстах, структура, процесс создания, принципы построения, этапы разработки.
- GRDDL, связь с XML XHTML XSLT RDF RDF/a. Микроформаты и диалекты языков, примеры. Механизм извлечения, программы извлекающие семантику, инструментарий.
- Веб сервисы, WSDL. Определение и реализация сервиса, основные элементы описания. Типы сообщений, интерфейсы, шаблоны передачи сообщений, связывание. Пример.
- Семантические Веб сервисы, язык описания, расширения WSDL. Пример.
- Jena – применение и возможности. Средства для работы с RDF, работа с БД, логический вывод, интерфейс запросов.
- Jena – применение и возможности. Средства для работы с онтологиями, профили языков, модель онтологии и базовый граф, основные классы и методы.
- Информационный поиск, предмет поиска, задачи. Структуры данных в задаче поиска, линеаризация. Индекс и матрица представления, ее особенности. Виды индексов и их особенности, степень детализации индекса, сжатие индекса.
- Закон Ципфа, оценка релевантности, формула TF*IDF, ранжирование на основе векторного представления. Оценка результатов поиска, метрики.
- Поисковая машина – составляющие. Проект Lucene – общие сведения, применение, проекты на его базе. Структура индекса, нумерация документов, сегменты, его составляющие. Типы и атрибуты полей сегмента, их характеристики.
- Поисковая машина – составляющие. Проект Lucene – общие сведения, применение, проекты на его базе. Булева модель поиска. Порядок и параметры индексирования. Порядок начисления очков, класс Similarity.
- Нейронные сети, модель многослойного персептрона, активирующая функция. Использование в задаче распознавания образов. Обучение нейросети, методы обучения.
- Генетические алгоритмы. Применение. Общий вид алгоритма, основные этапы. Особенности размножения, борьба с локальными максимами.
Последние комментарии
1 год 20 недель назад
2 года 50 недель назад
2 года 50 недель назад