лб1
.docx
Санкт-Петербургский государственный университет телекоммуникаций
им. проф. М. А. Бонч-Бруевича
Факультет информационных систем и технологий
Кафедра безопасности информационных систем
Дисциплина «Методы и средства проектирования
информационных систем и технологий»
Отчет
по лабораторной работе № 1
«Проектирование системы классификации и кодирования»
Группа: ИСТ-22
Выполнили: Савлиш А.
Круглова Т.
Проверила: Котлова М.В.
Цель работы: получить навыки проектирования систем классификации и кодирования различных видов информации, полученной в ходе проведения предпроектного обследования.
В ходе данной лабораторной работы для проектирования систем классификаций были выбраны книги. Радикально возросшее число книг потребовало систем их классификации. В течение 20-го века библиотеки были озабочены отслеживанием многочисленных новых книг, число которых увеличивалось ежегодно. В рамках данной лабораторной работы мы выполнили классификацию данной предметной области тремя методами: иерархическим, фасетным, дескрипторным (описательным).
Ход работы
-
Была спроектирована иерархическая модель (рис.1)
Рис 1. - Иерархическая модель
Код элемента |
Тип элемента |
Наименование элемента |
1 |
классификация |
форма |
101 |
жанр |
роман |
102 |
жанр |
повесть |
103 |
жанр |
пьесса |
104 |
жанр |
рассказ |
105 |
жанр |
очерк |
2 |
классификация |
содержание |
21 |
направление |
комедия |
211 |
жанр |
фарс |
212 |
жанр |
скетч |
213 |
жанр |
водевиль |
214 |
жанр |
пародия |
215 |
жанр |
интермедиа |
22 |
направление |
трагедия |
23 |
направление |
драма |
3 |
классификация |
род |
31 |
направление |
эпические |
311 |
жанр |
поэма |
312 |
жанр |
рассказ |
313 |
жанр |
сказка |
314 |
жанр |
миф |
32 |
направление |
лирические |
321 |
жанр |
ода |
322 |
жанр |
послание |
323 |
жанр |
эпиграмма |
33 |
направление |
драмматические |
331 |
жанр |
драма |
312 |
жанр |
трагедия |
313 |
жанр |
комедия |
-
Была спроектирована фасетная модель (рис.2)
Рис.2 – Фасетная модель
Задача №1 Какую книгу написал Рэй Брэдбери в 20 веке? Решение: Ф13?Ф21 = «451 градус по Фаренгейту».
Задача №2 Найти все книги изданные в 20 веке Стивена Кинга. Решение: Ф14?Ф21 = «Кэрри».
Задача №3 Найти книги, выпущенные в 21 веке жанра «классическая проза». Решение: Ф22?Ф33 = «Старик и море», «Праздник, который всегда с тобой».
Задача №4 Какие книги жанра «зарубежная мистика» выпущены в 21 веке? Решение: Ф22?Ф25 = «Возрождение».
Задача №5 Какое фэнтези произведение написал Джордж Р.Р. Мартин в 20 веке? Решение: Ф15?Ф21?Ф32 = «Игра престолов», «Буря мечей».
-
Была разработана дескрипторная модель
Был составлен неполный список наиболее часто используемых слов для поиска информации о литературе и книгах.
-
Классика, классическая литература
-
Джордж Мартин
-
Книга года
-
Фэнтези
-
Древние книги
-
Приключения
-
Книги для подростков
-
Детективы
-
Запись в библиотеку онлайн
-
Фантастика
-
Космическая фантастика
-
Социальная фантастика
-
Школьные книги, книги учебная программа, школьная программа
-
Научные книги
-
Былины
-
Литература 18 века
-
Детские книги
-
Книги по жанрам, жанры книг
-
Издательство “Питер”
-
Слово о полку Игореве
-
Без возрастных ограничений
-
Новинка, новинки 2015
-
Книги Германии
-
Ужасы
-
Серии книг
-
Интеллектуальный бестселлер
Представленный выше список был нормализован, из списка синонимов были выбраны наиболее употребляемые.
В ходе нормализации был составлен словарь дескрипторов.
-
Классическая литература
-
Детские книги
-
Книги для подростков
-
Фэнтези
-
Детективы
-
Школьная программа
-
Научные книги
-
Литература 18 века
-
Фантастика
-
Серии книг
-
Синонимическая связь, указывающая некоторую совокупность ключевых слов как синонимы.
Пример: литература-книги
-
Родовидовая связь. Указывает на общность некоторых объектов
Примеры: книги для подростков-детские книги, классическая литература-литература 18 века
-
Ассоциативная связь. Соединяет дескрипторы, обладающие общими свойствами, позволяющая расширить область поиска информации.
Пример: фэнтези-детективы-фантастика
Вывод
В ходе выполнения лабораторной работы были изучены три метода классификации данных. Были выявлены определенные недостатки и явные преимущества каждой из них. Иерархическая классификация позволяет хранить огромное количество данных, всегда иметь возможность отследить происхождение и исходные данные. Однако явным недостатком такого вида классификации является недостаточная гибкость и трудность в добавлении новых объектов в средние и верхние уровни. Фасетный метод классификации, как и иерархический, позволяет использовать большие объемы данных, но в отличие от предыдущей, является очень гибкой и модульной. Возможность добавления новых данных в систему без глобальных переделок. Недостатками такой классификации является большая ресурсозатратность из-за неполного использования емкости, а также не традиционность и сложность применения. Дескрипторная классификация сильно отличается от двух предыдущих. Этот метод используется в поисковых системах для так называемого интеллектуального поиска, позволяет строить связи между объектами, однако требует длительной подготовки перед запуском системы, подготовки дескрипторных словарей, создание связей, которые создаются вручную без какой-то очевидной системы.
Исходя из вышесказанного, можно отметить, что дескрипторный метод чаще используют в поисковых системах интернета или библиотеках, фасетная используется в классификации товаров, определения категорий. А иерархическая позволяет ранжировать данные. Это может быть полезно в тех же магазинах или местах, где легко можно объединить объекты в одну категорию.
Санкт-Петербург
2015