Добавил:

without_me Я и кто? Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Московский технический университет связи и информатики

Предмет:

Управление данными

Файл:

Лабораторная работа №8

.docx

Скачиваний:

5

Добавлен:

10.09.2023

Размер:

747.42 Кб

Скачать

☆

Министерство цифрового развития, связи и массовых коммуникаций

Российской Федерации Ордена Трудового Красного Знамени

федеральное государственное бюджетное образовательное

учреждение высшего образования

Московский технический университет связи и информатики

Кафедра «Математическая кибернетика и информационные технологии»

Лабораторная работа №8

по дисциплине

«Управление данными»

Москва 2023

Оглавление

Цель работы 2

Ход лабораторной работы 3

Вывод 23

Цель работы

Ознакомиться с методами классификации модуля Sklearn

Ход лабораторной работы

Создадим Python скрипт и загрузим данные в датафрейм. Загрузим данные в датафрейм

Рисунок 1 – Загрузка данных в датафрейм

Выделим данные и их метки

Рисунок 2 – Код

Преобразуем тексты меток к числам

Рисунок 3 – Код

Разобьём выборку на обучающую и тестовую

Рисунок 4 – Код

Проведем классификацию наблюдений используя LDA

Рисунок 5 – Полученный результат

Используя функцию score() выведем точность классификации

Рисунок 6 – Полученный результат

Построим график зависимости неправильно классифицированных наблюдений и точности классификации от размера тестовой выборки. Размер тестовой выборки изменяем от 0.05 до 0.95 с шагом 0.05.

Рисунок 7 – Полученный результат

Опишем для чего нужна функция transform. Применим ее, и визуализируем результаты.

Рисунок 8 – Полученный результат

Исследуем работу классификатор при различных параметрах solver, shrinkage.

Рисунок 9 – Полученный результат

Рисунок 10 – Полученный результат

Рисунок 11 – Полученный результат

Рисунок 12 – Полученный результат

Рисунок 13 – Полученный результат

Задаем априорную вероятность классу с номером 1 равную 0.7, остальным классам зададим равные априорные вероятности

Рисунок 14 – Полученный результат

Рисунок 15 – Полученный результат

Классификацию при SVM на тех же данных

Рисунок 16 – Полученный результат

Используя функцию score() выведем точность классификации

Рисунок 17 – Полученный результат

Выведем следующую информацию

Рисунок 18 – Полученный результат

Построим график зависимости неправильно классифицированных наблюдений и точности классификации от размера тестовой выборки. Размер тестовой выборки изменяем от 0.05 до 0.95 с шагом 0.05. Параметр random_state сделаем равным номеру своей зачетной книжки. Обоснуем полученные результаты.

Рисунок 19 – Полученный результат

Исследуем работу метода опорных векторов при различных значениях kernel, degree,max_iter

Рисунок 20 – Полученный результат

Рисунок 21 – Полученный результат

Рисунок 22 – Полученный результат

Рисунок 23 – Полученный результат

Рисунок 24 – Полученный результат

Рисунок 25 – Полученный результат

Рисунок 26 – Полученный результат

Рисунок 27 – Полученный результат

Рисунок 28 – Полученный результат

Проведем исследование для методов NuSVC и LinearSVC. В чем их отличие от SVC

Рисунок 29 – Полученный результат

Рисунок 30 – Полученный результат

Вывод

Ознакомился с методами классификации модуля Sklearn

Соседние файлы в предмете Управление данными

#
10.09.2023843.1 Кб64Лабораторная работа №3.docx
#
10.09.20231.14 Mб57Лабораторная работа №4.docx
#
10.09.20231.4 Mб52Лабораторная работа №5.docx
#
10.09.20231.58 Mб12Лабораторная работа №6.docx
#
10.09.20231.1 Mб5Лабораторная работа №7.docx
#
10.09.2023747.42 Кб5Лабораторная работа №8.docx