МИНОБРНАУКИ РОССИИ
Санкт-Петербургский государственный
электротехнический университет
«ЛЭТИ» им. В.И. Ульянова (Ленина)
Кафедра биотехнических систем
ИНДИВИДУАЛЬНОЕ ДОМАШНЕЕ ЗАДАНИЕ
по дисциплине «Технологии и системы принятия решений»
Вариант 9
Студентка гр. 6503 |
|
Лебедь Г. Р. М. |
Преподаватель |
|
Манило Л. А. |
Санкт-Петербург
2021
ЗАДАНИЕ
НА ИДЗ
Студентка Лебедь Г. Р. М.
Группа 6503
Исходные данные:
представляют собой отсчеты спектральной плотности мощности коротких фрагментов ЭКГ сигнала. Длительность каждого фрагмента 2 с, частота дискретизации 360 Гц. Анализируется область низких частот в диапазоне, не превышающем 20 Гц.
Выборка данных включает несколько классов ЭКГ:
1 класс – фибрилляция желудочков ФЖ;
2 класс – желудочковая тахикардия ЖТ;
3 класс – фоновый ритм ФР.
Каждый из трёх классов представлен 30 объектами.
Необходимо:
провести классификацию данных методом k ближайших соседей; первые 15 объектов использовать как обучающую выборку, вторые 15 объектов использовать для тестирования;
построить решающие правила для распознавания трёх классов объектов, используя методы классификации:
по минимуму расстояния (сравнение с эталонами – центрами классов);
по критерию Фишера.
для каждого из методов п. 2 определить направление W (ориентирует положение разделяющей гиперплоскости);
записать уравнения разделяющих гиперплоскостей;
отобразить распределение объектов заданных классов в направлении W;
вычислив для каждого класса среднее и дисперсию проекций объектов на направление W, получить функции плотности вероятности (использовать нормальный закон распределения);
построить ROC кривые;
провести сравнение эффективности алгоритмов классификации;
записать решающие правила и оценить ошибки классификации (точность распознавания).
Для объектов трех классов свести задачу к поэтапному решению двух классовых задач.
Требования к отчету:
Файл Word с титульным листом, заданием, основным текстом, приложением. Основной текст должен содержать основные вычисления и результат, полученный по каждому пункту задания, а также комментарий к ним; необходимо дать собственную оценку возможности распознавания каждого из заданных классов объектов в пространстве спектральных параметров.
Дата выдачи задания: 20.09.2021
Дата сдачи: 12.12.2021
Дата защиты: 16.12.2021
Студентка гр. 6503 |
|
Лебедь Г. Р. М. |
Преподаватель |
|
Манило Л. А |
Содержание
Не описаны процедуры нахождения разделяющих гиперплоскостей. В основном приводятся лишь конечные результаты.
Метод k ближайших соседей
Сначала был протестирован обычный метод k ближайших соседей, при котором наблюдение относится к тому классу, количество объектов которого среди k ближайших соседей наибольшее. Для каждого наблюдения из тестовой выборки были найдены k ближайших соседей среди наблюдений тренировочной выборки и по этим соседям были присвоены соответствующие классы. Результаты приведены в таблицах 1-8.
Таблица 1 – Обычный метод, k = 3, OA = 88.89%
Истинный класс, i |
Число объектов |
Результат распознавания (класс), j |
||
1 |
2 |
3 |
||
1 |
15 |
14 |
1 |
0 |
2 |
15 |
3 |
12 |
0 |
3 |
15 |
0 |
1 |
14 |
Таблица 2 – Обычный метод, k = 4, OA = 86.67%
Истинный класс, i |
Число объектов |
Результат распознавания (класс), j |
||
1 |
2 |
3 |
||
1 |
15 |
14 |
1 |
0 |
2 |
15 |
3 |
12 |
0 |
3 |
15 |
0 |
2 |
13 |
Таблица 3 – Обычный метод, k = 5, OA = 88.89%
Истинный класс, i |
Число объектов |
Результат распознавания (класс), j |
||
1 |
2 |
3 |
||
1 |
15 |
14 |
1 |
0 |
2 |
15 |
3 |
11 |
1 |
3 |
15 |
0 |
0 |
15 |
Таблица 4 – Обычный метод, k = 6, OA = 82.22%
Истинный класс, i |
Число объектов |
Результат распознавания (класс), j |
||
1 |
2 |
3 |
||
1 |
15 |
14 |
1 |
0 |
2 |
15 |
4 |
11 |
0 |
3 |
15 |
0 |
3 |
12 |
Таблица 5 – Обычный метод, k = 7, OA = 88.89%
Истинный класс, i |
Число объектов |
Результат распознавания (класс), j |
||
1 |
2 |
3 |
||
1 |
15 |
14 |
1 |
0 |
2 |
15 |
4 |
11 |
0 |
3 |
15 |
0 |
0 |
15 |
Таблица 6 – Обычный метод, k = 8, OA = 86.67%
Истинный класс, i |
Число объектов |
Результат распознавания (класс), j |
||
1 |
2 |
3 |
||
1 |
15 |
14 |
1 |
0 |
2 |
15 |
4 |
11 |
0 |
3 |
15 |
0 |
1 |
14 |
Таблица 7 – Обычный метод, k = 9, OA = 91.11%
Истинный класс, i |
Число объектов |
Результат распознавания (класс), j |
||
1 |
2 |
3 |
||
1 |
15 |
14 |
1 |
0 |
2 |
15 |
3 |
12 |
0 |
3 |
15 |
0 |
0 |
15 |
Таблица 8 – Обычный метод, k = 10, OA = 93.33%
Истинный класс, i |
Число объектов |
Результат распознавания (класс), j |
||
1 |
2 |
3 |
||
1 |
15 |
15 |
0 |
0 |
2 |
15 |
3 |
12 |
0 |
3 |
15 |
0 |
0 |
15 |
Исходя из таблиц, лучший результат получается при k равном 9 (точность 93.33%, чувствительности к НР, ЖТ, ФЖ равны 100%, 80%, 100% соответственно).
Потом был протестирован взвешенный метод, при котором среди k ближайших соседей наблюдение относится к тому классу, сумма весов наблюдений которого наибольшая. В качестве веса была взята величина, обратная евклидовому расстоянию между наблюдением тестовой выборки и соседом. Полученные результаты приведены в таблицах 9-16.
Таблица 9 – Взвешенный метод, k = 3, OA = 88.89%
Истинный класс, i |
Число объектов |
Результат распознавания (класс), j |
||
1 |
2 |
3 |
||
1 |
15 |
14 |
1 |
0 |
2 |
15 |
3 |
12 |
0 |
3 |
15 |
0 |
1 |
14 |
Таблица 10 – Взвешенный метод, k = 4, OA = 88.89%
Истинный класс, i |
Число объектов |
Результат распознавания (класс), j |
||
1 |
2 |
3 |
||
1 |
15 |
14 |
1 |
0 |
2 |
15 |
3 |
12 |
0 |
3 |
15 |
0 |
1 |
14 |
Таблица 11 – Взвешенный метод, k = 5, OA = 88.89%
Истинный класс, i |
Число объектов |
Результат распознавания (класс), j |
||
1 |
2 |
3 |
||
1 |
15 |
14 |
1 |
0 |
2 |
15 |
3 |
11 |
1 |
3 |
15 |
0 |
0 |
15 |
Таблица 12 – Взвешенный метод, k = 6, OA = 91.11%
Истинный класс, i |
Число объектов |
Результат распознавания (класс), j |
||
1 |
2 |
3 |
||
1 |
15 |
14 |
1 |
0 |
2 |
15 |
3 |
12 |
0 |
3 |
15 |
0 |
0 |
15 |
Таблица 13 – Взвешенный метод, k = 7, OA = 88.89%
Истинный класс, i |
Число объектов |
Результат распознавания (класс), j |
||
1 |
2 |
3 |
||
1 |
15 |
14 |
1 |
0 |
2 |
15 |
4 |
11 |
0 |
3 |
15 |
0 |
0 |
15 |
Таблица 14 – Взвешенный метод, k = 8, OA = 91.11%
Истинный класс, i |
Число объектов |
Результат распознавания (класс), j |
||
1 |
2 |
3 |
||
1 |
15 |
14 |
1 |
0 |
2 |
15 |
3 |
12 |
0 |
3 |
15 |
0 |
0 |
15 |
Таблица 15 – Взвешенный метод, k = 9, OA = 91.11%
Истинный класс, i |
Число объектов |
Результат распознавания (класс), j |
||
1 |
2 |
3 |
||
1 |
15 |
14 |
1 |
0 |
2 |
15 |
3 |
12 |
0 |
3 |
15 |
0 |
0 |
15 |
Таблица 16 –Взвешенный метод, k = 10, OA = 91.11%
Истинный класс, i |
Число объектов |
Результат распознавания (класс), j |
||
1 |
2 |
3 |
||
1 |
15 |
14 |
1 |
0 |
2 |
15 |
3 |
12 |
0 |
3 |
15 |
0 |
0 |
15 |
Исходя из таблиц, лучшие по точности результаты получаются при k равном 6, 8, 9, 10 (точность 91.11%, чувствительности к НР, ЖТ, ФЖ равны 100%, 80%, 93.33% соответственно).
При сравнении обоих типов методов можно сделать вывод, что обычная версия метода может давать более точный результат, но при большем числе соседей.
Код программы для работы с классификатором k ближайших соседей приведен в приложении А.
Надо было построить график.
Какоми данными я должна воспользоваться для реализации алгоритма?