МИНОБРНАУКИ РОССИИ
Санкт-Петербургский государственный
электротехнический университет
«ЛЭТИ» им. В.И. Ульянова (Ленина)
Кафедра БТС
отчет
по индивидуальному домашнему заданию
по дисциплине «Технологии и системы принятия решений»
Тема: Классификация особо опасных сердечных аритмий
Студент гр. 7503 |
|
Дегилевич А.А. |
Преподаватель |
|
Манило Л.А. |
Санкт-Петербург
2022
ЗАДАНИЕ
на ИНДИВИДУАЛЬНОЕ ДОМАШНЕЕ ЗАДАНИЕ
Студент: Дегилевич Андрей Алексеевич |
||
Группа: 7503 |
||
Тема индивидуального домашнего задания: Классификация особо опасных сердечных аритмий |
||
Исходные данные: Отсчёты спектральной плотности мощности коротких фрагментов ЭКГ сигнала. Длительность каждого фрагмента 2 с, частота дискретизации 360 Гц. Спектр сигнала ограничен верхней частотой 15 Гц, а отсчёты СПМ задаются с шагом 1.4 Гц. Выборка данных включает несколько классов ЭКГ (ФР, ЖТ, ФЖ). Требуется для заданных классов сигналов выполнить следующее: 1) провести классификацию данных методом k ближайших соседей; первые 15 объектов использовать как обучающую выборку, вторые 15 объектов использовать для тестирования; 2) построить решающие правила для распознавания трёх классов объектов, используя методы классификации: а) случай независимых признаков (по минимуму расстояния); б) случай равных ковариационных матриц; в) по критерию Фишера (множественный анализ); 3) для методов п. 2, а и 2, б определить направление W (ориентирует положение разделяющей гиперплоскости); для метода п. 2, в – плоскость собственных векторов W1, W2. 4) записать уравнения разделяющих гиперплоскостей; 5) отобразить распределение объектов заданных классов в направлении W; 6) вычислив для каждого класса среднее и дисперсию проекций объектов на направление W, получить функции плотности вероятности (использовать нормальный закон распределения); 7) построить ROC кривые; провести сравнение эффективности алгоритмов классификации; 8) записать решающие правила и оценить ошибки классификации (точность распознавания). Для объектов трех классов свести задачу к поэтапному решению двухклассовых задач. |
||
Предполагаемый объем индивидуального домашнего задания: Не менее 10 страниц (обязательны разделы «Содержание», «Метод k ближайших соседей», «Метод главных компонент», «Метод классификации по минимуму расстояний», «Метод классификации по критерию Фишера, «Приложения»).
|
||
Дата выдачи задания: 15.09.2022 |
||
Дата сдачи реферата: |
||
Дата защиты реферата: |
||
|
||
Студент |
|
Дегилевич А.А. |
Преподаватель |
|
Манило Л.А. |
Содержание
1 |
Метод k ближайших соседей |
5 |
2 |
Метод главных компонент |
12 |
3 |
Метод классификации по минимуму расстояний |
13 |
4 |
Метод классификации по критерию Фишера |
17 |
5 |
Метод классификации по критерию Фишера для многоклассовой задачи |
21 |
6 |
Сравнение методов |
24 |
|
Заключение |
26 |
|
Приложение А. Программный код (MATLAB) |
27 |
1 Метод k ближайших соседей
Для классификации методом k ближайших соседей воспользуемся функцией MATLAB – fitcknn. В работе используется два варианта метода k ближайших соседей:
1 вариант – классический способ. Объект присваивается тому классу, который является наиболее распространённым среди k соседей данного элемента, классы которых уже известны (т.е. объект имеет наибольшее число соседей в данном классе).
2 вариант – взвешенный способ, Оценивается не только количество объектов, попавших в область близости каждого класса, но и их удалённость от нового объекта.
Для каждого варианта строится зависимость общей точности от числа ближайших соседей. Количество соседей изменяется от 3 до 9. Обучение модели проходит на обучающей выборке, которая содержит по 15 случайных объектов каждого класса. Расчет параметров и оценка модели проводится на тестовой выборке, в которой содержатся 15 случайных объектов каждого класса не входящих в тестовую выборку. Расчет общей точности производится по формуле (1). В таблице используется следующая нумерация классов: 1 класс – фоновый ритм (ФР), 2 класс – желудочная тахикардия (ЖТ), 3 класс – фибрилляция желудочков (ФЖ).
Оценка качества классификации (общая точность):
|
(1) |
где – число объектов i-го класса, отнесенных к классу j; – число верно распознанных объектов i-го класса; – число объектов класса i.
ОА – это доля правильно распознанных классов. Показывает возможность алгоритма правильно распознавать классы.
Таблица 1 – Матрица результатов классификации
Истинный класс, i |
Число объектов |
Результат распознавания (класс), j |
||
1 |
2 |
3 |
||
1 |
|
|
|
|
2 |
|
|
|
|
3 |
|
|
|
|
В таблицах 2-8 представлены результаты классическим методом k ближайших соседей для количества соседей от 3 до 9 соответственно.
а) k = 3
Таблица 2 – Результаты классификации при k = 3
Истинный класс, i |
Число объектов |
Результат распознавания (класс), j |
||
1 |
2 |
3 |
||
1 |
15 |
12 |
0 |
3 |
2 |
15 |
2 |
12 |
1 |
3 |
15 |
0 |
0 |
15 |
ОА = 0,8
б) k = 4
Таблица 3 – Результаты классификации при k = 4
Истинный класс, i |
Число объектов |
Результат распознавания (класс), j |
||
1 |
2 |
3 |
||
1 |
15 |
12 |
0 |
3 |
2 |
15 |
5 |
9 |
1 |
3 |
15 |
0 |
0 |
15 |
ОА = 0,67
в) k = 5
Таблица 4 – Результаты классификации при k = 5
Истинный класс, i |
Число объектов |
Результат распознавания (класс), j |
||
1 |
2 |
3 |
||
1 |
15 |
11 |
0 |
4 |
2 |
15 |
2 |
12 |
1 |
3 |
15 |
0 |
0 |
15 |
ОА = 0,78
г) k = 6
Таблица 5 – Результаты классификации при k = 6
Истинный класс, i |
Число объектов |
Результат распознавания (класс), j |
||
1 |
2 |
3 |
||
1 |
15 |
11 |
0 |
4 |
2 |
15 |
4 |
10 |
1 |
3 |
15 |
0 |
0 |
15 |
ОА = 0,69
д) k = 7
Таблица 6 – Результаты классификации при k = 7
Истинный класс, i |
Число объектов |
Результат распознавания (класс), j |
||
1 |
2 |
3 |
||
1 |
15 |
9 |
0 |
4 |
2 |
15 |
3 |
11 |
1 |
3 |
15 |
0 |
0 |
15 |
ОА = 0,69
е) k = 8
Таблица 7 – Результаты классификации при k = 8
Истинный класс, i |
Число объектов |
Результат распознавания (класс), j |
||
1 |
2 |
3 |
||
1 |
15 |
10 |
1 |
4 |
2 |
15 |
6 |
8 |
1 |
3 |
15 |
0 |
0 |
15 |
ОА = 0,58
ж) k =9
Таблица 8 – Результаты классификации при k = 9
Истинный класс, i |
Число объектов |
Результат распознавания (класс), j |
||
1 |
2 |
3 |
||
1 |
15 |
10 |
2 |
3 |
2 |
15 |
5 |
9 |
1 |
3 |
15 |
0 |
0 |
15 |
ОА = 0,62
В таблицах 9-15 представлены результаты взвешенным методом k ближайших соседей для количества соседей от 3 до 9 соответственно.
а) k = 3
Таблица 9 – Результаты классификации при k = 3
Истинный класс, i |
Число объектов |
Результат распознавания (класс), j |
||
1 |
2 |
3 |
||
1 |
15 |
12 |
0 |
3 |
2 |
15 |
2 |
12 |
1 |
3 |
15 |
0 |
0 |
15 |
ОА = 0,8
б) k = 4
Таблица 10 – Результаты классификации при k = 4
Истинный класс, i |
Число объектов |
Результат распознавания (класс), j |
||
1 |
2 |
3 |
||
1 |
15 |
12 |
0 |
3 |
2 |
15 |
2 |
12 |
1 |
3 |
15 |
0 |
0 |
15 |
ОА = 0,8
в) k = 5
Таблица 11 – Результаты классификации при k = 5
Истинный класс, i |
Число объектов |
Результат распознавания (класс), j |
||
1 |
2 |
3 |
||
1 |
15 |
12 |
0 |
3 |
2 |
15 |
1 |
13 |
1 |
3 |
15 |
0 |
0 |
15 |
ОА = 0,84
г) k = 6
Таблица 12 – Результаты классификации при k = 6
Истинный класс, i |
Число объектов |
Результат распознавания (класс), j |
||
1 |
2 |
3 |
||
1 |
15 |
12 |
0 |
3 |
2 |
15 |
1 |
13 |
1 |
3 |
15 |
0 |
0 |
15 |
ОА = 0,84
д) k = 7
Таблица 13 – Результаты классификации при k = 7
Истинный класс, i |
Число объектов |
Результат распознавания (класс), j |
||
1 |
2 |
3 |
||
1 |
15 |
12 |
0 |
3 |
2 |
15 |
1 |
13 |
1 |
3 |
15 |
0 |
0 |
15 |
ОА = 0,84
е) k = 8
Таблица 14 – Результаты классификации при k = 8
Истинный класс, i |
Число объектов |
Результат распознавания (класс), j |
||
1 |
2 |
3 |
||
1 |
15 |
12 |
0 |
3 |
2 |
15 |
2 |
12 |
1 |
3 |
15 |
0 |
0 |
15 |
ОА = 0,8
ж) k =9
Таблица 15 – Результаты классификации при k = 9
Истинный класс, i |
Число объектов |
Результат распознавания (класс), j |
||
1 |
2 |
3 |
||
1 |
15 |
12 |
0 |
3 |
2 |
15 |
2 |
12 |
1 |
3 |
15 |
0 |
0 |
15 |
ОА = 0,8
На рисунке 1 представлены графики зависимости общей точности от количества ближайших соседей для обоих вариантов метода.
Рисунок 1 – Графики зависимости ОА от k
При использовании метода k ближайших соседей наибольшая точность достигнута при k = 5-7 во взвешенном варианте метода и равняется 0,84. На рисунке 2 можно заметить, что при разных значения k взвешенный вариант дает большую точность, чем стандартный вариант метода, что свидетельствует о его большей стабильности и предпочтительности.
Код программы для расчета параметров при классификации методом k ближайших соседей представлен в приложении А.