Дашин_ЛБ3
.docx
Лабораторная работа № 3
СРАВНИТЕЛЬНЫЙ АНАЛИЗ МЕТОДОВ КЛАССИФИКАЦИИ ДАННЫХ
Провести снижение размерности методами МГК (PCA) и t-sne.
Доля от общей дисперсии: [0.84136038 0.11751808 0.03473561 0.00638592]
Компоненты PCA:
[[ 0.42494212 -0.15074824 0.61626702 0.64568888]
[ 0.42320271 0.90396711 -0.06038308 -0.00983925]]
[0.84136038 0.11751808]
0.9588784639918416
Провести классификацию (с параметрами по умолчанию)
# 1 ДЕРЕВО РЕШЕНИЙ
precision recall f1-score support
0 1.00 1.00 1.00 40
1 0.89 0.92 0.91 37
2 0.93 0.91 0.92 43
accuracy 0.94 120
macro avg 0.94 0.94 0.94 120
weighted avg 0.94 0.94 0.94 120
#2 К-БЛИЖАЙШИХ СОСЕДЕЙ
precision recall f1-score support
0 1.00 1.00 1.00 40
1 0.89 0.92 0.91 37
2 0.93 0.91 0.92 43
accuracy 0.94 120
macro avg 0.94 0.94 0.94 120
weighted avg 0.94 0.94 0.94 120
#3 СЛУЧАЙНЫЙ ЛЕС
precision recall f1-score support
0 1.00 1.00 1.00 40
1 0.89 0.92 0.91 37
2 0.93 0.91 0.92 43
accuracy 0.94 120
macro avg 0.94 0.94 0.94 120
weighted avg 0.94 0.94 0.94 120
#4 ЛОГИСТИЧЕСКАЯ РЕГРЕССИЯ
precision recall f1-score support
0 1.00 1.00 1.00 40
1 0.95 0.95 0.95 37
2 0.95 0.95 0.95 43
accuracy 0.97 120
macro avg 0.97 0.97 0.97 120
weighted avg 0.97 0.97 0.97 120
Провести настройку параметров лассификаторов с использованием gridsearchcv. Результаты настройки сохранить для следующего пункта. (При защите будет уделяться особое внимание параметрам классификации (обязательно знать, что каждый параметр обозначает) и принципу их обучения и работы)
# 1 ДЕРЕВО РЕШЕНИЙ
Лучшие подобранные параметры:
{'criterion': 'gini', 'max_depth': 9, 'splitter': 'random'}
#2 К-БЛИЖАЙШИХ СОСЕДЕЙ
Лучшие подобранные параметры:
{'leaf_size': 15, 'n_neighbors': 3, 'weights': 'uniform'}
#3 СЛУЧАЙНЫЙ ЛЕС
Лучшие подобранные параметры:
{'max_features': 'auto', 'n_estimators': 200}
#4 ЛОГИСТИЧЕСКАЯ РЕГРЕССИЯ
Лучшие подобранные параметры:
{'C': 1.0, 'max_iter': 500, 'penalty': 'l1', 'solver': 'liblinear'}
Провести классификацию (с параметрами из предыдущего пункта). После обучения требуется визуализировать тестовую выборку:
С исходными метками
С метками полученными при классификации (пункт 2)
С метками полученными при классификации
В отчёт включить все графики. Сделать выводы о качестве классификации. Сравнить с результатами 2 пункта.
# 1 ДЕРЕВО РЕШЕНИЙ
precision recall f1-score support
0 1.00 1.00 1.00 40
1 0.89 0.92 0.91 37
2 0.93 0.91 0.92 43
accuracy 0.94 120
macro avg 0.94 0.94 0.94 120
weighted avg 0.94 0.94 0.94 120
precision recall f1-score support
0 1.00 1.00 1.00 40
1 0.92 0.95 0.93 37
2 0.95 0.93 0.94 43
accuracy 0.96 120
macro avg 0.96 0.96 0.96 120
weighted avg 0.96 0.96 0.96 120
#2 К-БЛИЖАЙШИХ СОСЕДЕЙ
precision recall f1-score support
0 1.00 1.00 1.00 40
1 0.89 0.92 0.91 37
2 0.93 0.91 0.92 43
accuracy 0.94 120
macro avg 0.94 0.94 0.94 120
weighted avg 0.94 0.94 0.94 120
precision recall f1-score support
0 1.00 1.00 1.00 40
1 0.92 0.92 0.92 37
2 0.93 0.93 0.93 43
accuracy 0.95 120
macro avg 0.95 0.95 0.95 120
weighted avg 0.95 0.95 0.95 120
#3 СЛУЧАЙНЫЙ ЛЕС
precision recall f1-score support
0 1.00 1.00 1.00 40
1 0.89 0.92 0.91 37
2 0.93 0.91 0.92 43
accuracy 0.94 120
macro avg 0.94 0.94 0.94 120
weighted avg 0.94 0.94 0.94 120
precision recall f1-score support
0 1.00 1.00 1.00 40
1 0.94 0.92 0.93 37
2 0.93 0.95 0.94 43
accuracy 0.96 120
macro avg 0.96 0.96 0.96 120
weighted avg 0.96 0.96 0.96 120
#4 ЛОГИСТИЧЕСКАЯ РЕГРЕССИЯ
precision recall f1-score support
0 1.00 1.00 1.00 40
1 0.95 0.95 0.95 37
2 0.95 0.95 0.95 43
accuracy 0.97 120
macro avg 0.97 0.97 0.97 120
weighted avg 0.97 0.97 0.97 120
precision recall f1-score support
0 1.00 1.00 1.00 40
1 0.97 0.95 0.96 37
2 0.95 0.98 0.97 43
accuracy 0.97 120
macro avg 0.98 0.97 0.97 120
weighted avg 0.98 0.97 0.97 120
Исследовать возможность проведения классификации данных, содержащихся в датасетах:
- Barotrop.sta;
Дерево решений
precision recall f1-score support
BARO 1.00 0.94 0.97 16
TROP 0.93 1.00 0.97 14
accuracy 0.97 30
macro avg 0.97 0.97 0.97 30
weighted avg 0.97 0.97 0.97 30
Случайный лес
precision recall f1-score support
BARO 0.86 0.75 0.80 16
TROP 0.75 0.86 0.80 14
accuracy 0.80 30
macro avg 0.80 0.80 0.80 30
weighted avg 0.81 0.80 0.80 30
Метод случайных соседей
precision recall f1-score support
BARO 1.00 0.62 0.77 16
TROP 0.70 1.00 0.82 14
accuracy 0.80 30
macro avg 0.85 0.81 0.80 30
weighted avg 0.86 0.80 0.79 30