Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

4671

.pdf
Скачиваний:
0
Добавлен:
21.11.2023
Размер:
490.97 Кб
Скачать

решения задачи необходимо решить следующие подзадачи:

2.1Построение логического классификатора с заданием max_depth (максимальной глубины)

иmax_features (максимального количества признаков) пользователем (установить любые);

визуализация дерева решений для выбранных исследователем параметров (в формате .png)

2.2Вычисление оценки cross validation (MSE) для различнх значений max_depth (построить график зависимости);

2.3Вычисление оценки cross validation (MSE) для различнх значений max_features

(построить график зависимости);

2.4 Вычислите оптимальные значения max_depth и max_features. Обоснуйте свой выбор.

Продемонстрируйте использование полученного классификатора.

2.5Выведите дерево в формате .png;

2.6Выведите решающие границы полученной модели.

5. ИЗУЧЕНИЕ ТЕОРЕТИЧЕСКИХ ПРИНЦИПОВ И ИНСТРУМЕНТАЛЬНЫХ РЕДСТВ ДЛЯ ПОСТРОЕНИЯ ПАЙПЛАЙНА ДЛЯ ПРЕДВАРИТЕЛЬНОЙ ОБРАБОТКИ ДАННЫХ.

1. Подберите набор данных на ресурсах [5-7] и согласуйте свой выбор с преподавателем.

Студент может предложить синтезированный набор данных.

2. Реализуйте первичную обработку данных загруженного набора. Выполните полный спектр операций для загруженного набора данны: загрузка, визуализация, обработка пропущенных значений, обработка категориальных данных и разделение выборки на тестовую и тренировочную.

6. ПОСТРОЕНИЕ ПАЙПЛАЙНА ОДНОМЕРНОЙ РЕГРЕССИИ

1. Подберите набор данных на ресурсах [5-7] и согласуйте свой выбор с преподавателем.

Студент может предложить синтезированный набор данных.

2. Постройте модель регрессии на основе универсального пайплайна.

7. ИСПОЛЬЗОВАНИЕ РАЗРАБОТАННОГО ПАЙПЛАЙНА ДЛЯ МНОГОМЕРНОЙ РЕГРЕССИИ

1. Подберите набор данных на ресурсах [5-7] и согласуйте свой выбор с преподавателем.

Студент может предложить синтезированный набор данных.

2. Постройте модель многомерной регрессии с использованием стратегии backward elimination.

11

8. ПОЛИНОМИАЛЬНАЯ РЕГРЕССИЯ

1. Подберите набор данных на ресурсах [5-7] и согласуйте свой выбор с преподавателем.

Студент может предложить синтезированный набор данных.

2. Постройте модель полиномиальной регрессии с использованием. Проанализируйте кривые аппроксимации при различных степенях полинома

9. КЛАСТЕРИЗАЦИЯ

1. Подберите набор данных на ресурсах [5-7] и согласуйте свой выбор с преподавателем.

Студент может предложить синтезированный набор данных.

2. Постройте модель кластеризации (K-Means) с использованием. Проанализируйте кривые аппроксимации при различных степенях полинома.

3.3Примеры тем расчетно-графических работ

1.Предсказание цен на недвижимость.

2.Предсказание цены на подержанные автомобили.

3.Предсказание дефолта по кредиту.

4.Предсказание оттока сотрудников.

5.Простейшая рекомендательная система.

6.Предсказание оттока клиентов.

7.Прогнозирование числа посетителей ресторана (туториал на R).

ТИПОВОЕ ЗАДАНИЕ:

Решить задачу прогнозирования на основе анализа статистического набора данных.

1)Загрузить и проверить данные;

2)Проанализировать рассматриваемые категориальные и числовые характеристики;

3)Провести корреляционный анализ рассматриваемых показателей;

4)Решить задачу кластеризации;

5)На основе проведенного анализа данных создать прогнозную модель.

12

4. Методические указания по организации самостоятельной работы

4.1 Общие рекомендации для самостоятельной работы

Самостоятельная работа студентов является основным способом овладения учебным материалом в свободное от обязательных учебных занятий время.

Целями самостоятельной работы студентов являются:

-систематизация и закрепление полученных теоретических знаний и умений студентов;

-углубление и расширение теоретических знаний;

-формирование умений использовать нормативную, правовую, справочную документацию и специальную литературу;

-развитие познавательных способностей и активности студентов:

-формирования самостоятельности мышления, способностей к саморазвитию,

самосовершенствованию и самореализации.

Запланированная в учебном плане самостоятельная работа студента рассматривается как связанная либо с конкретной темой изучаемой дисциплины, либо с подготовкой к курсовой,

дипломной работе, а также к защите ВКР. В данном разделе рассматривается только самостоятельная работа первого вида.

Самостоятельная работа выполняется в два этапа: планирование и реализация.

Планирование самостоятельной работы включает:

-уяснение задания на самостоятельную работу;

-подбор рекомендованной литературы;

-составление плана работы, в котором определяются основные пункты предстоящей подготовки.

Составление плана дисциплинирует и повышает организованность в работе.

На втором этапе реализуется составленный план. Реализация включает в себя:

-изучение рекомендованной литературы;

-составление плана (конспекта) по изучаемому материалу (вопросу);

-взаимное обсуждение материала.

Необходимо помнить, что на лекции обычно рассматривается не весь материал. Оставшаяся

восполняется в процессе самостоятельной работы. В связи с этим работа с рекомендованной

13

литературой обязательна.

Работа с литературой и иными источниками информации включает в себя две группы приемов: техническую, имеющую библиографическую направленность, и содержательную.

Первая группа – уяснение потребностей в литературе; получение литературы; просмотр литературы на уровне общей, первичной оценки; анализ надежности публикаций как источника информации, их относимости и степени полезности. Вторая – подробное изучение и извлечение необходимой информации.

Для поиска необходимой литературы можно использовать следующие способы:

-поиск через систематический каталог в библиотеке;

-просмотр специальных периодических изданий;

-использование материалов, размещенных в сети Интернет.

Для того, чтобы не возникало трудностей понимания текстов учебника, монографий,

научных статей, следует учитывать, что учебник и учебное пособие предназначены для студентов и магистрантов, а монографии и статьи ориентированы на исследователя. Монографии дают обширное описание проблемы, содержат в себе справочную информацию и отражают полемику по тем или иным дискуссионным вопросам. Статья в журнале кратко излагает позицию автора или его конкретные достижении в исследовании какой-либо научной проблемы.

В процессе взаимного обсуждения материала закрепляются знания, а также приобретается практика в изложении и разъяснении полученных знаний, развивается речь.

При необходимости студенту следует обращаться за консультацией к преподавателю.

Составление записей или конспектов позволяет составить сжатое представление по изучаемым вопросам. Записи имеют первостепенное значение для самостоятельной работы студентов. Они помогают понять построение изучаемого материала, выделить основные положения, проследить их логику.

Ведение записей способствует превращению чтения в активный процесс. У студента,

систематически ведущего записи, создается свой индивидуальный фонд подсобных материалов для быстрого повторения прочитанного. Особенно важны и полезны записи тогда, когда в них находят отражение мысли, возникшие при самостоятельной работе.

Можно рекомендовать следующие основные формы записи: план, конспект, тезисы,

презентация.

14

План – это схема прочитанного материала, краткий (или подробный) перечень вопросов,

отражающих структуру и последовательность материала. Подробно составленный план вполне заменяет конспект.

Конспект – это систематизированное, логичное изложение материала источника. Объем конспекта не должен превышать 10 страниц. Шрифт Times New Roman, кегль 14, интервал 1,5.

Список литературы должен состоять из 5-8 источников, по возможности следует использовать последние издания учебных пособий и исследований.

Тезисы — это последовательность ключевых положений из некоторой темы без доказательств или с неполными доказательствами. По объему тезисы занимают одну страницу формата А4 или одну – две страницы в ученической тетради. В конце тезисов студент должен сделать собственные выводы.

Презентации по предложенной теме составляются в программе Power Point или Impress.

Количество слайдов должно быть не менее 15 и не превышать 20 слайдов. Кроме текста на слайдах можно создавать схемы и таблицы. Шрифт должен быть читаемым, например, шрифт черного цвета на светлом фоне или светлый шрифт на темном фоне. Также шрифт не должен быть слишком мелким. В слайдах указываются только основные тезисы, понятия и нормы.

4.2 Темы для самостоятельного изучения

1. Построение предиктивных моделей.

2 Сравнение производительности алгоритмов машинного обучения при работе с несбалансированными данными

4.Разработка системы анализа корпоративных новостей

5.Модель автоматической проверки подписи на основе сиамских нейросетей

6.Система для сбора и генерации постов в социальных сетях

7.Анализ публикаций на основе источника и контекста информации методами машинного обучения

15

Ларичева Т.В..

МАШИННОЕ ОБУЧЕНИЕ

Учебно-методическое пособие по подготовке к лекциям, практическим занятиям

(включая рекомендации по организации самостоятельной работы)

для обучающихся по дисциплине «МАШИННОЕ ОБУЧЕНИЕ» по направлению подготовки 09.04.03 Прикладная информатика

направленность (профиль) Искусственный интеллект в бизнес-аналитике

Федеральное государственное бюджетное образовательное учреждение высшего образования

«Нижегородский государственный архитектурно-строительный университет»

603950, Нижний Новгород, ул. Ильинская, 65.

http://www. nngasu.ru, srec@nngasu.ru

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]