- •1. Общие положения
- •1.1. Цель и задачи кп
- •1.2. Содержание и объём кп
- •1.3. Этапы выполнения кп
- •2. Теоретические основы методов, применяемых в кп
- •2.1. Предварительная обработка статистических данных
- •2.2. Вейвлет анализ временного ряда
- •2.3. Сингулярный спектральный анализ временного ряда
- •2.4. Методы ssa-прогнозирования
- •2.4.1. Рекуррентное ssa-прогнозирование
- •2.4.2. Векторное ssa-прогнозирование
- •2.4.3. Формирование доверительных интервалов
- •2.5. Основы аналитического подхода к оценке риска спектральными методами
- •2.5.1. Относительные меры риска
- •Спектральная плотность Fu(ω) распределения дисперсии ущерба
- •Энергетические спектры ущерба Fu(ω) и гармонического сигнала Fг
- •2.5.2. Расчет прогностической меры риска
- •Ряд прогноза y[n]
- •3. Этапы выполнения основной части кп
- •4. Пример анализа временного ряда предложенными методами
- •4.1. Статистика количества почтовых писем, классифицированных как спам
- •4.1.1. Предварительная обработка статистических данных
- •4.1.2. Вейвлет анализ временного ряда
- •4.1.3. Сингулярный спектральный анализ временного ряда
- •4.1.4. Расчет прогностической меры риска
- •Исходный ряд и ряд прогноза
- •Ряд прогноза
- •4.2. Статистика случаев мошенничества с кредитными картами
- •4.2.1. Предварительная обработка статистических данных
- •4.2.2. Вейвлет анализ временного ряда
- •4.2.3. Сингулярный спектральный анализ временного ряда
- •4.2.4. Расчет прогностической меры риска
- •Восстановленный ряд и ряд прогноза
- •Прогноз ущерба от мошеннических операций с распределенными платежными системами на 2012 год
- •Распределения вероятностей нанесения ущербов
- •5. Требования к оформлению и объему кп
- •5.1. Общие требования
- •5.2. Правила оформления текстовых документов
- •5.3. Правила нумерации страниц
- •5.4. Правила оформления иллюстраций
- •5.5. Оформление таблиц
- •5.6. Приложение
- •5.7. Типичные ошибки при выполнении кп
- •5.8. Дополнительные рекомендации по выполнению кп
- •6. Порядок оценки работы
- •Библиографический список Основная литература
- •Дополнительная литература
- •Оглавление
- •394026 Воронеж, Московский просп., 14
4. Пример анализа временного ряда предложенными методами
4.1. Статистика количества почтовых писем, классифицированных как спам
4.1.1. Предварительная обработка статистических данных
Для примера приведем статистический временной ряд – спам, за период с 02.03.2011 по 04.04.2012, с периодом в 1 день, по данным www.commtouch.com/security-center, и произведем его обработку.
Статистика количества почтовых писем (рис. 8), классифицированных как спам:
Рис. 8. Пример статистического временного ряда с аномальными выбросами
Аномальные выбросы присутствуют во временном диапазоне 81-97 день. Обработаем ряд в диапазоне 83-93 (для отсутствия фильтрации высокочастотных составляющих в остальном диапазоне) методом «Тьюки 53Х» с длиной окна 9.
Предварительная обработка ряда методом «Тьюки 53Х»
День |
Значение |
Первая итерация |
Медиана |
Результ. ряд |
Медиана(по столбцу 3) |
|
|
|
|
|
|
75 |
1238219 |
|
|
1238219 |
=75 |
76 |
3123901 |
|
|
3123901 |
=76 |
77 |
1810092 |
|
|
1810092 |
=77 |
78 |
1856540 |
|
|
1856540 |
=78 |
79 |
1870687 |
1856540 |
=МЕДИАНА(75:83) |
1870687 |
=79 |
80 |
1867616 |
1867616 |
=МЕДИАНА(76:84) |
1867616 |
=80 |
81 |
1013937 |
1867616 |
=МЕДИАНА(77:85) |
1013937 |
=81 |
82 |
1256166 |
1870687 |
=МЕДИАНА(78:86) |
1256166 |
=82 |
83 |
2514093 |
2514093 |
=МЕДИАНА(79:87) |
2514093 |
=МЕДИАНА(79:87) |
84 |
8925177 |
3811535 |
=МЕДИАНА(80:88) |
3811535 |
=МЕДИАНА(80:88) |
85 |
16628782 |
3811535 |
=МЕДИАНА(81:89) |
3811535 |
=МЕДИАНА(81:89) |
Продолжение таблицы
86 |
18038362 |
5785713 |
=МЕДИАНА(82:90) |
5521336 |
=МЕДИАНА(82:90) |
87 |
5785713 |
6242778 |
=МЕДИАНА(83:91) |
5521336 |
=МЕДИАНА(83:91) |
88 |
3811535 |
6242778 |
=МЕДИАНА(84:92) |
5521336 |
=МЕДИАНА(84:92) |
89 |
2886826 |
5785713 |
=МЕДИАНА(85:93) |
5521336 |
=МЕДИАНА(85:93) |
90 |
6242778 |
5521336 |
=МЕДИАНА(86:94) |
5521336 |
=МЕДИАНА(86:94) |
91 |
17711048 |
4097908 |
=МЕДИАНА(87:95) |
4097908 |
=МЕДИАНА(87:95) |
92 |
5521336 |
3811535 |
=МЕДИАНА(88:96) |
3811535 |
=МЕДИАНА(88:96) |
93 |
4097908 |
2951435 |
=МЕДИАНА(89:97) |
3147849 |
=МЕДИАНА(89:97) |
94 |
2951435 |
3147849 |
=МЕДИАНА(90:98) |
2951435 |
=94 |
95 |
2223662 |
2951435 |
=МЕДИАНА(91:99) |
2223662 |
=95 |
96 |
1719637 |
2879220 |
=МЕДИАНА(92:100) |
1719637 |
=96 |
97 |
2879220 |
2713340 |
=МЕДИАНА(93:101) |
2879220 |
=97 |
98 |
3147849 |
|
|
3147849 |
=98 |
99 |
2713340 |
|
|
2713340 |
=99 |
100 |
2528540 |
|
|
2528540 |
=100 |
Продолжение таблицы
101 |
2393610 |
|
|
2393610 |
=101 |
Результирующий ряд представлен на рис. 9.
Рис. 9. Пример обработанного временного ряда