Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие 3000402.doc
Скачиваний:
27
Добавлен:
30.04.2022
Размер:
3.2 Mб
Скачать

4. Пример анализа временного ряда предложенными методами

4.1. Статистика количества почтовых писем, классифицированных как спам

4.1.1. Предварительная обработка статистических данных

Для примера приведем статистический временной ряд – спам, за период с 02.03.2011 по 04.04.2012, с периодом в 1 день, по данным www.commtouch.com/security-center, и произведем его обработку.

Статистика количества почтовых писем (рис. 8), классифицированных как спам:

Рис. 8. Пример статистического временного ряда с аномальными выбросами

Аномальные выбросы присутствуют во временном диапазоне 81-97 день. Обработаем ряд в диапазоне 83-93 (для отсутствия фильтрации высокочастотных составляющих в остальном диапазоне) методом «Тьюки 53Х» с длиной окна 9.

Предварительная обработка ряда методом «Тьюки 53Х»

День

Значение

Первая итерация

Медиана

Результ. ряд

Медиана(по столбцу 3)

75

1238219

1238219

=75

76

3123901

3123901

=76

77

1810092

1810092

=77

78

1856540

1856540

=78

79

1870687

1856540

=МЕДИАНА(75:83)

1870687

=79

80

1867616

1867616

=МЕДИАНА(76:84)

1867616

=80

81

1013937

1867616

=МЕДИАНА(77:85)

1013937

=81

82

1256166

1870687

=МЕДИАНА(78:86)

1256166

=82

83

2514093

2514093

=МЕДИАНА(79:87)

2514093

=МЕДИАНА(79:87)

84

8925177

3811535

=МЕДИАНА(80:88)

3811535

=МЕДИАНА(80:88)

85

16628782

3811535

=МЕДИАНА(81:89)

3811535

=МЕДИАНА(81:89)

Продолжение таблицы

86

18038362

5785713

=МЕДИАНА(82:90)

5521336

=МЕДИАНА(82:90)

87

5785713

6242778

=МЕДИАНА(83:91)

5521336

=МЕДИАНА(83:91)

88

3811535

6242778

=МЕДИАНА(84:92)

5521336

=МЕДИАНА(84:92)

89

2886826

5785713

=МЕДИАНА(85:93)

5521336

=МЕДИАНА(85:93)

90

6242778

5521336

=МЕДИАНА(86:94)

5521336

=МЕДИАНА(86:94)

91

17711048

4097908

=МЕДИАНА(87:95)

4097908

=МЕДИАНА(87:95)

92

5521336

3811535

=МЕДИАНА(88:96)

3811535

=МЕДИАНА(88:96)

93

4097908

2951435

=МЕДИАНА(89:97)

3147849

=МЕДИАНА(89:97)

94

2951435

3147849

=МЕДИАНА(90:98)

2951435

=94

95

2223662

2951435

=МЕДИАНА(91:99)

2223662

=95

96

1719637

2879220

=МЕДИАНА(92:100)

1719637

=96

97

2879220

2713340

=МЕДИАНА(93:101)

2879220

=97

98

3147849

3147849

=98

99

2713340

2713340

=99

100

2528540

2528540

=100

Продолжение таблицы

101

2393610

2393610

=101

Результирующий ряд представлен на рис. 9.

Рис. 9. Пример обработанного временного ряда