3645
.pdf
|
|
|
1,20 |
|
|
|
|
|
|
|
1,00 |
|
|
|
|
|
|
|
0,80 |
|
|
|
|
|
|
|
0,60 |
|
|
|
N100 |
|
|
|
|
|
|
N(0,1) |
|
|
|
|
|
|
|
|
|
|
|
|
0,40 |
|
|
|
|
|
|
|
0,20 |
|
|
|
|
|
|
|
0,00 |
|
|
|
|
-3,0000 |
-2,0000 |
-1,0000 |
0,0000 |
1,0000 |
2,0000 |
3,0000 |
4,0000 |
|
|
|
|
Рисунок 2 |
|
|
|
Обозначим через xi абсциссу середины i -го разряда. Тогда точка есть середина верхнего основания прямоугольника i -го разряда.
Соединяя эти точки отрезками прямых линий, получим полигон частот,
который позволяет сравнить гистограмму с функцией плотности теоретического распределения, к которой стремится гистограмма при увеличении n и неограниченном уменьшении длины разряда.
Задача 3.
Используя данные задачи 2 построить на одном графике для сравнения гистограмму, полигон частот и функцию плотности стандартного нормального распределения.
Решение.
Используя таблицу (3) составим таблицу (4) для построения требуемых графиков. Графики представлены на рисунке 3. Графики показывают небольшую левую асимметрию и выброс в центре, обусловленные случайными отклонениями.
Таблица 4
i |
a |
x |
n |
p |
y |
(a ) |
|
i |
i |
i |
i |
i |
i |
10
0 |
-3,0000 |
|
0 |
|
0,00 |
0,0000 |
|
|
0,004432 |
|
|
|
|
|
1 |
-2,4063 |
-2,1463 |
4 |
|
0,04 |
0,0769 |
|
|
0,022056 |
|
|
|
|
|
2 |
-1,8863 |
-1,6263 |
8 |
|
0,08 |
0,1538 |
|
|
0,067335 |
|
|
|
|
|
3 |
-1,3663 |
-1,1063 |
10 |
0,10 |
0,1923 |
|
|
0,156863 |
|
|
|
|
||
4 |
-0,8463 |
-0,5863 |
26 |
0,26 |
0,5000 |
|
|
0,278849 |
|
|
|
|
||
5 |
-0,3263 |
-0,0663 |
18 |
0,18 |
0,3462 |
|
|
0,378255 |
|
|
|
|
||
6 |
0,1937 |
0,4537 |
13 |
0,13 |
0,2500 |
|
|
0,391531 |
|
|
|
|
||
7 |
0,7137 |
0,9737 |
9 |
|
0,09 |
0,1731 |
|
|
0,309254 |
|
|
|
|
|
8 |
1,2337 |
1,4937 |
8 |
|
0,08 |
0,1538 |
|
|
0,186393 |
|
|
|
|
|
9 |
1,7537 |
2,0137 |
3 |
|
0,03 |
0,0577 |
|
|
0,085726 |
|
|
|
|
|
10 |
2,2737 |
2,5337 |
1 |
|
0,01 |
0,0192 |
|
|
0,030086 |
|
|
|
|
|
11 |
2,7937 |
|
|
|
|
|
|
|
0,008057 |
|
|
|
|
|
12 |
3,0000 |
|
100 |
|
|
|
|
0,004432 |
|
|
|
|
||
|
|
|
|
|
|
0,60 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0,50 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0,40 |
|
0,392 |
|
|
|
|
|
|
|
|
|
|
|
|
0,378 |
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
0,30 |
|
|
0,309 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0,279 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0,20 |
|
|
|
0,186 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
0,157 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0,10 |
|
|
|
|
0,086 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
0,067 |
|
|
|
|
|
|
|
|
|
|
|
|
|
0,022 |
|
|
|
|
|
|
|
|
0,030 |
0,008 |
||
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
0,004 |
|
|
|
0,00 |
|
|
|
|
|
|
|
0,004 |
|
|
-2,41 |
-1,89 |
-1,37 |
-0,85 |
-0,33 |
0,19 |
0,71 |
1,23 |
1,75 |
2,27 |
2,79 |
|
Рисунок 3
2.Критерии согласия эмпирического и теоретического законов распределения.
Построенные на рисунках 2 и 3 графики позволяют высказать предположение о том, что наблюдаемая случайная величина имеет нормальное распределение с математическим ожиданием 0 и дисперсией 1 -
N (0,1) . Способы, позволяющие проверить это утверждение (гипотезу),
называются критериями.
2.1 Критерий Колмогорова
11
Этот критерий основывается на максимальном значении модуля разности между статистической функцией распределения Fn (x) и теоретической функцией распределения F (x) :
D max Fn (x) F(x)
А.Н. Колмогоров доказал, что для любой непрерывной функции распределения F (x) вероятность неравенства
Dn
при неограниченном возрастании n стремится к пределу
P( ) 1 (1)k e 2k 2 2
k
Значения этих вероятностей для различных значений приведены в таблице
5.
Таблица 5
|
P() |
|
P() |
|
P() |
0,000 |
1,000 |
0,700 |
0,711 |
1,400 |
0,040 |
0,100 |
1,000 |
0,800 |
0,544 |
1,500 |
0,022 |
0,200 |
1,000 |
0,900 |
0,393 |
1,600 |
0,012 |
0,300 |
1,000 |
1,000 |
0,270 |
1,700 |
0,006 |
0,400 |
0,997 |
1,100 |
0,178 |
1,800 |
0,003 |
0,500 |
0,964 |
1,200 |
0,112 |
1,900 |
0,002 |
0,600 |
0,864 |
1,300 |
0,068 |
2,000 |
0,001 |
Покажем, как работает критерий Колмогорова на примере конкретной задачи
Задача 4
Используя данные задачи 3, проверить гипотезу о том, что выборка значений случайной величины произведена из нормального распределения
N (0,1) .
Решение.
В таблице 3 сосчитано значение D для этой выборки:
D 0,107917
Вычислим :
Dn 0,107917 10 1, 08
12
Интерполируя по таблице 5, находим P(1, 08) 0, 20 . Эта вероятность довольно велика, поэтому можно считать, что высказанная гипотеза не противоречит опытным данным. Если бы вычисленное значение оказалось порядка 0,01, то мы бы отвергли эту гипотезу на уровне значимости 0,05, так как при таком уровне значимости мы считаем все события, вероятность которых меньше 0,05 практически невозможными.
2.2. Критерий хи-квадрат.
Другим критерием, позволяющим проверить соответствие теоретической и статистической функции распределения, является критерий хи-квадрат, который основан на статистике (функции наблюденных значений):
2 n ( pi pi )2
i pi
Это выражение удобно переписать в другом виде:
2 (ni npi )2 .
inpi
Последнее выражение более удобно для вычислений.
Здесь, как и прежде, ni - число наблюдений, попавших в i - й разряд, а pi -
теоретическая вероятность попадания в i - й разряд согласно функции распределения F (x) случайной величины X .
К. Пирсон доказал, что при неограниченном увеличении числа опытов
n и для любой функции F (x) распределение статистики 2 стремится к
одному и тому же пределу, именно функции распределения хи-квадрат с r k s степенями свободы. Степени свободы это линейные ограничения,
наложенные на частоты pi . Например, одно ограничение есть всегда:
pi 1.
i
Если других ограничений нет, то число степеней, свободы равно 1, а
r k 1.
13
могут быть еще ограничения, обусловленные оценками неизвестных параметров. Этот случай мы рассмотрим несколько позже. Для распределения 2 составлены специальные таблицы, оно также включено в состав математического обеспечения многих программных продуктов, в
частности, Excel. Рассмотрим применение критерия 2 на примере задачи.
Задача 5
Используя данные задачи 3, проверить по критерию 2 гипотезу о том,
что выборка значений случайной величины произведена из нормального распределения N (0,1) .
Решение.
Исходим из данных таблицы 3. Для применения критерия 2 ,
требуется, чтобы количество наблюдений в разряде было не менее 5.
Поэтому объединяем 1 и 2 разряды, а также 8, 9 и 10 разряды таблицы 3. В
результате приходим к таблице 6. В новой таблице будет 7 разрядов, причем a1 , а a8 , так как теоретически нормально распределенная случайная величина может принимать любые значения на числовой прямой.
В таблице обозначено:
(ai ) - значение функции стандартного распределения в точке ai , а
pi (ai 1 ) (ai )
Вправом нижнем углу желтым цветом выделено значение статистики
2 и вероятность наблюдать такое или большее значение за счет случайных
отклонений. Как видим, вероятность довольно большая, поэтому нет оснований отвергать проверяемую гипотезу. Заметим, однако, что эта вероятность несколько меньше, чем для критерия Колмогорова.
Таблица 6
i |
ai |
ni |
(ai ) |
pi |
npi |
ni npi |
(ni npi )2 |
|
|
npi |
|||||||||
|
|
|
|
|
|
|
|||
1 |
-∞ |
|
0,0000 |
|
|
|
|
|
|
2 |
-1,3663 |
12 |
0,0859 |
0,0859 |
8,59 |
3,41 |
1,3522 |
||
3 |
-0,8463 |
10 |
0,1987 |
0,1128 |
11,28 |
-1,28 |
0,1445 |
||
4 |
-0,3263 |
26 |
0,3721 |
0,1734 |
17,34 |
8,66 |
4,3248 |
||
|
|
|
|
14 |
|
|
|
|
5 |
0,1937 |
18 |
0,5768 |
0,2047 |
20,47 |
-2,47 |
0,2979 |
6 |
0,7137 |
13 |
0,7623 |
0,1855 |
18,55 |
-5,55 |
1,6606 |
7 |
1,2337 |
9 |
0,8913 |
0,1291 |
12,91 |
-3,91 |
1,1818 |
8 |
+∞ |
12 |
1,0000 |
0,1087 |
10,87 |
1,13 |
0,1182 |
∑ |
|
100 |
|
1,0000 |
100,00 |
0,00 |
9,0801 |
|
|
|
|
|
|
|
0,1691 |
Рассмотрим теперь следующую задачу.
Задача 6
Используя данные задачи 3, проверить по критерию 2 гипотезу о том,
что выборка значений случайной величины произведена из нормального распределения, параметры которого математическое ожидание и
среднеквадратическое отклонение нам неизвестны. Вместо них использовать оценки этих параметров, рассчитанные по выборке:
иs 1, 0322 . Методы расчета оценок параметров будут рассмотрены в
следующем разделе.
Решение.
Построим таблицу 7, такую же, как таблица 6, но вместо функции (x) будем
использовать функцию |
(x) нормального распределения с параметрами |
|||||||||
m 0,1391 и s 1, 0322 . Получим следующую таблицу. |
|
|
|
|||||||
Таблица 7 |
|
|
|
|
|
|
|
|
|
|
i |
ai |
ni |
(ai ) |
pi |
npi |
ni npi |
(ni npi )2 |
|
||
npi |
||||||||||
1 |
-∞ |
|
0,0000 |
|
|
|
|
|
|
|
2 |
-1,3663 |
12 |
0,1172 |
0,1172 |
11,72 |
0,28 |
|
0,0065 |
|
|
3 |
-0,8463 |
10 |
0,2466 |
0,1294 |
12,94 |
-2,94 |
|
0,6676 |
|
|
4 |
-0,3263 |
26 |
0,4280 |
0,1814 |
18,14 |
7,86 |
|
3,4046 |
|
|
5 |
0,1937 |
18 |
0,6264 |
0,1984 |
19,84 |
-1,84 |
|
0,1704 |
|
|
6 |
0,7137 |
13 |
0,7956 |
0,1692 |
16,92 |
-3,92 |
|
0,9090 |
|
|
7 |
1,2337 |
9 |
0,9082 |
0,1126 |
11,26 |
-2,26 |
|
0,4530 |
|
|
8 |
+∞ |
12 |
1,0000 |
0,0918 |
9,18 |
2,82 |
|
0,8685 |
|
|
∑ |
|
100 |
|
1,0000 |
100,00 |
0,00 |
|
6,4796 |
|
|
|
|
|
|
|
|
|
|
0,1661 |
|
Новое значение статистики 2 6, 4796 , а вероятность такого же или большего отклонения, вычисленная при числе степеней свободы r 7 1 2 4 , оказалась равной 0,1661, т.е. почти такая же, как и в предыдущем случае. Поэтому мы с таким же уровнем доверия можем
15
принять гипотезу о том, что данные извлечены из распределения
N(0,1391;1, 0322) .
3. Оценка числовых характеристик и неизвестных параметров1
распределения.
3.1. Точечные оценки моментов распределения.
Напомним, что понятие момента пришло в теорию вероятностей из механики, где моменты используются для описания распределения масс. В
теории вероятностей моменты служат для описания распределения вероятностной массы.
Различают моменты относительно начала координат, так называемые
начальные моменты. Для дискретной случайной величины начальный момент r - го порядка задается формулой:
r xir pi i
Начальный момент 1-го порядка называется математическим ожиданием и характеризует положения центра распределения:
M[ X ] 1 xi pi
i
Физически математическое ожидание представляет центр тяжести распределенной массы.
Центральные моменты вычисляются относительно математического ожидания:
r |
(xi )r pi |
|
i |
Мы будем рассматривать только первые 4 момента, которые в основном используются на практике.
Центральный момент 1-го порядка равен 0.
1 Параметрами мы называем такие числовые характеристики, которые явно входят в выражение для функции плотности или распределения вероятностей случайной величины.
|
|
1 |
|
|
|
( x )2 |
|
Например, μ и σ для нормального закона с плотностью f (x) |
|
|
e |
2 2 |
. |
||
|
|
|
|||||
|
|
|
|
|
|||
2 |
|
|
|||||
16 |
|
|
|
|
|
|
|
Центральный момент 2-го порядка характеризует рассеяние вероятностной массы относительно центра распределения и называется
дисперсией:
D[ X ] 2 (xi )2 pi .
i
Третий и четвертый центральные моменты служат для определения асимметрии A распределения и эксцесса E (меры островершинности)
распределения:
A 33
E 4 34
Для непрерывной случайной величины формулы для моментов
заменяются интегралами. Так, например, формула для центрального момента
r -го порядка будет следующей:
|
|
r |
(x )r f (x)dx (x )r dF(x) , |
|
|
где f (x) - плотность, а F (x) - функция распределения вероятностей случайной
величины X . Аналогично изменятся и другие формулы.
Точным статистическим аналогом моментов теоретического
(истинного) распределения являются моменты статистической функции распределения, которые вычисляются по формулам:
m |
1 |
i |
xr |
||
|
|||||
r |
|
n |
i |
||
mr |
|
1 |
(xi m)r |
||
n |
|||||
|
|
i |
|
Для первых четырех моментов имеем:
|
|
|
|
1 |
xi |
(3) |
|||
|
|
|
|
|
|||||
m m1 |
|
n |
|||||||
|
|
|
|
|
i |
|
|
||
m2 |
|
1 |
(xi |
m)2 |
(4) |
||||
n |
|||||||||
|
|
|
i |
|
|
|
|||
m3 |
|
1 |
(xi |
m)3 |
(5) |
||||
n |
|||||||||
|
|
|
i |
|
|
|
17
m4 |
|
1 |
|
(xi m)4 |
(6) |
||||||||
n |
|||||||||||||
|
|
|
|
|
|
i |
|
|
|
||||
A |
|
m3 |
|
|
|
|
|
(7) |
|||||
|
s3 |
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
||||
E |
|
m4 |
|
3 |
(8) |
||||||||
s4 |
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
||||
где |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
s |
|
|
|
|
n |
|
|
|
m |
(9) |
|||
|
|
|
|
|
|
|
|
|
|||||
|
|
n 1 |
2 |
|
|
||||||||
|
|
|
|
|
Приведенные выше статистики являются состоятельными оценками соответствующих численных характеристик истинного распределения, т.е.
при возрастании n сходятся по вероятности к соответствующим значениям.
Но несмещенными являются только оценки m , в частности, оценка m . Легко
r
проверить, что M[m ] |
n 1 |
|
|
, |
|
поэтому при малых n |
для оценки дисперсии |
|||||
|
|
2 |
||||||||||
2 |
|
n |
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
||
используется выборочная дисперсия: |
|
|
|
|
||||||||
|
s2 |
|
1 |
|
|
(xi m)2 |
n |
|
m2 |
(10) |
||
|
|
n 1 |
n 1 |
|||||||||
|
|
|
|
i |
|
|
Ясно, что при больших n статистики s2 и m2 эквивалентны.
Рассмотрим технику вычисления выборочных моментов на конкретных примерах.
3.1.1. Малая выборка
Задача 7.
Произведено 16 измерений начальной скорости снаряда. Результаты измерений (в м/сек) следующие: 1245.6, 1247.5, 1242.9, 1246.2, 1248.5, 1244.2,
1245.9, 1243.3, 1244.5, 1246.8, 1247.6, 1243.1, 1244.3, 1247.5, 1245.4, 1244.7.
Вычислить 4 первых выборочных момента распределения, а также асимметрию и эксцесс.
Решение.
18
Составляем таблицу Таблица 8
№п/п |
xi |
zi=xi-m |
zi2 |
zi3 |
zi4 |
1 |
1245,6 |
0,1 |
0,01 |
0,0010 |
0,0001 |
2 |
1247,5 |
2 |
4 |
8,0000 |
16,0000 |
3 |
1242,9 |
-2,6 |
6,76 |
-17,5760 |
45,6976 |
4 |
1246,2 |
0,7 |
0,49 |
0,3430 |
0,2401 |
5 |
1248,5 |
3 |
9 |
27,0000 |
81,0000 |
6 |
1244,2 |
-1,3 |
1,69 |
-2,1970 |
2,8561 |
7 |
1245,9 |
0,4 |
0,16 |
0,0640 |
0,0256 |
8 |
1243,3 |
-2,2 |
4,84 |
-10,6480 |
23,4256 |
9 |
1244,5 |
-1 |
1 |
-1,0000 |
1,0000 |
10 |
1246,8 |
1,3 |
1,69 |
2,1970 |
2,8561 |
11 |
1247,6 |
2,1 |
4,41 |
9,2610 |
19,4481 |
12 |
1243,1 |
-2,4 |
5,76 |
-13,8240 |
33,1776 |
13 |
1244,3 |
-1,2 |
1,44 |
-1,7280 |
2,0736 |
14 |
1247,5 |
2 |
4 |
8,0000 |
16,0000 |
15 |
1245,4 |
-0,1 |
0,01 |
-0,0010 |
0,0001 |
16 |
1244,7 |
-0,8 |
0,64 |
-0,5120 |
0,4096 |
∑ |
19928 |
0 |
45,9 |
7,3800 |
244,2102 |
Затем по формулам (3) – (10) вычисляются требуемые величины:
m = m'1 |
1245,5 |
m2 |
2,8687 |
S² |
3,0600 |
m3 |
0,4612 |
m4 |
15,2631 |
S |
1,7493 |
A* |
0,0862 |
E* |
-1,3699 |
3.1.2. Большая выборка
Задача 8.
Используя данные табл.2, вычислить 4 первых выборочных момента распределения, а также асимметрию и эксцесс.
Решение.
Составляем таблицу:
Таблица 9
i |
ai |
ni |
pi* |
xi* |
xi*pi* |
zi=xi*-m zipi* |
zi2pi* |
zi3pi* |
zi4pi* |
1 |
- |
|
|
|
|
|
|
|
|
|
2,406341 |
4 |
0,04 |
-2,1463 -0,08585 |
-2,0072 -0,080290,161154 |
-0,3235 |
0,6493 |
||
2 |
- |
|
|
|
|
|
|
|
|
|
1,886341 |
8 |
0,08 |
-1,6263 -0,13011 -1,4872 -0,118980,176941 |
-0,2631 |
0,3914 |
|||
3 |
- |
10 |
0,10 |
-1,1063 -0,11063 |
-0,9672 -0,096720,093548 -0,0905 |
0,0875 |
|||
|
|
|
|
|
19 |
|
|
|
|