3643
.pdfКкр = {k>kкр}, |
|
/////// a |
///////////// |
|
|
|
kкр |
К |
|
Критическая точка kкр |
здесь однозначно определяется согласно общего под- |
хода к построению критических областей критерия из условия
равенства вероятности ошибки I-рода заданному уровню значимости α:
∞
P(k>kкр) = ∫ χ 2 (k, n − 1)dk = α
kкр
Решение этого уравнения kкр = χ2кр(α, n-1) находятся однозначно, представ-
ляет собой обращение функции распределения «хи-квадрат» случайной величины и
приводится в таблицах, например в [1, 2]. |
|
|
|
|
|||
Случай Б: Н |
1 |
={σ2 < σ 2}. В этом случае |
критическая область критерия будет |
||||
|
0 |
|
|
|
|
|
|
левосторонней |
|
|
|
|
|
|
|
Ккр = {0<k<kкр}, |
|
/////// |
a //////// |
|
|
||
|
|
|
|
|
kкр |
К |
а критическая точка однозначно определяется из уравнения
kкр
P(k<kкр) = ∫ χ 2 (k, n − 1)dk = α
0
Таблиц его решений обычно не строится, поскольку левосторонняя критиче-
ская точка может быть легко выражена через функцию для правосторонней крити-
ческой точки. Действительно, т.к. P(k<kкр)+ (k>kкр)=1, то P(k>kкр)=1- α и тогда решение для левосторонней точки будет следующим kкр = χ2кр(1-α, n-1).
Случай В: Н1={σ2¹ σ02}. В этом случае, объединяющем два предыдущих слу-
чая, критическая область критерия будет двухсторонней
Ккр = {k<kкр.л ; k>kкр.п }, |
//// a/2 //// |
////// a/2 ////// |
10
kкр.л |
kкр.п |
К |
однако здесь критические точка kкр.л , kкр.п не определяется однозначно из уравне-
ния
kкр.п
P(k<kкр.л) + P(k>kкр.п) = ∫ χ 2 (k, n −1)dk = a
kкр. л
Доказано [1], что при условиях P(k<kкр.л)=a/2 и P(k>kкр.п)=a/2 мощность критерия
1-b по отношению к конкурирующей гипотезе Н1 будет максимальной, тогда из этих двух условий критические точки находятся однозначно:
kкр.л = c2кр( 1-a/2, n-1); kкр.п = c2кр( a/2, n-1).
Рассмотрим числовой пример: Пусть по выборке объема n=15 получена оцен-
ка дисперсии наблюдаемой нормальной случайной величины S2=40,25 или оценка среднеквадратического отклонения S=6,5. Поскольку, каждая оценка есть величина случайная (получена по конкретной случайной выборке), то проверим гипотезу о том, что истинная дисперсия наблюдаемой величины равна 36 т.е. Н0={s2=36}. За-
дадимся уровнем значимости гипотезы a=0,05 и альтернативной гипотезой Н1 ={s2
¹36}. |
|
Наблюдаемое значение критерия |
kнабл =(15-1)40.25/36 =15.653. Критиче- |
ская область Ккр двухсторонняя, а критические точки будут: |
|
kкр.л = c2кр( 1-0.025, 14) = 5.63; |
kкр.п = c2кр( 0.025, 14) =26.1 |
Видим, что kнабл не принадлежит критической области и значит, гипотеза принима-
ется, т.е. отличие наблюдаемого значения дисперсии от гипотетического не значи-
тельны. Если бы такая оценка дисперсии была получена по выборке меньшего объема n=7, то
kкр.л = c2кр( 1-0.025, 6) = 14.4; |
kкр.п = c2кр( 0.025, 6) =1.24; |
тогда наблюдаемое значение критерия kнабл попадает в критическую область и про-
веряемая гипотеза отвергается.
5.2. Проверим теперь гипотезу о равенстве значения истинного (гипотетиче-
ского) математического ожидания а некоторой величине а0. Основная гипотеза тем
11
самым будет следующей Н0={а=а0}. В качестве критерия К возьмем случайную ве-
личину имеющую, при справедливости основной гипотезы, распределение Стью-
дента с n-1 степенями свободы:
К=(Хср-а0) |
|
/S, |
fK( k H0 ) = Т(k,n-1), М[K]=0, D[K]=(n-2)/(n-3) |
n |
Задаваясь уровнем значимости α для проверяемой гипотезы Н0 будем строить критическую область Ккр в зависимости от вида единственной конкурирующей
(альтернативной) гипотезы H1 в следующих случаях:
Случай А: Н1={а>а0}. В этом случае при справедливости конкурирующей ги-
потезы ожидаем сдвиг вероятных значений критерия К в большую сторону, поэтому критическая область критерия будет правосторонней Ккр={k>kкр}. Критическая точ-
ка kкр однозначно определяется из условия равенства вероятности ошибки I-рода заданному уровню значимости P(k>kкр) = α.
Решение этого уравнения kкр= Tкр(α, n-1) представляет собой обращение функции распределения случайной величины Стьюдента и приводится в многочис-
ленных таблицах, например в [ 1, 2].
Случай Б: Н1 ={ а<а0 }. В этом случае критическая область критерия будет ле-
восторонней Ккр={k<kкр}, а значения критерия отрицательными. Критическая точка kкр определяется из уравнения P(k<kкр)=α, решение которого, в силу симметрии распределения Стьюдента, будет следующим kкр= -Tкр(α, n-1).
Случай В: Н1={а ¹ а0}. В этом случае критическая область критерия будет двухсторонней Ккр={k<kкр.л ; k>kкр.п }. Однако здесь критические точки kкр.л и kкр.п
не определяются однозначно из уравнения P(k<kкр.л)+P(k>kкр.п)=α. Доказано, что при условии P(k<kкр.л)=α/2 ; P(k>kкр.п) =α/2 мощность критерия 1 - β по отноше-
нию к конкурирующей гипотезе Н1 будет максимальной, тогда из этих уравнений
критические точки находятся однозначно: |
|
kкр.л = -Ткр( α/2, n-1); |
kкр.п =Ткр( α/2, n-1). |
12
Рассмотрим числовой пример: Пусть по выборке объема n=16 получена оцен-
ка математического ожидания наблюдаемой нормальной случайной величины
Хср=10,2 и оценка среднеквадратического отклонения S=6,5. Поскольку, каждая оценка есть величина случайная (получена по конкретной случайной выборке), то проверим гипотезу о том , что истинное математическое ожидание наблюдаемой ве-
личины равна 15 т.е. Н0 ={а =15}. Зададимся уровнем значимости гипотезы a=0,05 и альтернативной гипотезой Н1={а¹15}. Наблюдаемое значение критерия kнабл=(10,2-15)4/6,5=-2.954. Критическая область Ккр двухсторонняя, а критиче-
ские точки будут:
kкр.л =-Ткр( 0.025, 15) =-2.13; kкр.п =Ткр( 0.025, 15)=2.13
Видим, что kнабл принадлежит критической области и значит, гипотеза отвергается,
т.е. отличие наблюдаемого значения математического ожидания от гипотетического значительны.
Отметим, что при проверке гипотез Н0={а=Хср} и Н0={s2=S2} при уровне зна-
чимости a, будут построены двухсторонние критические области такими, что об-
ласть принятия гипотез Кпр совпадет с доверительными интервалами, построенными с надежностью g=1-a.
13
6. Примеры построения критериев значимости.
Пусть в опыте наблюдаются две нормально распределенные случайные вели-
чины X, Y с неизвестными значениями математических ожиданий ах, ау и дисперсий
σх2, σу2. Используя выборки ХВ={xj, nx}, YВ={yj, ny} объемов nx и ny, построим оцен-
ки неизвестных параметров случайных величин
ах*=Хср, аy*=Yср, σх*= Sx, σy*= Sy.
Сравним параметры двух наблюдаемых случайных величин, т.е. проверим гипотезу об однородности дисперсии {σх2 = σу2} и математического ожидания {ах = ау}.
6.1. Проверим гипотезу об однородности дисперсии Н0={σх2=σу2}. В качестве
критерия примем величину К, распределенную при условии справедливости основной гипотезы по закону Фишера – Снедекора со степенями свободы n1, n2.
K= |
Smax2 |
>1; fK(k)=F(k, n1, n2); |
M[K]=n2/(n2-1) >1 |
|
S 2 |
||||
|
|
|
||
|
min |
|
|
|
Где Smax=max(Sx, Sy); |
Smin= min(Sx, Sy): n1, n2 |
объемы выборок с наибольшим и |
наименьшим значением стандарта S соответственно. Критическую область критерия строим как обычно исходя из вида альтернативных гипотез.
Случай А. Н1={σх2>σу2} или Н2={σх2<σу2}. Такие гипотезы рассматриваются,
когда имеется основание полагать что дисперсия одной из величин больше другой
(например когда Sx и Sy существенно отличаются по величине своих значений). В
этом случае критическая область будет правосторонней Ккр={k>kкр}, поскольку при справедливости любой из альтернатив, наиболее вероятное значение критерия сме-
щается в право.
Критическая точка kкр однозначно определяется из условия равенства вероятности ошибки I-рода заданному уровню значимости P(k>kкр) = α.
Решение этого уравнения kкр= Fкр(α, n1, n2) представляет собой обращение функции распределения случайной величины Фишера и приводится в многочислен-
ных таблицах, например в [1, 2].
14
Случай Б. Н3={σх2¹sу2}. Такая альтернативная гипотеза рассматривается то-
гда, когда неизвестно какая из величин обладает большей дисперсией. В этом случае
имеются одновременно две альтернативных гипотезы Н1, Н2.
Если рассмотреть критерий К’=(Sx/Sy)2, то для него критическая область будет
двухсторонней с критическими точками
kкр.л = Fкр(1-α/2, nх,nу), kкр.п = Fкр(α/2, nх,nу) .
Поскольку, критерии К’ и К связаны следующим соотношением:
К = К’ при Sх2 > Sу2 и К = 1/К’ при Sх2 < Sу2,
то правосторонние части критических областей для К и К’ совпадают, а левосторон-
няя часть критической области для К’ опять же совпадает с правосторонней частью
для критерия К. Таким образом, критическая область
критерия Фишера и в этом случае правосторонняя с критической точкой kкр= Fкр(α/2, n1,n2).
6.2. Проверим теперь гипотезу о равенстве математических ожиданий у на-
блюдаемых случайных величин Н0={ах=ау} при условии равенства их дисперсии
{σх2=σу2}. В качестве критерия примем величину К, распределенную при условии справедливости основной гипотезы по закону Стьюдента с nх+ nу -2 степенями сво-
боды.
|
|
|
X ср − Yср |
|
|
|
nx ny (nx + ny |
− 2) |
|
|
|
K= |
|
|
|
|
|
|
|
|
; |
fK(k)=Т(k, nх+ nу -2), M[K]=0 |
|
|
|
|
|
|
|
nx + ny |
|
||||
(nx |
−1)S x2 + (ny |
−1)S y2 |
|
|
|||||||
|
|
|
|
|
|
|
|
Рассмотрим опять два типа альтернативных гипотез:
Случай А. Н1={ах>ау} или Н2={ах<ау}. Критическая область при наличии таких альтернативных гипотез будет правосторонней или, соответственно, левосторонней и определяемая критическими точками распределения Стьюдента kкр = ±Tкр(α,nх+ nу -2).
Случай Б. Н3={ах¹ау}. Такая альтернативная гипотеза эквивалентна наличию двух равновозможных альтернатив Н1 и Н2. В этом случае критическая область
15
двухсторонняя Ккр={k<kкр.л; |
k>kкр.п} |
, тогда из условий P(k<kкр.л)=α/2 ; |
P(k>kкр.п)=α/2 критические точки находятся однозначно: |
||
kкр.л = -Ткр( α/2, |
nх+ nу -2); |
kкр.п =Ткр( α/2, nх+ nу -2). |
Рассмотрим числовой пример: Пусть по выборкам объема nх=12 nу=8 получе-
ны оценки математических ожиданий наблюдаемых нормальных случайных вели-
чин Хср=10,2; Yср=16,8 и оценки среднеквадратических отклонения Sх=6,5 и Sу=7,4.
Примером подобных данных могут быть показания двух приборов при измерении одной и той же физической величины. Поскольку, каждая оценка есть величина случайная (получена по конкретной случайной выборке), то проверим гипотезу об однородности случайных величин. Сначала проверим гипотезу о равенстве диспер-
сий Н0={σх2=σу2}. Зададимся уровнем значимости гипотезы α=0,02 и воспользуем-
ся критерием Фишера – Снедекора . Поскольку значения Sх=6,5 и
Sу=7,4 отличаются незначительно, то в качестве альтернативной гипотезы примем
Н3 ={σх2 ¹ σу2}. Критическая область односторонняя Ккр={k>kкр}, а критическую точку найдем из таблиц kкр = Fкр(0.02/2, 8,12) = 4,5. Наблюдаемое значение крите-
рия kнабл=(7.4/6.5)2 =1,296 не принадлежит критической области, поэтому гипотеза о равенстве дисперсии принимается.
Поскольку гипотеза о равенстве дисперсии принимается, то проверим теперь гипотезу о равенстве математических ожиданий Н0={ах = ау}. Пусть уровень значи-
мости этой гипотезы α=0.02, а за единственную альтернативную гипотезу примем
Н2={ах < ау} и воспользуемся критерием Стьюдента.
Критическая область левосторонняя Ккр={k<kкр}, а критическую точку найдем из таблиц kкр= -Tкр(0.025, 8+12-2)=-2.1. Наблюдаемое значение критерия kнабл=(10.1-16.8)*9.295/29.122=-2.385 принадлежит критической области, поэтому гипотеза о равенстве математических ожиданий отвергается (наблюдаемые в вы-
борках отличия значительны).
16
6.3. Проверим гипотезу о значимости коэффициента корреляции двух случай-
ных величин X, Y совместно наблюдаемых в выборках ХВ={xj}, YВ={yj} равного объема n . Вычислим выборочный коэффициент корреляции
ρв= n |
( XY )ср − X срYср |
где (XY)ср= |
1 ∑ xi yi , |
|||
|
|
|
|
|
|
n |
|
n − 1 |
|
S x S y |
|
n i=1 |
Поскольку, отличное от нуля значение ρв характеризует степень зависимости вели-
чин X и Y , то для проверки значимости коэффициента корреляции проверим ги-
потезу Н0={ρ=0} при наличии альтернативной гипотезы Н1={ρ¹0}. В качестве кри-
терия примем величину К, распределенную при условии справедливости основной гипотезы Н0 по закону Стьюдента с n-2 степенями свободы.
К= ρ в |
n − 21 − ρ 2 |
fК(k)= T(k , n-2); М[K] = 0; D[K]=n-2/n-3 |
|
в |
|
Вэтом случае критическая область будет двухсторонней
Ккр={k<kкр.л;k>kкр.п}. Однако здесь критические точки kкр.л , kкр.п не
определяются однозначно из уравнения P(k<kкр.л)+P(k>kкр.п)=α, где α заданный уровень значимости. Доказано, что при условии P(k<kкр.л)=α/2 ;
P(k>kкр.п)=α/2 мощность критерия 1-β по отношению к конкурирующей гипотезе
Н1 будет максимальной, тогда из этих уравнений критические точки находятся од-
нозначно:
kкр.л =-Ткр( α/2, n-2); kкр.п =Ткр( α/2, n-2).
Числовой пример. Пусть в опыте одновременно наблюдаются случайные величины
X, Y и получены выборки ХВ={xj}, YВ ={yj} объема n=15. По ним вычислены выбо-
рочные характеристики Хср=10,2; Yср=16,8; |
Sх=6,5 и Sу=7,4; (ХY)ср=160 тогда мож- |
|||||
но вычислить наблюдаемое значение критерия |
|
|
|
|
||
ρ |
|
|
=-0,253 |
|
|
|
=(15/14)(160-10,2*16,8)/(6,5*7,4)=-0,253; k |
|
15 − 2 |
1 − 0.2532 |
=-3,618 |
||
в |
набл |
|
|
|
Задаваясь уровнем значимости гипотезы α=0,05 найдем из таблиц критические точ-
ки двухсторонней критической области критерия
kкр=±Ткр(0,05/2;13)= ±2,16. Поскольку kнабл принадлежит критической области т.к.
17
kнабл >kкр, то гипотезу об отсутствии корреляционной зависимости между X, Y
отвергаем. Наблюдаемый коэффициент корреляции значим.
Используемые в различных критериях проверки функции для критических точек правосторонней области Ткр(α; n); Fкр(α; n1 n2); χ2кр(α; n); представляют собой обратные распределения соответствующих величин и приводятся в таблицах
[1; 2]. В случае отсутствия в таблице нужных значений Fкр(α) можно
воспользоваться табличной интерполяцией; например линейной.
При использовании вычислительных средств функции Fкр(α) обычно встроены в программное обеспечение. Так в приложения Excel из среды Microsoft Office в
категории статистических функций «f*» реализованы:
ХИ2ОБР(α; n) = χ2кр(α; n); FРАСПОБР(α; n1 n2)= Fкр(α; n1; n2);
CТЬЮДРАСПОБР(2α; n) = Ткр(α; n); НОРМОБР(1-α; 0; 1) = Фкр(α).
7. Критерий согласия Пирсона.
При рассмотрении критериев проверки гипотез о значении параметров слу-
чайных величин или критериев значимости предполагался вид закона распределе-
ния случайной величины. Закон для непрерывной случайной величины Х задается в общем случае функцией распределения FX(x, θs) или функцией плотности распре-
деления fX(x, θs), где θs параметры распределения s=1,..,r.
Критерием согласия называется критерий проверки гипотезы о предполагае-
мом виде закона распределения. Рассмотрим один из подобных критериев, а именно критерий Пирсона.
Основной гипотезой при проверке является простая гипотеза о виде распреде-
ления с определенными параметрами Н0={ fX(x, θs), s=1,..,r }. Пусть при наблюдении за случайной величиной получена выборка XB={xi, n} объема n. Суть критерия за-
ключается в сравнении частот эмпирических, полученных в наблюдаемой выборке,
и теоретических, вычисленных по виду предполагаемого распределения случайной величины. Эти частоты обычно различаются , но значимо ли это различие? Возмож-
но, это различие случайно и связано с конкретно наблюдаемой выборкой и величи-
18
ной ее объема, а возможно, что эти различия значимы и связаны с неверным пред-
положением о виде распределения случайной величины.
Эмпирические частоты строятся по выборке путем объединения наблюдаемых значений в группы. Это достигается, например, построением гистограммы выборки.
Разобьем наблюдаемый интервал значений в выборке на m равновеликих интерва-
лов:
= (Xmax – X min)/m , Xmax=max(xi) , Xmin=min(xi) .
Граничные точки интервалов разбиения hj=[xj, xj+1] ; j=1,..,m и их центры xj+0.5 вы-
числяются следующим образом хj=Xmin + (j-1) ; xj+0.5=( xj+1+ xj)/2. Подсчитав, чис-
ло значений выборки, попавших в интервал hj, получим эмпирическую частоту nj
или относительную эмпирическую частоту ωj =nj/n попадания Х в интервал hj.
Для построения теоретических частот njт воспользуемся тем, что относитель-
ная теоретическая частота попадания случайной величины в интервал hj есть веро-
ятность попадания случайной величины в этот интервал ωjт=P(xj<X<xj+1). По-
скольку вероятность P(xj<X<xj+1)=FX(xj+1, θs)-FX(xj, θs) или равна приближенно при
малых интервала разбиения
x j +1
P(xj<X<xj+1)= ∫ f X (x,θ s )dx ≈ fX(x, θs) ,
x j
то теоретическая частота попадания случайной величины Х в интервал hj будет njт=n ωjт или по приближенной формуле njт≈ fX(x, θs)n .
В качестве критерия проверки основной гипотезы Н0 примем случайную величину, характеризующую суммарное относительное отклонение теоретических и
эмпирических частот.
m |
(n j − nТj )2 |
К = ∑ |
|
Т |
|
j=1 |
n j |
Доказано, что распределение случайной величины К при n → ∞ стремится к распре-
делению «хи-квадрат» χ2 с m-r-1 степенями свободы, где m - число интервалов гис-
тограммы, r - число параметров предполагаемого распределения. Принимая за аль-
тернативную гипотезу Н1 гипотезу противоположную основной Н0 и учитывая что
К>0 , можно показать, что критическая область критерия будет правосторонней
19