Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Мания, Г. М. Статистическое оценивание распределения вероятностей

.pdf
Скачиваний:
9
Добавлен:
20.10.2023
Размер:
7.77 Mб
Скачать

Г. М. М А Н И Я

СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ

РАСПРЕДЕЛЕНИЯ

ВЕРОЯТНОСТЕЙ

ИЗДАТЕЛЬСТВО ТБИЛИССКОГО УНИВЕРСИТЕТА

ТБИЛИСИ 1974

■ ГОС. ПУКЛЯ*(АН— I

#

Ш

г :

517.8 УДК 519.281+519.282

М 234

В книге изучаются свойства статистических оценок распределения вероятностей. В области непараметрического оценивания, наряду с извест­ ными свойствами эмпирической функции распре­ деления, в книге освещены исследования послед­ них лет по оцениванию плотности. Параметри­ ческие оценки строятся для функции нормально­ го распределения и многомерных плотностей, в частности, для плотности нормального распреде­ ления. Получены предельные распределения неко­ торых статистик, характеризующих 'точность оценок.

Книга рассчитана на научных работников в области теории вероятностей, математической статистики и их приложений, аспирантов и сту­ дентов соответствующих специальностей.

(g) Издательство Тбилисского университета, 1974

20203 М — 608

ОГЛАВЛЕНИЕ

Предисловие

 

 

 

...............................................................................

 

 

 

 

 

 

 

 

5

Г л а в а

I.

Некоторые свойства эмпирической функции распределения

7

§

I.

Распределение мер отклонения Sn (х)

от

F (х)

.

.

7

§

2.

Леммы о производящих функциях и преобразованиях

 

 

 

Лапласа

 

 

 

 

 

..................................................

 

 

 

 

14

 

§

3.

Распределение

статистики

D+ (0!, 6а)

. .

.

 

24

§ 4 .

Распределение

статистики

£\,(6i, 0г)

 

. . .

.

 

48

Г л а в а

II. Непараметрическаяоценкаплотностираспределения

 

 

67

§

I. Равномерная

сходимость у~п

к f (х)

 

68

§

2.

Лемма о

вероятностяхбольших

уклонений

. .

.

 

70

§ 3.

Построение доверительных областей для плотности рас­

 

 

 

пределения

 

 

 

 

 

 

 

 

 

 

96

§

4.

Непараметрическая

оценка плотности

двумерного

рас­

 

 

 

пределения . . .

 

 

. .

 

 

 

96

 

Г л а в а

III.

Непараметрическая оценка плотности распределения

в

 

 

 

 

случае двух неизвестных мер-

 

 

.

.

. 1 0 5

§

1.

Состоятельные

оценки

п л о т н о с т и .......................................

 

 

 

105

§

2.

Асимптотическое поведение

распределений

.

.

. 1 1 5

§

3.

Дополнения

 

 

 

 

 

 

 

 

 

 

128

Г л а в а

IV.

Параметрическая

оценка

функции

нормального

рас­

 

 

 

 

пределения

 

 

 

 

 

 

 

 

 

133

§

1.

Моменты

и

максимальная абсолютная

погрешность

па­

 

 

 

раметрической оценки функции нормального распределения

134

§

2.

Некоторые

свойства

максимального

абсолютного

рас­

 

 

 

хождений двух параметрических оценок функции нор­

 

 

мального

распределения .

.

.

 

. . .

.

 

136

3

§

3.

Предельное

распределение

максимального

абсолют­

 

 

ного расхождения двух параметрических оценок функ­

 

 

ции нормального распределения

........................................

 

 

139

Г л а в а

V.

Свойства

параметрической

оценки

плотности

распреде­

 

 

ления

 

 

 

 

 

 

 

146

§

1.

Статистики,

связанные с

параметрической

оценкой

 

 

 

плотности

 

распределения

 

 

 

 

146

§

2.

Моменты

параметрической

оценки

плотности

 

распре­

 

 

деления

 

 

 

 

 

 

 

149

§

3.

Распределение

некоторых

функций

от нормальных

и

 

 

асимптотически

нормальных

случайных векторов

.

. 154

§4. Предельное распределение средней квадратической пог­ решности параметрической оценки плотности распределения 157

§5. Предельное распределение среднего квадратического рас­ хождения параметрических оценок плотности распределения 161

Гл а в а VI. Параметрическая оценка плотности нормального рас­

 

 

пределения

 

................................................

 

169

§

1.

Параметрическая

оценка

плотности

одномерного

нор­

 

 

мального

распределения

 

 

170

§

2.

Параметрическая

оценка

плотности

многомерного

нор­

 

 

мального

распределения

снезависимыми компонентами . 180

§

3.

Моменты

параметрической оценки плотности много­

 

 

мерного

нормального распределени я........................................

186

§4. Средняя квадратическая погрешность параметрической оценки плотности многомерного нормального распределения 202

§5. Средняя квадратическая относительная погрешность па­ раметрической оценки плотности многомерного нормаль­

 

ного

распределения ...............................................................

207

§ 6.

Параметрическая оценка плотности логнормального рас­

 

пределения

209

§ 7.

Один случай асимптотического анализа мощности кри­

 

терия

с участием параметрической

оценки плотности

распределения

 

 

 

 

 

 

 

 

212

П р и л о ж е н и е

.

.

.

.

.

.

.

.

 

. . .

219

Л и т е р а т у р а

...................................................................

 

 

 

 

 

 

 

...........

.

. 2 3 1

У к а з а т е л ь ............................................

 

 

 

 

 

 

 

..

.

.

. 238

4

ПРЕДИСЛОВИЕ

Построение статистических оценок распределения вероят­ ностей и исследование их свойств имеет определяю щее значение для основной цели математической статистики — установления согласия эмпирических данных с гипотезами о неизвестных рас­ пределениях.

Впредлагаемой читателю книге изучены свойства пара­ метрических и непараметрических оценок функции распределе­ ния и плотности распределения случайных величин и векторов.

Вглаве I, открывающейся кратким обзором результатов о статистиках типа Колмогорова, Смирнова и Реньи, подробно

доказаны теоремы

о распределении супремумов одностороннего

и двустороннего отклонений эмпирической функции распределе­

ния — простейшей

непараметрической оценки неизвестной функ­

ции распределения — от оцениваемой функции.

В главе II изучаются свойства т. н. обобщенных гисто­

грамм — ненараметрических оценок типа Парзена плотности рас­ пределения по лебеговой мере. Теоремы, приведенные в этой главе, позволяют оценить точность приближения неизвестной плотности и построить для нее доверительную область заданного уровня.

Непараметрические оценки плотности можно строить и в том случае, когда плотность распределения берется не по лебе­

говой,

а

по неизвестной вероятностной

мере,

информация о

которой

содержится

в выборке

из соответствую шей генеральной

совокупности. Такие оценки рассматриваются в

главе

III.

В главе IV, посвященной параметрической оценке функции

нормального распределения посредством

выборочной

средней и

дисперсии,

наряду с

изложением известных результатов о мо­

ментах

оценки и

предельном

распределении

максимального

5

отклонения оценки от оцениваемой функции изучается макси - мальное расхождение двух параметрических оценок функции

нормального распределения по двум независимым выборкам.

В главах V и VI собраны результаты исследования мо­ ментов параметрической оценки плотности распределения и пре­ дельного распределения некоторых статистик, характеризующих

точность приближения и взаимное расхождение

нескольких оц е­

нок, построенных по независимым

выборкам.

Доказанные в

гл. V общие теоремы используются

для подробного изучения

свойств параметрической

оценки плотности нормального рас­

пределения, которой целиком посвящена гл. VI. Исходя из

предельных распределений

средней квадратической погрешности

параметрической оценки плотности нормального распределения и среднего квадратического расхождения нескольких таких оценок,

можно

строить

различные

критерии согласия и

однородности.

В конце гл. VI мощность такого критерия на простом

примере

сравнивается с мощностью критерия Пирсона.

 

 

 

 

 

В приложении

к

книге

помещены таблицы функций не­

которых

предельных распределений из глав I, IV и VI.

 

 

 

Считаю своим

приятным

долгом с чувством огромной бла­

годарности

вспомнить имя одного из основоположников

совет­

ской

школы математической

статистики

члена-корреспондента

АН

СССР

Н. В. Смирнова,

 

который ввёл

меня в круг

задач,

рассматриваемых в этой книге.

 

 

 

 

 

 

 

Пользуясь

случаем, выражаю признательность действитель -

ному члену АН УССР Б.

 

В.

Гнеденко,

ознакомившемуся

с

книгой в рукописи, за полезные

обсуждения и советы.

 

 

 

Хочу

выразить

искреннюю

благодарность моим

коллегам

К. В. Манджгаладзе,

Э.

А.

Надарая,

Р. Я.

Читашвили

и

Т. Л. Шервашидзе, любезно предоставившим рукописи с не­ опубликованными доказательствами некоторых теорем, включен­ ных в книгу. Последнему я глубоко признателен за ряд существенных усовершенствований формулировок и доказа­ тельств при окончательном редактировании книги.

6

Г Л А В А

I

 

НЕКОТОРЫЕ СВОЙСТВА эмпирической функции

РАСПРЕДЕЛЕНИЯ

 

Самой естественной оценкой функции распределения F (х)

случайной величины X по выборке

Х х, ... ,Хп из генеральной

совокупности X является эмпирическая функция распределения

S n(%), равная относительной частоте

тех выборочных значений,

которые меньше х.

Sn(x),

 

Детальное изучение свойств

заключающееся в

исследовании мер отклонения Sn(х)

от F (х),

с помощью кото­

рых строятся непараметрические критерии согласия, является

заслугой советских математиков В. И. Г л и в е н к о ,

А. Н. К о л ­

м о г о р о в а , Н. В. С м и р н о в а , Б. В. Г н е д е н к о ,

Ю. В. П р о ­

х о р о в а ,

А. А. Б о р о в к о в а ,

И. И.

Г и х м а н а ,

В. С. К о ­

р о л ю к а,

В. С. М и х а л е в и ч а ,

Н. Н. Ч е н ц о в а и др.

 

В этой главе, после краткого обзора основных

результатов

о распределении мер отклонения

Sn (х) от F (х),

изучено

рас­

пределение супремумов одностороннего

и двустороннего откло­

нений Sn(x) от F (х) на заданном участке роста

F(x).

Не­

обходимость введения этих статистик была вызвана тем, что

степень согласия

Sn (x) с

F(х) часто бывает

разной на раз­

ных частях прямой, имея

тенденцию ухудшаться

на «хвостах»

распределения.

Знание их

свойств

позволяет

решить вопрос о

пригодности F (х) на том участке ее роста, где имеющийся

статистический

материал

наиболее

надёжен

для

проводимого

сравнения.

 

 

 

 

 

 

 

 

§ 1. РАСПРЕДЕЛЕНИЕ МЕР ОТКЛОНЕНИЯ

Sn (х)

ОТ F (х)

В качестве

меры отклонения Sn (х) от

F (х)

в разное время

различными авторами рассматривались статистики

7

 

Dn(0!, е2) =

sup

 

|Sn (x) — F (x)\ ,

 

 

 

 

 

 

 

x£M( e1( 02)

 

 

 

 

 

 

 

 

F>n(0lt 02) =

sup

 

[Sn (*)

— F{x)\r

 

 

 

 

 

 

 

X

(Ox,

62)

 

 

 

 

 

 

 

 

D~ (0!, 02) =

sup

 

[F(x) Sn (x) ],

 

 

 

 

 

 

 

х£М(Ъи 0a)

 

 

 

 

 

 

 

 

Rn (01, 02) =

sup

 

 

sn(*) — F (x)

 

 

 

 

62)

 

F(x)

 

 

 

 

 

 

 

X ^ M (0i,

 

 

 

 

 

R+n(0i, 02)

=

 

sup

'

Sn (*) -

F(x)

 

 

 

 

 

 

 

F(x)

 

 

 

 

 

 

 

x£M(Oi, 0a)

 

 

 

 

 

 

Rn (0i, 02)

=

SUP

0a)

R(x)

-

sn (x)

 

 

 

 

F(x)

 

 

 

где

 

 

 

x£M (0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

V ^

 

V2 ^

1

 

 

 

 

 

 

 

 

 

И

 

 

 

 

 

: 01< f ( x ) < 0 2) .

 

 

 

 

M (0la 0a)

=

{x

 

 

 

 

Предполагая

F (x)

непрерывной, легко обнаружить, что

распределение

перечисленных

 

статистик не зависит от вида

F (х).

Поэтому

с

их помощью

 

могут

быть

построены непара­

метрические критерии согласия.

 

 

 

 

 

 

 

 

 

Исследование

распределения этих

статистик прошло нес­

колько этапов. Сначала были получены предельные при

п -> о о

распределения для

Dn(0, 1),

D+ (0,

 

1)

и

D ~(0, 1),

а

потом

для

Dn(Q1, 021,

D* (01, 02)

и

 

D ~(01( 02)

при

произвольных

и

02. Позже

были

найдены

предельные

распределения

Rn (0, 1), Rn (0, 1)

и

Д „(0,

1)-

В

дальнейшем,

в связи

с ус­

тановлением точных распределений упомянутых

статистик, поя­

вилась возможность значительно уточнить

имеющиеся

асимпто-

тичеекие формулы и составить необходимые для практики таблицы.

В 1933

г.

В. И. Г л и в е н к о [82] доказал, что Sn (x) с

вероятностью

1

сходится к F (х) равномерно на всей прямой

Р{Пт £>„(0,1) = 0} = 1 ,

П~*00

причем F (х) не обязана быть непрерывной.

8

Этот

качественный

результат

уточнил

А. Н.

К о л м о г о ­

р о в [86],

установивший

предельное

распределение D „(0, 1)

 

p { d „ ( 0, l x ^ L } = К(Х) ,

 

( 1. 1. 1)

где

со

 

 

 

 

 

 

— 2 г2 л2

 

 

 

 

( - I)'-1

Х > 0

,

 

 

 

( О ,

Согласно (1.1.1), задав доверительную вероятность а и определив Ха из уравнения К (X) = а, при больших я можно утверждать, что

 

 

 

sup

|Sn (х) -

F(x) |<

~~==

 

 

 

 

 

x^R1-

 

 

У п

 

 

с вероятностью

а.

 

 

 

 

 

 

 

Для статистики D „(0, 1)

В.

С. К о р о л ю к о м

[13]

было

установлено

точное распределение,

асимптотическое

разложение

которого содержится в работах [12] и [74].

 

 

 

С целью детального изучения поведения S „(x) Н. В. С м и р ­

н о в

исследовал

односторонние

отклонения Sn (х) от F(x).

 

 

В

1939

г.

им было найдено предельное распределение

ста­

тистики

DX (0,

1)

[56]

 

 

 

 

 

 

lim

Р

At( 0, 1) < ~гт==

 

[ 1 - е- 2Х2, X > о ,

1. 1.2)

 

 

( О ,

 

(

 

Я—оо

 

 

у я

 

Х < 0 .

 

 

Несколько позднее Н. В.

Смирнову удалось

найти и точ­

ное

распределение

D+(0, 1) [57]

 

 

 

 

Х < 0 ,

X \п

п— 1

 

, , г

у (n-i-yx УП г -'-1

1 - 1

] / T V

У я

i=r-\-1

О< X ^ я ,

 

 

 

 

X >

v Я ,

 

 

(1.1.3)

где г = [X У

 

 

9

Соседние файлы в папке книги из ГПНТБ