Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Учебное пособие 80091

.pdf
Скачиваний:
1
Добавлен:
01.05.2022
Размер:
460.73 Кб
Скачать

ны в i й интервал [xi; xi+1], то есть

xi 1

(2.2)

Pi = f(x)dx

xi

Для наглядности теоретическое распределение можно оформить в виде графика, совмещая кривую плотности вероятностей и гистограмму. Для этого надо вычислить значения теоретической кривой в граничных точках интервалов разбиения.

6. В качестве критерия проверки вопроса о согласованности теоретического и статистического распределений обычно используется критерий 2 Пирсона ( хи - квадрат).

2

k

(P* P )2

 

 

 

 

 

 

i i

 

 

 

= n

 

 

 

 

или

(2.3)

 

 

Pi

 

i 1

 

 

 

 

2

k (m

i

nP )2

 

 

 

=

 

 

i

 

 

(2.4)

 

 

 

nPi

 

 

i 1

 

 

 

 

Критерий 2 имеет = k – l –1 степеней свободы, где l - количество оцениваемых параметров в законе распределения. При нормальном законе распределения оценивается дисперсия

иматематическое ожидание, то есть l = 2.

7.По таблице 2 приложения находится граница 2кр кри-

тической области для заданного уровня значимости критерия q и числа степеней свободы . Если

2 кр2

(2.5)

то можно признать расхождения между теоретическим и статистическим распределениями несущественными, то есть выборочный материал не противоречит гипотезе о том, что случайная величина Х имеет плотность распределения f(x). В противном случае эта гипотеза не подтверждается.

8. Порядок выполнения работы:

8.1.Оформить статистический (вариационный) ряд в виде таблицы. Построить гистограмму. Выбрать вид теоретической кривой f(x).

8.2.Использовав метод моментов, подобрать параметры теоретического распределения. Записать теоретическую

9

кривую в виде функции плотности вероятности.

8.3.Изобразить кривую плотности вероятности в виде графика, вычислить Pi . Оформить выборку в виде таблицы.

8.4.Вычислить значения 2. Определить число степеней свободы и уровень доверительной вероятности q.

8.5.По таблице 2 приложения по значениям q и опре-

делить 2кр .

8.6.Проверить неравенство (5).

8.7.Сделать выводы. Оформить работу.

9. Пример. С целью исследования закона распределения отклонения от номинального размера диаметра роликов из текущей продукции автомата, обрабатывающего ролики, взята выборка объемом п= 20.

Выборка оформлена в виде простого статистического

ряда.

Необходимо подобрать теоретическую функцию распределения, выровнять ряд с доверительной вероятностью = 0,9.

9.1. Оформим ряд в виде статистического (вариационного) ряда. Для этих целей выберем к = 6.

=

xmax xmin

=

1,8 1,8

= 0,6

 

 

 

6

 

6

 

 

 

 

 

Оформим результаты в виде таблицы

 

 

 

 

 

 

 

 

 

 

X

-1,8; -

-1,2; -

 

-0,6;

0;

0,6;

1,2;

 

1,2

0,6

 

0

0,6

1,2

1,8

mi

2

3

 

1,5

7,5

4

2

P*

0,1

0,16

 

0,075

0,375

0,2

0,1

i

 

 

 

 

 

 

 

 

Построим гистограмму (рис. 1.2)

 

 

10

P*

-1,8

-1,2

-0,6

0

0,6

1,2

1,8

X

Рис.1.2

Учитывая вид гистограммы, выберем в качестве теоретического закона нормальный закон распределения, тогда функция плотности вероятности запишется в виде

f(x) =

1

( x mx )2

(6)

e 2 z2

x 2

9.2.Используем метод моментов, для этих целей вы-

числим

~

=

 

k

~

 

*

 

=

-1,5 0,1

 

-

 

0,9 0,15 –

0,3 0,075 +

mx

 

xi

Pi

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,3 0,375 + 0,9 0,2 + 1,5 0,1 0,055.

 

 

 

~

=

 

n

 

k

~

~

 

2

*

=

20

(1,555 0,1 +

0,955 0,15 +

Dx

 

 

 

 

(xi

mx

)

 

Pi

 

 

 

 

 

 

19

 

 

 

n 1i 1

 

 

 

 

 

 

 

 

 

 

 

0,355 0,075 + 0,245 0,375 + 0,842 0,2 + 1,445 0,1) 0,79

Тогда

~

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

Dx 0,89.

 

 

 

 

 

 

 

 

 

 

 

Приравнивая

~

= mx и

~

 

=

x получим теоретиче-

mx

x

скую кривую в виде

 

 

 

 

 

 

 

 

 

 

 

 

 

f(x) =

 

1

 

 

 

 

 

( x 0,055 )2

 

 

 

 

 

 

 

 

 

 

 

 

e

 

2 0,79

 

 

 

 

 

 

 

 

 

 

0,89

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

Построим график этой кривой для этого вычислим значения f(x) в граничных точках разбиения на интервалы.

11

Результаты вычислений сведем в таблицу.

X

-1,8

-1,2

-0,6

0

0,6

1,2

1,8

f(x)

0,052

0,166

0,34

0,447

0,372

0,195

0,066

Для упрощения вычислений можно использовать статистическую таблицу.

Изобразим график на рис. 2. Получим плавную кривую плотности вероятности нормального распределения.

Вычислим вероятности Pi попадания случайной величину в i - й интервал. Для нормального закона

 

 

 

xi 1

 

 

 

 

 

 

 

mx

 

 

 

 

 

Pi =

 

f(x)dx

xi 1 mx

 

 

xi

 

 

(2.7)

 

 

 

 

 

 

 

 

 

 

 

xi

 

 

x

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Функцию (Лапласа) находим по статистической таб-

лице. Результаты сведем в таблицу вида

 

 

 

 

 

 

 

 

X

-1,8;

 

-1,2;

 

-0,6;

 

 

0;

 

 

 

 

 

0,6;

 

1,2;

 

-1,2

 

-0,6

 

0

 

 

 

0,6

 

 

 

 

 

1,2

 

 

1,8

mi

2

 

3

 

 

1,5

 

 

 

7,5

 

 

 

 

 

4

 

 

2

P*

0,1

 

0,15

 

0,075

 

 

0,375

 

 

 

0,2

 

 

0,1

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Pi

0,061

 

0,15

 

0,2464

 

0,2464

 

 

0,15

 

0,061

 

9.4. По

формуле (3) вычислим значение 2

 

 

 

2 = 20

0,039

0

0,1715

 

0,1286

 

0,05

 

0,039

 

= 5,06.

 

 

 

 

 

0,061

 

 

0,061

0,2464

 

0,2464 0,15

 

 

 

 

Так как оценивались два параметра mx и Dx, то l = 2,

тогда = 6 – 2 – 1 = 3.

9.5. Вычислим уровень значимости по заданной доверительной вероятности

q = 100(1 - ) = 10%

9.6.По таблице 2 найдем 2кр .

9.7.Проверим неравенство (6); 2кр = 6,25,

2 = 5,06 < 6,25 = 2кр

Неравенство выполняется.

12

9.8. Можно считать, что случайная величина Х , определяемая первоначальной выборкой, не противоречит гипотезе о нормальности ее распределения с плотностью вероятности

f(x) =

1

 

 

( x 0,055 )2

 

 

 

 

 

 

e 2 0,79

0,89

 

 

 

2

10. Практические задания

Использовав выборки наблюдений заданий работы № 1, выровнять статистические ряды с помощью нормального распределения. При построении гистограмм проверить разбивку интервала изменения случайной величины Х на 6 частей.

3. СГЛАЖИВАНИЕ ЭКСПЕРИМЕНТАЛЬНЫХ ЗАВИСИМОСТЕЙ

ПО МЕТОДУ НАИМЕНЬШИХ КВАДРАТОВ

1. При обработке опытных данных часто приходится решать задачу, целью которой является исследование зависимости одной физической величины Y от другой физической величины X. Предполагается, что эти величины связанны некоторой зависимостью

Y f(X,a1,a2 ,...,am )

(3.1)

где a1,a2 ,...,am - искомые параметры.

2. На практике функция (3.1) (уравнение регрессии) выбирается в виде полинома

n

 

(3.2)

Y aiXi ,

(m 1, 2,...)

i 0

Иногда употребляются и другие элементарные функции: дробно-линейная, степенная, логарифмическая и т.д.

3. Геометрическая задача подбора аналитической функции состоит в проведении такой кривой вида (3.2) (линии регрессии), которая возможно “ближе” примыкает к системе точек (xi yi), (i = 1, 2, …, n), образовавшихся в результате n реализаций случайных величин X, Y

13

Результаты реализаций оформляются в виде таблицы. xi x1 x2 … xm

yi y1 y2 … ym

4. Наибольшее распространение для решения этой задачи получил метод наименьших квадратов (МНК).

Согласно МНК наилучшей функцией приближения (уравнением регрессии) будет такая, для которой сумма квадратов отклонений

 

n

(a0 a1xi ... amxim ) yi 2

 

S(a0 ,a1,...,an )

 

i 1

 

(3.3)

будет минимальной.

 

 

 

Выбор функции “близости“ в виде (3.3) обеспечивает

несмещенные и

состоятельные

оценки

параметрам

a0 ,a1,...,an когда

случайные величины X и Y

подчинены

нормальному закону распределения .

5. использование нескольких условий существования экстремума функции нескольких переменных, определяет так называемую систему уравнений для отыскивания параметров

S/

0,

S/

0, ...,

S/

0.

(3.4)

a0

a0

am

 

 

 

 

или в развернутом виде

 

n

n

 

n

n

 

a0 a1 xi a2 xi2

... am xim yi

 

i 1

i 1

 

i 1

i 1

 

n

n

a2

n

n

 

n

a0 xi

a1 xi2

xi3

... am xim

xiyi

i 1

i 1

 

i 1

i 1

 

i 1

(3.5)

.......................................................................................

n

 

n

 

n

 

n

 

n

 

 

m

m 1

m 2

m m

m

 

a0 xi

a1 xi

a2 xi

... am xi

xi yi

i 1

 

i 1

 

i 1

 

i 1

 

i 1

 

 

Решение одним из методов (например по правилу

Крамера)

системы

(3.5)

относительно

параметров

ai (0 i m) дает искомые

оценки, и,

следовательно,

определяет аналитический вид функции (3.2).

 

 

 

 

14

 

6. Если уравнение регрессии линейно т.е.

Y a0 ax X

то его адекватность проверяется при помощи коэффициента корреляции, оценка которого

 

 

~

 

 

 

 

 

~rxy

kxy

 

 

 

 

 

~ ~

 

 

 

 

 

 

x y

 

 

 

 

 

~

 

n

~

)(yi

~

)

где

 

(xi mx

my

kxy

 

i 1

 

 

 

 

 

n 1

 

 

 

 

 

 

 

 

(3.6)

- оценка корреляционного

момента

x, y – оценки среднеквадратичных отклонений случайных величин X, Y соответственно.

Чем ближе коэффициент корреляции приближается к +1 или –1, тем сильнее линейная связь и, следовательно, точнее регрессионное уравнение описывает заданную статистику.

7. Если уравнение регрессии нелинейно, то его адекватность проверяется корреляционным отношением, оценка которого

~

y

x

n

( yi Yi )2

 

1

i 1

 

 

 

(3.7)

n

~

)

2

 

 

(yi my

 

 

 

 

i 1

 

 

 

 

Yi – значение величины Y, полученное по уравнению регрессии в точке xi

Чем ближе корреляционное отношение к 1, тем теснее связь, точнее регрессионное уравнение описывает заданную статистику.

8. Значимость коэффициента корреляции проверяется по t - критерию Стьюдента

~

 

 

 

 

 

 

n 2

 

 

 

r

 

 

 

tp

xy

 

 

 

(3.8)

 

 

 

 

 

~2

 

 

 

1 rxy

 

 

с = n - 2 степенями свободы. Если вычисленная по формуле (3.8) величина по модулю меньше, чем в

15

статистической табл. tкр( , q), то полагают, что теоретический коэффициент корреляции равен нулю, т.е. ~rxy не значим, в

противном случае ~rxy значим, и его надо учитывать.

9. Значимость корреляционного отношения проверяется по критерию Фишера

 

n (m 1)

~2

 

 

 

 

F

 

yx

 

 

 

(3.9)

m

1 2

 

 

p

 

 

 

 

 

 

yx

 

 

 

(m –1 – число параметров в уравнении регрессии) с

числами степеней свободы 1 =

m и 2 = n – (m+1). Если

вычисленная

по формуле (3.9)

величина Fp

больше

чем

выбранная из

статистической таблицы Fкр( 1,

2, q), то

~

yx

значим и его надо учитывать.

10.1Выбрать вид регрессионного уравнения

10.2Исследуя таблицу исходных данных, составить систему нормальных уравнений вида (3.5)

10.3Решить систему нормальных уравнений относительно параметров a0 ,a1,...,am

Записать аналитический вид регрессионного уравнения. Вычислить оценки коэффициента корреляции или

корреляционного отношения.

Проверить значимость полученных оценок.

Построить на графике теоретическую кривую и отложить значения таблицы (для наглядности).

Сделать выводы и оформить работу.

11. Пример. Вычислить параболическую регрессию Y на X для данных, сведенных в таблицу.

Xi

1

2

3

4

5

6

7

Yi

1.33

2.57

4.17

5.0

5.33

6.50

6.0

C доверительной вероятностью = 0.95 проверить ее адекватность.

11.1. По условию задачи уравнение регрессии надо выбирать в виде

y a

0

a X a

2

X 2

(3.10)

 

1

 

 

 

 

 

 

 

16

II.2. Составим систему нормальных уравнений вида

(3.5) при m = 2; n = 7.

 

 

 

 

7

 

 

7 2

 

 

n

 

 

 

 

 

 

 

 

7a0 a1 xi a2 xi

 

yi

 

 

 

 

 

 

 

 

 

i 1

 

 

i 1

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7

 

7

2

7

 

3

n

 

 

 

(3.11)

 

 

a0 xi

a1 xi

a2 xi

xiyi

 

 

 

i 1

 

i 1

 

 

i 1

 

i 1

 

 

 

 

 

 

 

 

7

2

7

3

7

 

4

n

2

 

 

 

 

 

 

 

a0 xi

a1 xi

a2 xi

xi yi

 

 

 

 

 

 

i 1

 

i 1

 

 

i 1

 

i 1

 

 

 

 

 

 

 

Для вычисления коэффициентов при a0,

a1, a2 составим

вспомогательную таблицу

 

 

 

 

 

 

 

 

 

 

N

xi

 

yi

 

 

X2i

 

X3i

 

X4i

XiYi

 

X2iYi

 

 

1

1

 

1.33

 

 

1

 

1

 

 

1

 

1.33

 

1.33

 

 

2

2

 

2.57

 

 

4

 

8

 

 

16

5.14

 

10.28

 

 

3

3

 

4.17

 

 

9

 

27

 

81

12.51

 

37.53

 

 

4

4

 

5.0

 

 

16

 

64

 

256

20.0

 

80

 

 

5

5

 

5.33

 

 

25

 

125

 

625

26.65

 

133.25

 

 

6

6

 

5.50

 

 

36

 

216

 

1296

33

 

198.00

 

 

7

7

 

6.0

 

 

49

 

343

 

24.01

42

 

294

 

 

 

28

 

29.90

 

 

140

 

784

 

4676

140.63

 

764.39

 

 

Тогда систему нормальных уравнений можно записать

так

 

 

 

 

 

 

 

 

29.9

 

 

 

 

 

 

 

7a0 28a1 140a2

 

 

 

 

 

 

 

 

28a0 140a1 784a2

140.63

 

 

(3.12)

 

 

 

 

 

 

140a0 784a1

4676a2

 

 

 

 

 

 

 

 

 

 

 

764.39

 

 

 

 

для решения этой системы сначала разделим числовые коэффициенты каждого уравнения на коэффициенты при a0 ,получим

a0 4a1 20a a0 5a1 28a

2

2

4.

5.

 

a0

4.6a1

33.4a2

5.4

(3.13)

решаем систему по правилу Крамера

 

 

 

 

1

4

20

 

= 0,б

 

 

 

 

 

 

 

 

 

1

5

28

 

 

 

 

 

1

3,5

33,4

 

 

 

 

 

 

 

 

 

 

 

 

17

 

 

 

 

4,27

4

20

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a0

5,07

5

28

 

 

0,64

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5,46

4,6 33,4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 4,27

20

 

=

0,53

 

 

 

 

 

 

1

4

4,7

 

= -

 

 

 

 

 

 

 

 

 

 

a1

 

 

1 5,02

26

 

 

a2

 

 

1

5

5,2

 

 

 

 

 

 

1 5,46

33,4

 

 

 

 

 

 

 

 

 

 

 

1

5,6 5,46

 

 

0,017

 

 

 

0.54

 

 

 

 

 

 

0.53

 

 

 

 

 

 

 

0.01

 

 

 

a

 

 

1.07 ;a

 

0.88;

a

 

 

0.017

 

 

 

 

 

 

 

 

0

0.5

 

1

0.5

 

 

2

 

0.5

 

 

 

11.3.Уравнением регрессии будет

Y = 1.07 + 00.88X - 0.017X2

11.4.Так как уравнение регрессии нелинейно, то будем вычислять корреляционное отношение по формуле (3.7)

7

 

 

 

~

 

 

y

i

 

 

29.4

 

 

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

 

Найдем m

 

 

 

 

 

 

 

 

4.27

 

 

 

7

 

 

7

 

 

 

 

Для удобства опять воспользуемся таблицей

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

 

 

Yi

 

y

 

 

 

 

yi-Yi

~

(yi-Yi)

(y ~

2

 

 

 

 

 

 

 

 

yi-m

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i- my

 

1

 

1.33

 

1.93

 

 

-0.6

-2.94

0.36

8.64

 

 

2

 

2.57

 

2.76

 

 

-0.19

-1.7

0.036

2.89

 

 

3

 

4.17

 

3.56

 

 

0.61

-0.1

0.372

0.01

 

 

4

 

5.

 

 

4.32

 

 

0.68

0.73

0.462

0.583

 

 

5

 

5.33

 

5.05

 

 

0.28

1.06

0.078

1.124

 

 

6

 

5.5

 

5.74

 

 

-0.24

1.23

0.058

1.513

 

 

7

 

6.0

 

6.39

 

 

-0.39

1.73

0.152

2.99

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1.518

17.7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~

 

1.518

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 0.08576 0.95

 

 

y

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

17.7

 

 

 

 

 

 

 

 

 

 

 

 

 

Величина корреляционного отношения близка к 3.1. 11.5. Проверим значимость полученного

18