Добавил:
kiopkiopkiop18@yandex.ru Вовсе не секретарь, но почту проверяю Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

5 курс / ОЗИЗО Общественное здоровье и здравоохранение / Медицинская_статистика_Жижин_К_С_

.pdf
Скачиваний:
3
Добавлен:
24.03.2024
Размер:
8.17 Mб
Скачать

Глава 4

ПРИЕМЫ ОПИСАТЕЛЬНОЙ

СТАТИСТИКИ

Это первый достаточно простой, однако самый ответ­

ственный этап статистического анализа эмпирических

данных. И начинается работа, как вы понимаете, с про­

верки полученных данных на «нормальность•.

И это не догма: от данной процедуры зависят коррект­

ность. и однозначность выводов практически всех и глав. -

ным образом сложных, многомерных методов анализа данных (например, дискриминантного или факторного ана­ лиза, которые будут рассмотрены ниже).

Традиционно используются:

дескриптивная статистика и визуализация,

критерии согласия распределений.

Дескриптивныеметоды дают обобщенное описание как эмпирической выборки, так и генеральной совокупности:

среднее арифметическое, минимум, максимум, мода, ме­

диана, дисперсия, стандартное отклонение, асимметрия,

эксцесс и др.

ВизуалЬflЫй .метод (гистограмма, линейные графики

эмпирического распределения) реализован во всех попу­

лярных статистических пакетах, он помогает сопоставить

опытные данные с теоретической кривой нормального

распределения.

10

МедицинскаR статистика

Оценки показателей асимметрии и эксцесса сопряже­

ны с одновременным получением их стандартных ошибок.

Асимметрия (Skewness), коэффициент скошенности

эмпирического распределения частот, - отклонение впра­

во или влево относительно максимальной ординаты:

t(x; _~)3

k .:... ",-'=-,-1---

n'йЗ

Для симметричных распределений показатель асим­

метрии равен нулю. Отрицательный показатель асиммет­

рии означает, что кривая распределения от теоретической

симметричной кривой распределения скошена влево, по­ ложительный - вправо..

Стандартная ошибка асимметрии (Standard error of Skewness) - отклонение показателя асимметрии от нуля:

тм=~~:3'

Показатель эксцесса (Kurtosis), или коэффициент ос­

тровершинности выборочной совокупности, рассчитыва­

ется так:

n

I/Xi _х)4

Ех= ;=1

4 -3.

n·а

Стандартная ошибка эксцесса (Standard error of Kur-

tosis):

тЕх =2mAt=2ш--;6 . n+3

Для нормального распределения показатели асиммет­

рии и эксцесса равны нулю: As = Ех = О.

Для проверки на НОРМщ:Iьность применяют оценки

выборочных коэффициентов асимметрии и эксцесса:

Глава 4. Приемы описатепьной статистики

11

распределение считается симметричным в случае

IAsI<O,I, асимметричным, если IAsI>0,5;

распределение близко к нормальному, если IExIs; 0,1 ,

и значительно отклоняется от него, если IExI >0,5.

При мечан ие. Распределение считается близким к"

нормальному, если значения асимметрии и эксцесса

имеlOТ тот же порядок, что и их стандартные ошибки. .)

МЕТОДЫ, ОСНОВАННЫЕ НА КРИТЕРИЯХ СОГЛАСИЯ

РАСПРЕДЕЛЕНИЙ

Для проверки на нормальность распределения наибо­

лее часто применяют следующие статистические критерии:

~-квадрат;

Омега-квадрат, или тест Крамера-Мизеса, Смир-

нова-Крамера-Мизеса;

Тест Колмогорова-Смирнова;

W-тест Шапиро-Уилкса.

Сущность этих критериев в едином подходе к провер­

ке гипотезы нормальности:

а) рассчитывается уровень значимости р, соответству­

ющий полученному значению статистики критерия;

б) если р > 0,05, то нулевая гипотеза принимается, а

альтернативная - отклоняется.

В таких случаях иногда выводится сообщение р = ns

(незначим);

в) если р < 0,05, то гипотеза о нормальности распре­

деления отклоняется, соответственно принимается

альтернативная.

В таких случаях наиболее подходит критерий Хи-квад­

рат:

2

= ~(f:Мnupuч.- f~)2

 

'Хэмnupuч.

L..J

.(;

,

m=l Jm

_2

Медицинская статистика

где k - количество разрядов признака (интервалов, на ко­

торые разбивают вариационный ряд; i - порядковый но-

мер разряда признака; f:Мnuрuч. - эмпирическая ~aCTOTa по

i-MY разряду признака; f~ - теоретическая частота по ;-му

разРЯДУ признака.

Критерии согласия распределений имеют существен-

ные ограничения по объему выборки:

для критерия Хи-квадрат - n>ЗО ;

для критерия Колмогорова-Смирнова - n > 50 ;

для критерия Омега-квадрат - n > 50.

Если эти условия не выполнены, следует применять критерий Шапиро-Уилкса, предназначенный для выбо­ рок с численностью от 3 до 50 наблюдений.

Рассмотрим задачи, иллюстрирующие применение раз­

личных методов проверки распределения на нормаль­

ность.

Упражнение 3. • • • • • • • • • • • • • • • • • • • • • • •

Проверка на нормальность (случай подтверждения

нормальности для большой выборки, пакет Statistica).

Дано: В плане комплексной оценки уровняработоспо­

собности предстояло проверить нормальность распределе­

ния показателей уровня распределения внимания по тесту

Шульте-Платонова у студентов ДО начала работы.

Алгоритмрешения:

1.Выдвигаем статистические гипотезы:

Нулевую - об отсутствии отличий.

дльтернативную - о наличии отличий.

2.Запустим и его модуль (Основные статистики и табли­ цы) и введем данные в столбец, соответствующий перемен­

ной Уаr1.

З. Выполним проверку на нормальность способами, рас­

смотре~ными выше.

Глава 4. Приемы описатеnьной статистики

 

 

 

"

 

 

 

 

 

 

 

 

 

Nt

Сек.

NI

Сек.

Nt

Сек.

Nt

Сек.

Nt

Сек.

 

 

 

 

 

 

 

 

 

 

1

46

19

55

37

57

55

56

73

39

2

59

20

62

38

58

56

66

74

53

3

49

21

58

39

58

57

54

75

- 63

4

49

22

45

40

48

58

55

76

54

5

50

23

45

41

55

59

51

77

64

6

50

24

55

42

59

6Q

53

78

54

7

51

25

55

43

59

61

45

79

44

8

51

26

45

44

56

62

50

80

45

9

33

27

56

45

49

63

53

81

55

10

44

28

56

46

59

64

49

82

55

11

55

29

66

47

66

65

47

83

55

12

55

30

56

48

67

66

44

84

66

13

43

31

47

49

63

67

60

85

66

14

44

32

57

50

46

68

62

86

56

15

55

33

57

51

44

69

67

87

57

16

55

34

66

52

30

70

66

88

57

17

45

35

67

53

30

71

65

89

37

18

45

36

57

- 54

30

72

55

90

39

 

 

 

 

 

 

 

 

 

 

Оценим выборочную совокупность 8ИЗУально по данным

гистограммы:

В стартовом окне модуля (Основные статистики и таб­

лицы) выберем команду (Описательные статистики).

В поле (Переменные) зададим переменную Уаг1, обо­

значающую время в секундах,. затраченное индиви­

дом на поиск чисел и цифр (от 1 до 25) ПО стандарт­

ной таблице теста Шульте-Платонова.

Выбрав команду (Гистогр,?мма), строим гистограмму

эмпирического ряда, теоретическая,кривая нормаль-

ного распределения показывает их достаточное со­

ответствие.

4. Применим второй способ проверки на нормальность

по оценке коэффициентов асимметрии и эксцесса:

В окне (Описательные статистики) выберем (Другие

статистики) и установим флажки в поля (Асимметрия),

2. К. С. ЖИJl(ИН

14

Медицинская статистика

(Эксцесс), (Стандартная ошибка асимметрии) и (Стан­

дартная ошибка эксцесса).

После нажатия ОК появляется таблица срезультата­

ми анализа: показатель асимметрии (-0,229) и его

ошибка (0,254); показатель эксцесса (-О,300) и его

ошибка (0,503).

Как видим, оценки асимметрии и эксцесса имеют тот

же порядок, что и ИХ ошибки, значит, полученные ненуле­

вые значения оценок асимметрии и эксцесса статистичес­

ки незначимы и нет оснований для отклонеНИ$l нулевой ги­

потезы, т. е. данные распределены по нормальному закон

Гаусса.

5. Третий способ проверки на нормальность. Значитель­ ный объем выборки позволяет применить критерии Колмо-

горова-Смирнова и Хи-квадрат.

'

6. Для применения теста Колмогорова-Смирнова в окне (Описательные статистики) ставим флажок в поле (Односто­ ронний критерий нормальности Колмогорова-Смирнова с поправкой Лильефорса). Это модифицированный вариант критерия Колмогорова-Смирнова, применяемый в ситуа­

ции, когда среднее и дисперсия заранее неизвестны, "то мы

и И,меем по условию задачи. Построив rlo;lcтorpaMMY, видим

результаты: критерий равен 0,076, причем данный резуль­

тат незначим (р> 0,20). Следовательно, согласно и этому

тесту эмпирическое распределение не отличается от нор­

мального.

7.Вариант использования теста Хи-квадрат:

Запустим модуль (Непараметрические ,статиcrики и

подгонка распределения) и в разделе его стартового

окна (Непрерывное расrlределение) выберем (Нор­

мальное).

В поле (Переменные) зададим переменную Vor1.

Поскольку эдесь же можно выполнить расчетtal и по

тесту Колмогорова-Смирнова, ставим флажок, оп­

ределяющий характер рассматриваемого распреде­

ления, в поле (Непрерывное).

Глава 4. Приемы описательной статистики

1I

После выполнения анализа появляется таблица с ре­

зультатами: критерий Колмогорова-Смирнова, как и ранее, равен 0,076 с р = ns; критерий Хи-квадрат

равен 5,093 при р = 0,532.

Итак, в соответствии с теоретическими положениями о

проверке гипотезы на нормальность из полученных резуль­

татов можно обоснованно заключить, что альтернативная

гипотеза отвергается. Данные согласованы с гипотезой нор­

мальности.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

• • • • • • •

• •

• •

• •

• •

• •

• •

•••

Упражнение 4.

• •

• •

• •

• •

• •

• •

• • • •

Проверка на HopMallbHoCТb (случай под"rверждения

нормальности дпя большой выборки, пакет SPSS).

Условия и установки те же, что и в предыдущей задаче SPSS. Введем данные в первую колонку, назвав перемен­

ную Уаг1. Выполним ripOBepKY на нормальность всеми тре­

мя рассмотренными способами.

3.Визуальная оценка: выберем команды: (Статистики)

-(Подытожить) - (Частоты). Затем зададим переменную

Уаг1 и, нажав на кнопку (Статистики), поставим флажки- в

поля (Асимметрия) и (Эксцесс), объединяя проверку первым и вторым способом (с помощью оценок асимметрии и экс­

цесса):

Нажав на кнопку (Диаграммы), (Тип диаграммы), вы­ берем (Гистограмма).и поставим флажок в поле (С нормальной кривой);

выполнив анализ, в окне (Просмотр результатов)

убеждаемся в СОВllадении эмпирической и теорети­

ческой;

в таблице (Статистики) имеем: (Покаэатель асиммет­

рии) 0,229, его стандартная ошибка 0,254; (Покаэа­

тель эксцесса) 0,300, его ошибка 0,503. 'в итоге: дан­

ные согласованы с гипотезой нормальнocrи."· .~

4. Для третьего способа проверки (с помощью статисти­ ческих критериев) в главном меню пакета выберем: (Стати­

стики)

.1

Медицинская статистика

(Подытожить) - (Исследовать).

Нажмем на кнопку (Графики) и поставим флажок в поле

(Графики с проверкой нормальности).

После чего перейдем в окно (Просмотр результатов).

В таблице (Ilроверка нормальности) имеем: критерий Кол­

могорова-Смирнова равен 0,076 и имеет значимость р =0,200 с учетом поправки Лильефорса.

Мы вновь вышли на результат, когда достоверные раз­

личия эмпирического и нормального теоретического распре­

делений отсутствуют.

ОтВет: данные, полученные в пакете SPSS, оказались

такими же, как в пакете Statistica.

• • • • • • • • • • • • • • • • • • • • • • • • • • • • •

Упражнение5. • • • • • • • • · • • • • • • • • • • • • • •

Проверка на нормальность (случай опровержения нормальности для большой выборки), пакеты SPSS, Statistica.

УслоВие: решить предыдущую задачу с помощ.ью паке­

та SPSS, Statistica, исключив из исходных данных 50% на­ блюдений.

Решение:

1. Как обычно, выдвигаем альтернативные гипотезы.

1. Применив пакет Statistica, повторив шаги 2-7 из

решения предыдущей задачи, получим следующие резуль­

таты:

(Показатель асимметрии) - О,142, его ошибка равна

0,309;

(Показатель эксцесса) -1,154, его ошибка 0,608;

критерий Колмогорова-Смирнова k = О,166, оценка

ее значимости с поправкой Лильефорса - р < 0,000;

критерий Хи-квадрат - 30,870 при р =0,000.

з. Применив для проверки пакет SPSS и повторив шаги

. ...

из решения предыдущеи задачи, получим следующие ре-

зультаты:

оценки 110казатеnейасимметрии и эксцесса, а также

их ошибок практически такие же, как и в пакете

Statistica;

Глава 4. Приемы описательной статистики

17

критерий Колмогорова-Смирнова k = 0,166, оценка

еезначимости с поправкой Лильефорса при р =0,000. ОтВет: результаты проверки показывают, что эмпири­

ческие данные не согласованы с гипотезой нормальности.

• • • • • • • • • • • • • • • • • • • • • • • • • • • •

Упражнение 6. •.• • • • • • • • • • • • • • • • • • • • • •

Проверка на нормальность (случай подтверждения

нормальности для малой выборки, SPSS, Statistica.

УслоВие: найти, соответствуют ли полученные эмпири­

ческие данные моторной плотности учебных занятий нор­

мальному закону распределения.

Nt

1

2

3

4

5

6

7

8

9

10

 

 

 

 

 

 

 

 

 

 

 

%

60

75

40

55

68

70

80

40

ЗА

50

Решение: Выборка имеет малый объем (л = 10), в этой

ситуации может помочь только критерий UJапиро-Уилкса.

Все остальные операции аналогичны решениям предыдущих

задач.

Выдвигаем гипотезы альтернативные гипотезы:

1. ЗаllУСТИМ пакет Statistica и, выполнив 3-4-й этапы 11ре­

дыдущег·о алгоритма рещения, получим:

Визуализация показывает близость распределения к

нормальному.

дсимметрия, эксцесс, их ошибки: As = -0,203; mAs =

=0,687; E.r = -1,192;

тЕх= 7,334. Порядок ошибок и покаэателей одина­

ков, поэтому причины для' отклонения нулевой rHll0-

тезы нет.

3. Посмотрим, что даст использование критериев согла­ сия раСllределений:

В окне (Описательная статистика) модуля (Основные

статистики и таблицы) установим флажок в поле (Кри­

терий Шаllиро-Уилкса).

Получаем гистограмму, в ее окне значение статисти­

ки критерия W =0,967 при Р < 0,783. Это подтверж-

18

Медицинская· статистика

дает гипотезу нормальности, т. е. альтернативная ги­

потеза отклоняется.

4. Проделаем те же операции в условиях использования

пакета SPSS, выполнив шаги 2 и 3 из решения предыдущей задачи. В итоге получим:

1) Визуально подтвердить нормальность распределения трудно, в силу того, что графика пакета весьма сла­

бая.

2)Оценки показателей асимметрии, эксцесса и их оши­ бок совпадают с расчетами по пакету Statistica.

~. Критерий W-Шапиро-Уилкса 0,961 при р = 0,769.

И хотя оценка значимости несколько отличается от по­

лученной в пакете Statistica, нулевая гипотеза подтвержда­

ется.

• • • • • • • • • • • • • • • • • • • • • • • • • • • • •

Упражнение 7. • • • • • • • • • • • • • • • • • • • • • • •

Проверка на нормальность (опровержение гипотезы

нормальноаи для малой выборки, пакеты SPSS и Statistica).

УслоВие: проверить, соответствует ли нормальному за­

кону распределения процент точных остановок стрелки I'РИ­

бора при оценке реакции на движущийся объект (РДО) у

молодых (18-19 лет) сборщиц изделий из мелких деталей:

NI

1

2

3

4

5

6

7

8

9

10

11

12

 

 

 

 

 

 

 

 

 

 

 

 

 

%

90

50

90

90

91

84

91

94

91

85

92

90

 

 

 

 

 

 

 

 

 

 

 

 

 

Решение: алгоритм аналогичен прежним задачам. 1. В пакете Statistica получим:

Визуально видны существенные отличия от нормаль­

ной кривой.

Асимметрия, эксцесс, их ошибки:

As =-3,145; mAs- 0,637; Ех = 10,340; 1,232.

Критерий W-Шапиро-Уилкса 0,479, р < 0,000, 2. То же самое в пакете SPSS:

Визуально существенные отличия от нормальной кри­ вой.