5 курс / ОЗИЗО Общественное здоровье и здравоохранение / Медицинская_статистика_Жижин_К_С_
.pdfГлава 4
ПРИЕМЫ ОПИСАТЕЛЬНОЙ
СТАТИСТИКИ
Это первый достаточно простой, однако самый ответ
ственный этап статистического анализа эмпирических
данных. И начинается работа, как вы понимаете, с про
верки полученных данных на «нормальность•.
И это не догма: от данной процедуры зависят коррект
ность. и однозначность выводов практически всех и глав. -
ным образом сложных, многомерных методов анализа данных (например, дискриминантного или факторного ана лиза, которые будут рассмотрены ниже).
Традиционно используются:
•дескриптивная статистика и визуализация,
•критерии согласия распределений.
Дескриптивныеметоды дают обобщенное описание как эмпирической выборки, так и генеральной совокупности:
среднее арифметическое, минимум, максимум, мода, ме
диана, дисперсия, стандартное отклонение, асимметрия,
эксцесс и др.
ВизуалЬflЫй .метод (гистограмма, линейные графики
эмпирического распределения) реализован во всех попу
лярных статистических пакетах, он помогает сопоставить
опытные данные с теоретической кривой нормального
распределения.
10 |
МедицинскаR статистика |
Оценки показателей асимметрии и эксцесса сопряже
ны с одновременным получением их стандартных ошибок.
Асимметрия (Skewness), коэффициент скошенности
эмпирического распределения частот, - отклонение впра
во или влево относительно максимальной ординаты:
t(x; _~)3
k .:... ",-'=-,-1---
n'йЗ •
Для симметричных распределений показатель асим
метрии равен нулю. Отрицательный показатель асиммет
рии означает, что кривая распределения от теоретической
симметричной кривой распределения скошена влево, по ложительный - вправо..
Стандартная ошибка асимметрии (Standard error of Skewness) - отклонение показателя асимметрии от нуля:
тм=~~:3'
Показатель эксцесса (Kurtosis), или коэффициент ос
тровершинности выборочной совокупности, рассчитыва
ется так:
n
I/Xi _х)4
Ех= ;=1 |
4 -3. |
n·а
Стандартная ошибка эксцесса (Standard error of Kur-
tosis):
тЕх =2mAt=2ш--;6 . n+3
Для нормального распределения показатели асиммет
рии и эксцесса равны нулю: As = Ех = О.
Для проверки на НОРМщ:Iьность применяют оценки
выборочных коэффициентов асимметрии и эксцесса:
Глава 4. Приемы описатепьной статистики |
11 |
•распределение считается симметричным в случае
IAsI<O,I, асимметричным, если IAsI>0,5;
•распределение близко к нормальному, если IExIs; 0,1 ,
и значительно отклоняется от него, если IExI >0,5.
При мечан ие. Распределение считается близким к"
нормальному, если значения асимметрии и эксцесса
имеlOТ тот же порядок, что и их стандартные ошибки. .)
МЕТОДЫ, ОСНОВАННЫЕ НА КРИТЕРИЯХ СОГЛАСИЯ
РАСПРЕДЕЛЕНИЙ
Для проверки на нормальность распределения наибо
лее часто применяют следующие статистические критерии:
•~-квадрат;
•Омега-квадрат, или тест Крамера-Мизеса, Смир-
нова-Крамера-Мизеса;
•Тест Колмогорова-Смирнова;
•W-тест Шапиро-Уилкса.
Сущность этих критериев в едином подходе к провер
ке гипотезы нормальности:
а) рассчитывается уровень значимости р, соответству
ющий полученному значению статистики критерия;
б) если р > 0,05, то нулевая гипотеза принимается, а
альтернативная - отклоняется.
В таких случаях иногда выводится сообщение р = ns
(незначим);
в) если р < 0,05, то гипотеза о нормальности распре
деления отклоняется, соответственно принимается
альтернативная.
В таких случаях наиболее подходит критерий Хи-квад
рат:
2 |
= ~(f:Мnupuч.- f~)2 |
|
|
'Хэмnupuч. |
L..J |
.(; |
, |
m=l Jm
_2 |
Медицинская статистика |
где k - количество разрядов признака (интервалов, на ко
торые разбивают вариационный ряд; i - порядковый но-
мер разряда признака; f:Мnuрuч. - эмпирическая ~aCTOTa по
i-MY разряду признака; f~ - теоретическая частота по ;-му
разРЯДУ признака.
Критерии согласия распределений имеют существен-
ные ограничения по объему выборки:
• для критерия Хи-квадрат - n>ЗО ;
• для критерия Колмогорова-Смирнова - n > 50 ;
• для критерия Омега-квадрат - n > 50.
Если эти условия не выполнены, следует применять критерий Шапиро-Уилкса, предназначенный для выбо рок с численностью от 3 до 50 наблюдений.
Рассмотрим задачи, иллюстрирующие применение раз
личных методов проверки распределения на нормаль
ность.
Упражнение 3. • • • • • • • • • • • • • • • • • • • • • • •
Проверка на нормальность (случай подтверждения
нормальности для большой выборки, пакет Statistica).
Дано: В плане комплексной оценки уровняработоспо
собности предстояло проверить нормальность распределе
ния показателей уровня распределения внимания по тесту
Шульте-Платонова у студентов ДО начала работы.
Алгоритмрешения:
1.Выдвигаем статистические гипотезы:
•Нулевую - об отсутствии отличий.
•дльтернативную - о наличии отличий.
2.Запустим и его модуль (Основные статистики и табли цы) и введем данные в столбец, соответствующий перемен
ной Уаr1.
З. Выполним проверку на нормальность способами, рас
смотре~ными выше.
Глава 4. Приемы описатеnьной статистики |
|
|
|
" |
||||||
|
|
|
|
|
|
|
|
|
||
Nt |
Сек. |
NI |
Сек. |
Nt |
Сек. |
Nt |
Сек. |
Nt |
Сек. |
|
|
|
|
|
|
|
|
|
|
|
|
1 |
46 |
19 |
55 |
37 |
57 |
55 |
56 |
73 |
39 |
|
2 |
59 |
20 |
62 |
38 |
58 |
56 |
66 |
74 |
53 |
|
3 |
49 |
21 |
58 |
39 |
58 |
57 |
54 |
75 |
- 63 |
|
4 |
49 |
22 |
45 |
40 |
48 |
58 |
55 |
76 |
54 |
|
5 |
50 |
23 |
45 |
41 |
55 |
59 |
51 |
77 |
64 |
|
6 |
50 |
24 |
55 |
42 |
59 |
6Q |
53 |
78 |
54 |
|
7 |
51 |
25 |
55 |
43 |
59 |
61 |
45 |
79 |
44 |
|
8 |
51 |
26 |
45 |
44 |
56 |
62 |
50 |
80 |
45 |
|
9 |
33 |
27 |
56 |
45 |
49 |
63 |
53 |
81 |
55 |
|
10 |
44 |
28 |
56 |
46 |
59 |
64 |
49 |
82 |
55 |
|
11 |
55 |
29 |
66 |
47 |
66 |
65 |
47 |
83 |
55 |
|
12 |
55 |
30 |
56 |
48 |
67 |
66 |
44 |
84 |
66 |
|
13 |
43 |
31 |
47 |
49 |
63 |
67 |
60 |
85 |
66 |
|
14 |
44 |
32 |
57 |
50 |
46 |
68 |
62 |
86 |
56 |
|
15 |
55 |
33 |
57 |
51 |
44 |
69 |
67 |
87 |
57 |
|
16 |
55 |
34 |
66 |
52 |
30 |
70 |
66 |
88 |
57 |
|
17 |
45 |
35 |
67 |
53 |
30 |
71 |
65 |
89 |
37 |
|
18 |
45 |
36 |
57 |
- 54 |
30 |
72 |
55 |
90 |
39 |
|
|
|
|
|
|
|
|
|
|
|
Оценим выборочную совокупность 8ИЗУально по данным
гистограммы:
•В стартовом окне модуля (Основные статистики и таб
лицы) выберем команду (Описательные статистики).
•В поле (Переменные) зададим переменную Уаг1, обо
значающую время в секундах,. затраченное индиви
дом на поиск чисел и цифр (от 1 до 25) ПО стандарт
ной таблице теста Шульте-Платонова.
•Выбрав команду (Гистогр,?мма), строим гистограмму
эмпирического ряда, теоретическая,кривая нормаль-
ного распределения показывает их достаточное со
ответствие.
4. Применим второй способ проверки на нормальность
по оценке коэффициентов асимметрии и эксцесса:
•В окне (Описательные статистики) выберем (Другие
статистики) и установим флажки в поля (Асимметрия),
2. К. С. ЖИJl(ИН
14 |
Медицинская статистика |
(Эксцесс), (Стандартная ошибка асимметрии) и (Стан
дартная ошибка эксцесса).
•После нажатия ОК появляется таблица срезультата
ми анализа: показатель асимметрии (-0,229) и его
ошибка (0,254); показатель эксцесса (-О,300) и его
ошибка (0,503).
Как видим, оценки асимметрии и эксцесса имеют тот
же порядок, что и ИХ ошибки, значит, полученные ненуле
вые значения оценок асимметрии и эксцесса статистичес
ки незначимы и нет оснований для отклонеНИ$l нулевой ги
потезы, т. е. данные распределены по нормальному закон
Гаусса.
5. Третий способ проверки на нормальность. Значитель ный объем выборки позволяет применить критерии Колмо-
горова-Смирнова и Хи-квадрат. |
' |
6. Для применения теста Колмогорова-Смирнова в окне (Описательные статистики) ставим флажок в поле (Односто ронний критерий нормальности Колмогорова-Смирнова с поправкой Лильефорса). Это модифицированный вариант критерия Колмогорова-Смирнова, применяемый в ситуа
ции, когда среднее и дисперсия заранее неизвестны, "то мы
и И,меем по условию задачи. Построив rlo;lcтorpaMMY, видим
результаты: критерий равен 0,076, причем данный резуль
тат незначим (р> 0,20). Следовательно, согласно и этому
тесту эмпирическое распределение не отличается от нор
мального.
7.Вариант использования теста Хи-квадрат:
•Запустим модуль (Непараметрические ,статиcrики и
подгонка распределения) и в разделе его стартового
окна (Непрерывное расrlределение) выберем (Нор
мальное).
•В поле (Переменные) зададим переменную Vor1.
•Поскольку эдесь же можно выполнить расчетtal и по
тесту Колмогорова-Смирнова, ставим флажок, оп
ределяющий характер рассматриваемого распреде
ления, в поле (Непрерывное).
Глава 4. Приемы описательной статистики |
1I |
•После выполнения анализа появляется таблица с ре
зультатами: критерий Колмогорова-Смирнова, как и ранее, равен 0,076 с р = ns; критерий Хи-квадрат
равен 5,093 при р = 0,532.
Итак, в соответствии с теоретическими положениями о
проверке гипотезы на нормальность из полученных резуль
татов можно обоснованно заключить, что альтернативная
гипотеза отвергается. Данные согласованы с гипотезой нор
мальности. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
• • • • • • • • • • • |
• |
• |
• |
• • |
• |
• |
• • |
• |
• • |
• • |
• • |
• |
• • |
• ••• |
Упражнение 4. |
• |
• |
• |
• • |
• |
• |
• • |
• |
• • |
• • |
• • |
• |
• • |
• • • • |
Проверка на HopMallbHoCТb (случай под"rверждения
нормальности дпя большой выборки, пакет SPSS).
Условия и установки те же, что и в предыдущей задаче SPSS. Введем данные в первую колонку, назвав перемен
ную Уаг1. Выполним ripOBepKY на нормальность всеми тре
мя рассмотренными способами.
3.Визуальная оценка: выберем команды: (Статистики)
-(Подытожить) - (Частоты). Затем зададим переменную
Уаг1 и, нажав на кнопку (Статистики), поставим флажки- в
поля (Асимметрия) и (Эксцесс), объединяя проверку первым и вторым способом (с помощью оценок асимметрии и экс
цесса):
•Нажав на кнопку (Диаграммы), (Тип диаграммы), вы берем (Гистограмма).и поставим флажок в поле (С нормальной кривой);
•выполнив анализ, в окне (Просмотр результатов)
убеждаемся в СОВllадении эмпирической и теорети
ческой;
•в таблице (Статистики) имеем: (Покаэатель асиммет
рии) 0,229, его стандартная ошибка 0,254; (Покаэа
тель эксцесса) 0,300, его ошибка 0,503. 'в итоге: дан
ные согласованы с гипотезой нормальнocrи."· .~
4. Для третьего способа проверки (с помощью статисти ческих критериев) в главном меню пакета выберем: (Стати
стики)
.1 |
Медицинская статистика |
•(Подытожить) - (Исследовать).
Нажмем на кнопку (Графики) и поставим флажок в поле
(Графики с проверкой нормальности).
После чего перейдем в окно (Просмотр результатов).
В таблице (Ilроверка нормальности) имеем: критерий Кол
могорова-Смирнова равен 0,076 и имеет значимость р =0,200 с учетом поправки Лильефорса.
Мы вновь вышли на результат, когда достоверные раз
личия эмпирического и нормального теоретического распре
делений отсутствуют.
ОтВет: данные, полученные в пакете SPSS, оказались
такими же, как в пакете Statistica.
• • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • •
Упражнение5. • • • • • • • • · • • • • • • • • • • • • • •
Проверка на нормальность (случай опровержения нормальности для большой выборки), пакеты SPSS, Statistica.
УслоВие: решить предыдущую задачу с помощ.ью паке
та SPSS, Statistica, исключив из исходных данных 50% на блюдений.
Решение:
1. Как обычно, выдвигаем альтернативные гипотезы.
1. Применив пакет Statistica, повторив шаги 2-7 из
решения предыдущей задачи, получим следующие резуль
таты:
•(Показатель асимметрии) - О,142, его ошибка равна
0,309;
•(Показатель эксцесса) -1,154, его ошибка 0,608;
•критерий Колмогорова-Смирнова k = О,166, оценка
ее значимости с поправкой Лильефорса - р < 0,000;
• критерий Хи-квадрат - 30,870 при р =0,000.
з. Применив для проверки пакет SPSS и повторив шаги
. ...
из решения предыдущеи задачи, получим следующие ре-
зультаты:
•оценки 110казатеnейасимметрии и эксцесса, а также
их ошибок практически такие же, как и в пакете
Statistica;
Глава 4. Приемы описательной статистики |
17 |
•критерий Колмогорова-Смирнова k = 0,166, оценка
еезначимости с поправкой Лильефорса при р =0,000. ОтВет: результаты проверки показывают, что эмпири
ческие данные не согласованы с гипотезой нормальности.
• • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • •
Упражнение 6. •.• • • • • • • • • • • • • • • • • • • • • •
Проверка на нормальность (случай подтверждения
нормальности для малой выборки, SPSS, Statistica.
УслоВие: найти, соответствуют ли полученные эмпири
ческие данные моторной плотности учебных занятий нор
мальному закону распределения.
Nt |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|
|
|
|
|
|
|
|
|
|
|
% |
60 |
75 |
40 |
55 |
68 |
70 |
80 |
40 |
ЗА |
50 |
Решение: Выборка имеет малый объем (л = 10), в этой
ситуации может помочь только критерий UJапиро-Уилкса.
Все остальные операции аналогичны решениям предыдущих
задач.
Выдвигаем гипотезы альтернативные гипотезы:
1. ЗаllУСТИМ пакет Statistica и, выполнив 3-4-й этапы 11ре
дыдущег·о алгоритма рещения, получим:
•Визуализация показывает близость распределения к
нормальному.
•дсимметрия, эксцесс, их ошибки: As = -0,203; mAs =
=0,687; E.r = -1,192;
•тЕх= 7,334. Порядок ошибок и покаэателей одина
ков, поэтому причины для' отклонения нулевой rHll0-
тезы нет.
3. Посмотрим, что даст использование критериев согла сия раСllределений:
•В окне (Описательная статистика) модуля (Основные
статистики и таблицы) установим флажок в поле (Кри
терий Шаllиро-Уилкса).
•Получаем гистограмму, в ее окне значение статисти
ки критерия W =0,967 при Р < 0,783. Это подтверж-
18 |
Медицинская· статистика |
дает гипотезу нормальности, т. е. альтернативная ги
потеза отклоняется.
4. Проделаем те же операции в условиях использования
пакета SPSS, выполнив шаги 2 и 3 из решения предыдущей задачи. В итоге получим:
1) Визуально подтвердить нормальность распределения трудно, в силу того, что графика пакета весьма сла
бая.
2)Оценки показателей асимметрии, эксцесса и их оши бок совпадают с расчетами по пакету Statistica.
~. Критерий W-Шапиро-Уилкса 0,961 при р = 0,769.
И хотя оценка значимости несколько отличается от по
лученной в пакете Statistica, нулевая гипотеза подтвержда
ется.
• • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • •
Упражнение 7. • • • • • • • • • • • • • • • • • • • • • • •
Проверка на нормальность (опровержение гипотезы
нормальноаи для малой выборки, пакеты SPSS и Statistica).
УслоВие: проверить, соответствует ли нормальному за
кону распределения процент точных остановок стрелки I'РИ
бора при оценке реакции на движущийся объект (РДО) у
молодых (18-19 лет) сборщиц изделий из мелких деталей:
NI |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
|
|
|
|
|
|
|
|
|
|
|
|
|
% |
90 |
50 |
90 |
90 |
91 |
84 |
91 |
94 |
91 |
85 |
92 |
90 |
|
|
|
|
|
|
|
|
|
|
|
|
|
Решение: алгоритм аналогичен прежним задачам. 1. В пакете Statistica получим:
•Визуально видны существенные отличия от нормаль
ной кривой.
•Асимметрия, эксцесс, их ошибки:
As =-3,145; mAs- 0,637; Ех = 10,340; mи 1,232.
•Критерий W-Шапиро-Уилкса 0,479, р < 0,000, 2. То же самое в пакете SPSS:
•Визуально существенные отличия от нормальной кри вой.