Добавил:
kiopkiopkiop18@yandex.ru Вовсе не секретарь, но почту проверяю Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

5 курс / ОЗИЗО Общественное здоровье и здравоохранение / Статистический_анализ_данных_в_медицинских_исследованиях_в_2_ч_Красько

.pdf
Скачиваний:
3
Добавлен:
24.03.2024
Размер:
5.96 Mб
Скачать

Таблица 4–2. Цели RCT и гипотезы

Цель RCT

 

 

Нулевая

 

 

 

 

 

 

 

 

 

 

Альтернатив

Пояснение

 

 

 

 

 

 

 

 

 

 

 

 

 

гипотеза H0

 

 

 

 

ная гипотеза

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

HA

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Доказательство

 

H0 :ε 0

 

 

 

 

 

 

 

 

 

 

HA :ε 0

 

 

Препарат отказывает воздействие

различий

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(статистическое

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

различие)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

доказательство

 

H0 :ε δ ,δ 0

 

 

HA :ε δ ,δ 0

Воздействие

 

 

 

не изменяет

предыдущее

полноценности

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

состояние, если снижает, то не более чем на

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

δ ,δ 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

доказательство

 

H0 :

 

ε

 

δ

 

 

 

 

 

 

 

 

 

 

HA :

 

ε

 

δ

 

 

Воздействие

 

 

 

не

лучше

и

не хуже

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

эквивалентности

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

предыдущего

 

 

 

 

 

состояния.

Различия

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

клинически несущественны и не превышают

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

δ .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

доказательство

 

H0 :ε δ ,δ 0

 

 

HA :ε δ ,δ 0

Воздействие

 

 

 

 

дает

эффект.

Различия

превосходства

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

клинически

существенны

и

превышают

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

δ ,δ 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 4–3. Расчет размеров выборок в одновыборочном дизайне RTC

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Цель RCT

 

Оценка

 

 

 

 

эффекта

по

Оценка

 

 

 

 

 

 

 

эффекта

 

по

 

 

 

пропорции/доле

 

 

 

 

 

 

количественной переменной

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Доказательство

 

z

 

 

 

 

z1 β

2

 

 

 

 

 

 

 

 

z

 

z1 β

 

2

 

 

 

 

различий

 

 

 

 

α

 

 

 

 

 

 

 

 

 

 

α

 

 

 

 

 

 

 

n

 

 

 

 

1

2

 

 

 

 

 

 

 

 

 

p 1 p

 

n

 

 

 

 

1 2

 

 

 

 

 

 

 

s2

 

 

 

(статистическое

 

 

 

 

 

 

 

 

ε

 

 

 

 

 

 

 

 

 

 

 

 

ε

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

различие)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

доказательство

 

z

 

 

 

 

z

 

 

 

 

 

2

p 1 p

 

 

z

 

z

 

 

 

 

2

 

 

 

 

 

 

 

 

1 α

1 β

 

 

 

 

 

1 α

1 β

 

 

 

 

 

 

 

 

полноценности

n

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

s2

,δ 0

 

 

 

 

 

 

 

 

 

ε

δ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ε

δ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

доказательство

 

z

 

 

 

 

z

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

z

 

z

 

 

 

 

 

 

2

 

 

 

 

эквивалентности

 

1 α

1 β

2

 

 

 

 

 

 

 

 

 

 

1 α

1 β

2

 

 

2

 

 

 

 

 

 

 

 

 

 

 

p 1 p

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

s

 

 

 

 

 

 

 

 

 

δ

 

ε

 

 

 

 

 

 

 

δ

 

ε

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

доказательство

 

z

 

 

 

 

z

 

 

 

 

 

2

p 1 p

 

 

z

 

z

 

 

 

 

2

 

 

 

 

 

 

 

 

 

1 α

1 β

 

 

 

 

 

 

1 α

1 β

 

 

 

 

 

 

 

 

превосходства

n

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

s2 ,δ 0

 

 

 

 

 

 

 

 

 

ε δ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ε

δ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

z1 α 2

,z1 α ,z1 β

 

 

значение

 

стандартного нормального

распределения соответствющего

уровня. Для α 0,05 z1 α

 

 

1,64 ,

z1 α 2

1,96; для β 0,2(уровень мощности 80%)

z1 β

0,84 .

n – размер каждой группы, округляется до большего целого значения.

Следует заметить, что при доказательстве эквивалентности и полноценности (как односторонней эквивалентности) разница ε может быть принята как ε 0 и формулы упрощаются, в расчет принимается только δ – клинически допустимый запас.

Насчет комбинации ε и δ в формулах всегда возникает много вопросов, поэтому ориентироваться необходимо на смысл: если мы говорим о доказательстве полноценности, то к разности ε μ μ0 (ε π π0 ) добавляется некоторая величина

клинически допустимого запаса δ , что увеличивает знаменатель (и уменьшает размер выборки), чтобы продемострировать что новый препарат не дает клинически значимого снижения по сравнению с референтным; если говорим о

31

превосходстве, т.е. ε достаточное большое, то отнимаем величину клинически допустимого запаса, что увеличивает размер выборки, но дает нам уверенность говорить о том, что препарат действительно превосходит референтный с учетом клинически допустимого запаса (клинический эффект). При доказательстве эквивалентности различие ε должно быть меньше величины клинически допустимого запаса в большую и меньшую стороны, т.е. находится в приемлемом интервале клинически допустимого запаса, и мы уменьшаем клинически допустимый запас δ на абсолютную величину различий ε , и в этом случае также увеличиваем размер выборки (по сравнению с доказательством полноценности), но это дает нам уверенность говорить о том, что препарат попадает в интервал клинически допустимомго запаса относительно референтного (см. раздел 11.1.4).

Двухвыборочный параллельный дизайн

Такой дизайн предполагает рандомизацию каждого испытуемого в одну из групп – нового лечения или плацебо /активного контроля. Каждый испытуемый имеет одно измерение результата.

Различия в истинных средних или пропорциях соответственно равно

ε μ2 μ1 , ε π2 π1 .

Выборочная дисперсия для количественной переменной рассчитывется как объединенная по двум группам:

 

 

 

 

 

2 ni

 

 

 

 

 

 

 

 

 

ni

 

 

 

 

 

 

 

s2

 

1

 

xij

 

i ,

 

 

 

 

 

 

i

1

xij

 

 

 

 

 

 

 

x

где

x

-

оценка

среднего

в

n

n

2

n

 

i 1 j 1

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

1

2

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

соответствующей группе.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 4–4. Цели RCT и гипотезы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Цель RCT

 

 

 

Нулевая

Альтернатив

 

Пояснение

 

 

 

 

 

 

 

 

 

гипотеза H0

ная гипотеза

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

HA

 

 

 

 

 

 

 

 

 

 

 

 

Доказательство

 

H0 :ε 0

HA :ε 0

 

 

 

Различия между новым лечением и

 

различий

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

плацебо/активным контролем

 

 

(статистическое

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

различие)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

доказательство

 

 

H0 :ε δ ,δ 0

HA :ε δ ,δ 0

 

Новое лечение не хуже активного

 

полноценности

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

контроля, по меньшей мере, дает такой же

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

эффект

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

доказательство

 

 

H0 :

 

ε

 

δ

HA :

 

ε

 

δ

 

 

 

Новое

лечение

не

лучше

и не

хуже

 

 

 

 

 

 

 

 

 

 

эквивалентности

 

 

 

 

 

 

 

 

активного контроля, они одинаково

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

эффективны.

Различия

клинически

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

несущественны.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

доказательство

 

 

H0 :ε δ ,δ 0

HA :ε δ ,δ 0

 

Новое лечение более эффективно, чем

 

превосходства

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

контрольное.

Различия

клинически

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

существенны

 

 

 

 

 

Таблица 4–5. Расчет размеров выборок а параллельном дизайне RTC 1

 

 

 

 

Цель RCT

 

 

 

Оценка эффекта по пропорции/доле

 

Оценка

эффекта

по

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

количественной

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

переменной

 

 

 

1 Формулы приведены для одинаковых размеров двух групп.

32

Доказательство

z

 

z

 

 

 

 

 

2

 

 

 

 

z

z

 

 

 

 

2

 

 

1 β

 

 

 

 

 

1 β

 

различий

n

 

 

 

 

1 α

2

 

 

 

p 1 p p 1 p

n 2

 

1 α

2

 

 

 

s2

(статистическое

 

 

 

 

 

ε

 

 

 

 

 

 

 

ε

 

 

 

 

 

 

 

 

 

 

 

 

1

 

1

2

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

различие)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

доказательство

z

 

z

 

 

 

 

2

 

 

 

 

 

z

 

z

 

 

 

 

2

 

 

1 α

 

 

 

 

p

1 p

p 1 p

1 α

1 β

 

 

полноценности

n

 

 

 

1 β

 

 

n 2

 

 

 

 

 

 

 

s2 ,δ 0

 

 

ε δ

 

 

 

 

 

 

1

1

 

2

2

 

ε

δ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

доказательство

z1 α

z

 

 

 

 

 

 

 

2

 

 

 

 

z1 α

z1

 

 

 

2

эквивалентности

1

β

 

 

 

 

 

 

 

 

β

 

 

 

 

 

n

 

 

 

 

 

 

2

 

 

p 1 p

p 1 p

n 2

 

 

 

 

 

 

2

 

s2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

δ

ε

 

 

 

 

 

1

 

1

2

2

 

δ

ε

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

доказательство

z

 

z

 

 

 

 

 

2

p 1 p

p 1 p

z

 

z

 

 

 

 

2

 

 

1 α

1 β

 

 

1 α

1 β

 

 

s2 ,δ 0

превосходства

n

 

 

 

 

 

 

n 2

 

 

 

 

 

 

 

 

ε δ

 

 

 

 

 

 

1

1

 

2

2

 

ε

δ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Двухвыборочный перекрестный дизайн

Этот дизайн широко распространен в RTC и носит название2 2 crossover trial. Каждый испытуемый получает сначала одно лечение, потом следует период вымывания (wash-out period), затем другое лечение. Причем испытуемые рандомизирутся на последовательность приема препарата. Например, есть два препарата A и В. Соответственно, есть два варианта последовательностей AB и BA.

Расчет оценки дисперсии достаточно сложен, и находится за рамками данного пособия. Формулы приведены в Таблице 4–6.

Таблица 4–6. Расчет размеров выборок в двухвыборочном перекрестном дизайне RTC1

Цель RCT

Оценка

 

 

 

 

 

эффекта

по

Оценка

 

 

 

эффекта

по

 

 

пропорции/доле

 

 

 

 

 

количественной переменной

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Доказательство

 

1

 

 

z

 

z

 

 

 

 

 

2

 

 

 

1

 

z

 

z

 

 

 

 

 

 

2

 

 

различий

 

 

 

 

1 α

1 β

 

 

 

 

 

1 α

1 β

 

 

 

 

 

n

 

 

 

2

 

 

 

s

2

 

n

 

 

2

 

 

 

 

s

2

 

(статистическое

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

ε

 

 

 

 

 

 

 

2

 

 

ε

 

 

 

 

 

 

 

 

различие)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

доказательство

 

1

 

 

z

 

z

 

 

 

 

 

2

 

 

 

 

1

 

z

 

z

 

 

 

 

 

2

 

 

 

 

 

 

 

 

1 α

1 β

 

 

 

s2

 

 

 

 

1 α

1 β

 

 

 

 

s2 ,δ 0

 

полноценности

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(не

худшей

 

2

 

 

 

ε δ

 

 

 

 

 

 

 

 

 

 

 

2

 

 

ε δ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

эффективности)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

доказательство

 

1

 

 

 

 

 

 

 

2

 

 

2

2

 

 

1

 

 

 

 

2

 

 

2

2

 

эквивалентности

 

 

 

 

 

z1 α

z1

β

 

 

 

 

 

 

 

 

 

 

 

 

z1 α

z1

β

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

s

 

 

 

 

2

 

 

 

δ

ε

 

 

 

 

 

 

2

 

δ

ε

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

доказательство

 

1

 

 

z

 

z

 

 

 

 

 

2

 

 

 

 

1

 

z

 

z

 

 

 

 

 

2

 

 

 

 

 

 

 

 

1 α

1 β

 

s2

 

 

 

 

1 α

1 β

 

 

 

s2 ,δ 0

 

превосходства

n

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

ε δ

 

 

 

 

 

 

 

 

 

 

2

 

 

ε δ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Также не приводятся формулы для других типов дизайна.

Если рассматривать другие исследования помимо RTC, то чаще всего возникает вопрос, достаточно ли набрано пациентов в группы для того, что

1 Формулы приведены для одинаковых размеров двух групп.

33

для бинарной переменной – задайте

доказать некоторые различия. В данном случае мы можем рассчитать объем выборки, который достаточен для доказательства статистического различия без δ – клинически допустимого запаса. Если не интересует мощность, опустите параметр с

индексом β . Не знаете дисперсии s2 максимум 0,25.

Например, нам надо установить при опросе, будет ли статистически значимо отличаться от случайного доля положительных ответов на некоторый вопрос. Случайный ответ предполагает 50/50, т.е. p0 0,5. Предполагаем, что p 0,7, т.е. 70%

респондентов ответят положительно.

Это одновыборочное исследование, формула

ε 0,7 0,5 0,2.

Мощность

исследования

не

z

 

α

z1 β 2

 

n

 

1

2

 

 

p 1 p .

 

 

 

ε

 

 

 

 

 

 

 

 

 

 

 

 

интересует.

Тогда

 

1,96 0 2

0,7 1 0,7 21,2. Округляя до большего целого, получим n 22. Если

n

 

 

0,2

 

 

 

1 β 0.8 , то нам понадобится

установим мощность исследования на уровне 80%

n 42 респондента.

Если исследователь не имеет информации о вариации и предполагаемой разнице в эффектах, то рассчитать требуемый размер выборки затруднительно. Часто информацию получают из пилотных исследований, из опубликованных результатов, из предварительных собственных результатов.

В статистических пакетах существуют модули, которые могут моделировать зависимости изменения требуемого размера выборки от наименьшего интересующего эффекта, уровня значимости, мощности. Однако первичную информацию задает исследователь.

4.5.Понятие надежности и валидности исследования

Расхождение между характеристиками выборки и популяции, из которой была сделана выборка, в целом оцениваются через ошибки. Различают два вида ошибок: случайную ошибку (random error) и систематическую ошибку (systematic error), возникающую вследствие нарушения правил отбора (или из-за смещений при отборе). При определении случайной ошибки предполагается, что ошибка регистрации данных (человеческий фактор) равна нулю. Систематическую ошибку часто называют ошибкой, вызванной смещением (bias). Общая ошибка складывается из случайной ошибки (вследствие случайных различий между элементами совокупности, включенными в выборку и не попавшими в нее) и из смещения (систематической ошибки), если оно существует. Систематическую ошибку исследователь должен устранять. Основные систематические ошибки свзяны с ошибками измерительных приборов (measurements error), ошибками формирования выборки (selection error), ошибками получения информации (information error).

Примеры:

- Весы постоянно завышают вес пациентов. Для этого такой инструмент измерения можно калибровать, градиуировать и т.п.

- В процессе наблюдений пациенты должны повторно приходить для обследования, однако некоторые из них не являются. В результате группа формируется только по "прилежным" пациентам, явившимся на повторый прием.

34

Что произошло с остальными – исследователь не знает. А ведь у них возможны осложнения лечения, неэфективность и пр.

- При опросе пациент вольно или невольно стремится ответить на вопрос о предыдущих событиях (состояниях) так, как ему удобно или приемлемо1.

Ремарка: Проверка гипотез в статистике строится на основании того, что существует только

случайная ошибка.

Оценка наблюдаемого среднего выборки

Распрделение наблюдений в выборке

Систематическая ошибка

Случайная

ошибка

Общая ошибка

Истинное значение

Наблюдаемое значение

Рис.4–1. Соотношение наблюдаемого значения, ошибок и истинного значения

Рассмотрим рис. 4–2. Если истинное значение лежит в центре мишени, то на рисунке слева измерения точные, случайная ошибка мала, но существует систематическая ошибка, и наши измерения смещены относительно истинного значения; на рисунке справа мы имеем ситуацию большой случайной ошибки без смещения (измерения не точные). Средний рисунок – наблюдения соответствуют истинным, случайная ошибка мала.

1 Everybody lies ( House MD ©).

35

Надежность

Надежность

 

 

Валидность

Валидность

Рис.4–2. Надежность и валидность результатов измерений

Результаты называются валидными, если отражают истииное состояние предмета исследования, отсутствует систематическая ошибка. Результаты называются надежными, если они устойчивы, точны и имеют минимальную случайную ошибку.

Таким образом, для получения оценки истинного состояния проблемы, результаты должны быть как валидными, так и надежными.

Степень надёжности зависит от многих причин. Поэтому в исследовании важно выяснение негативных факторов, влияющих на точность измерений. Основные факторы: нестабильность диагностируемого свойства; несовершенство диагностических методик; меняющаяся ситуация обследования/наблюдения; колебания в функциональном состоянии пациента и др.

Валидность – более сложное понятие, истинного состояния проблемы исследователь может не знать. Как понять, что мы измеряем именно то, что хотим исследовать, что наши измерения и наблюдения служат цели исследования? Существует несколько подходов к валидации результатов исследований, содержательная валидность характеризует методы и способы исследования по степени соответствия предметной области; критериальная валидность (эмпирическая валидность) предполагает наличие внешнего критерия (теста), корреляция с которым определяет валидность новых результатов и др.

Сам по себе статистический анализ данных не отвечает за валидность и надежность результатов исследования, однако может провести оценку случайной ошибки, сравнить результаты известного исследования с вновь полученными и т.п.

При изучении взаимосвязи между переменными исследования и исходом, мы заинтересованы в выявлении факторов, которые могут изменить эффект влияния интересующих переменных на результат (эффект модификаторов). Мы также должны быть осведомлены о потенциальном смещении или скрытом влиянии в исследовании, так как они могут привести к искаженным результатам.

Существуют три основных понятия, которые нужно учитывать при проектировании дизайна и проведении исследования.

Смещение (Bias): Систематическая ошибка в дизайне исследования, в сборе данных и анализе, что приводит к ошибочной (смещенной) оценке истинного эффекта воздействия и результата.

Вмешательство (Confounding): Ситуация, в которой эффект или связь между воздействием и исходом искажен присутствием иной переменной. Положительное вмешательство появляется, когда наблюдаемая ассоциация смещается в сторону от нулевой, т.е. на самом деле эффекта от воздействия нет, а он определяется из-за

36

иной переменной. Отрицательное вмешательство – наблюдаемая ассоциация смещается в сторону отстутствия, но на самом деле эффект существует.

Модификация эффекта (Effect modification): в исследовании есть некоторый фактор (переменная), которая по-разному (положительно и отрицательно) изменяет изучаемый эффект. Например, влияние фактора риска на состояние болезни для одной группы может быть благоприятным, для другой группы неблагоприятным. В этом случае признак, по которому разделены группы, является модификатором эффекта.

Основные аспекты

Нулевая гипотеза чаще всего констатирует текущее состояние проблемы (проблема не изучена, следовательно, различий, трендов, разницы нет), и, опровергая ее, вы изучаете доказательства, которые говорят об обратном.

Мощность исследования (т.е. размер выборки) надо рассчитывать, опираясь на известные вам факты из литературы или собственных исследований. Если по всем переменным, которые включены в исследование, у вас нет материала, используйте хотя бы сведения о значениях факторов/показателей, по которым есть некоторые предварительные данные.

Систематическая ошибка может быть устранена соответствующим подбором дизайна и выполнением требований по дизайну, статистический критерий сам по себе такие ошибки “не видит”.

Исследование должно принимать во внимание вмешивающиеся переменные, которые могут исказить результаты.

37

5. Сбор данных

При сборе данных лучше всего использовать заранее разработанную форму (анкету) для записи данных. Это сэкономит время и снизит количество ошибок. Современные возможности компьютеров позволяют заносить данные в таблицы для их непосредственного анализа.

Несколько основных принципов формирования таблиц данных для последующего анализа.

Одна строка – один случай. В каждой строке у вас будут содержаться данные, относящиеся к одному наблюдению (исследуемому, пациенту). В колонках (столбцах) будут находиться факторы (переменные) исследования. Колонки должны быть именованы. Строки – иметь уникальный идентификатор. Повозможности избегайте записи исследуемых пациентов по фамилии. Это неэтично, как минимум.

Набор значений переменной (фактора) в вашей выборке – это столбец. Набор значений факторов, характеризующих каждый случай в выборке – это строка. Ячейка на пересечении столбца и строки – это точка данных.

При записи числовых данных, имеющих единицу измерения, все измерения должны быть записаны в одних и тех же единицах измерения. Например, рост. Недопустима запись 165 для одного исследуемого и 1,78 для другого. Поэтому лучше, чтобы наименование колонки содержало не только наименование фактора, но и единицу измерения (“Рост, см”).

Разделитель целой и дробной части числа в разных компьютерах может быть разным. Поэтому, по возможности, используйте цифровую часть клавиатуры для ввода числовых данных.

Для биноминальных переменных, а также некоторых категориальных в практике используются не цифры, а слова и выражения. Не все компьютерные программы анализа “понимают” текст в ячейке данных. Иногда используются коды, т.е запись слов и выражений числовыми кодами. Для этого создайте отдельный лист, где будут записаны выражения и их числовые коды. Числовые коды и числа – разные понятия, числовые коды нельзя складывать, перемножать, однако иногда они бывают упорядоченными, например, оценки состояния пациента. Если вы решили использовать слова, то для одного и того же состояния они должны быть одинаковы, например, если вы проставляете значение переменной пол: “мужской/женский”, то используйте только эти два слова, сокращения “муж”, “м”, “M” и прочие будут рассматриваться компьютером как различные состояния.

Примеры кодов:

Состояние

Баллы

 

 

Хорошее

5

 

 

Удовлетворительное

3

 

 

Неудовлетворительное

1

 

 

Пол

Код

 

 

Мужчина

1

 

 

Женщина

2

 

 

 

 

Курение

Код

 

 

Да

1

 

 

Нет

0

 

 

38

Ремарка: При кодировании бинарной переменной обычно “1” кодируют интересующее исследователя состояние. Отсутствие интересующего состояния кодируется как “0”.

Работа с датами. Если данные о датах вводятся в компьютер, то нужно использовать тот формат даты, который установлен на Вашем компьютере. Если необходимо рассчитать длительность периода между двумя датами, то правильнее будет ввести дату начала и дату конца наблюдений. Большинство программ, предназначенных для анализа данных, сами рассчитают длительность, в этом случае не будет ошибки, связанной с ручным расчетом периода.

В случае дизайна “matched pairs” исследования случай-контроль случаем является пара. Поэтому правильнее будет записывать в таблицу пары исследуемых.

Таблица 5–1. Пример записей парного исследования

Номер

Номер

Номер

Рост в группе

Рост в группе

пары

карты,

карты,

случай, см

контроль, см

 

группа

группа

 

 

 

случай

контроль

 

 

 

 

 

 

 

1

45/2001

56/2003

156

168

 

 

 

 

 

2

1923/2001

2299/2000

184

172

 

 

 

 

 

 

 

 

 

 

Есть данные, связанные с повторными визитами пациента к специалисту. Часто спрашивают, как правильно представлять такие данные. Есть два формата представления таких данных : “широкий” и “длинный”. Программы статистического анализа имеют возможность преобразовывать один формат в другой. Основное требование, на которое надо обратить внимание – это обязательная идентификация данных конкретного пациента. Также часто повторные измерения могут быть получиены при проведении лабораторных экспериментов. В этом случае важна идентификация образца (животного, пробы и пр.). Обработка таких повторных измерений имеет свои особенности (см. Разделы 21-22).

Таблица 5–2. Пример записей повторных измерений в “широком” формате

Номер

 

 

Визит 1

 

 

 

 

Визит 2

 

Визит 3

 

паци-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Дата

 

СОЭ

Гемо-

Дата

 

СОЭ

Гемо-

Дата

СОЭ

Гемо-

ента

 

 

 

 

визита

 

 

глобин

визита

 

 

 

глобин

визита

 

глобин

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

21.01.2015

 

9

 

142

15.03.2015

 

8

125

15.06.2015

12

137

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

22.01.2015

 

12

 

135

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 5–3. Пример записей повторных измерений в “длинном” формате

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Номер

 

Дата

 

СОЭ

 

Гемоглобин

 

 

 

 

 

 

 

пациента

 

визита

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

21.01.2015

 

9

 

142

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

22.01.2015

 

12

 

135

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

15.03.2015

 

8

 

125

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

15.06.2015

 

12

 

137

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

39

Округление данных. Данные каждого столбца, в котором фиксируется уровень некоторого фактора, должны быть записаны с одинаковой точностью, т.е. количество знаков после разделителя целой и дробной части числа должно быть одинаковым по всем столбцу. Если некоторый фактор измеряется прибором, то результат измерения округляется до того же десятичного разряда, которым оканчивается округленное значение абсолютной погрешности прибора.

Прежде чем приступить к анализу данных, необходимо убедится, что данные записаны верно. Самый простой способ – это проконтролировать минимальное и максимальное значение в столбце, количество пустых ячеек в столбцах. Однако ошибки ввода/записи могут быть менее заметны, поэтому нужно соблюдать аккуратность при вводе значений.

Кроме проверки на минимальное и максимальное значение, можно и нужно использовать и логические проверки. Например, если возраст исследуемого меньше, чем длительность хронического заболевания, то есть основания предполагать, что в данных ошибка. Если исследуемому пациенту 13 лет и у него есть дети, эти данные нуждаются в проверке и т.п. Все эти проверки помогут сократить ошибки, связанные с человеческим фактором при записи данных.

Ремарка: Тщательно проверяйте данные. Ошибка в результате неправильного ввода может привести к неправильным результатам анализа. Исправления, которые вносятся позже, чем начат анализ, могут внести путаницу. Поэтому, если исправления вносятся на этапе анализа, правильнее будет повторить весь анализ на измененных данных заново.

Основные аспекты

При сборе данных желательны такие качества исследователя как аккуратность и кропотливость, внимательность и легкая недоверчивость к самому себе. Перепроверяйте себя. Это сэкономит время, когда данные перепроверит кто-то другой и найдет ошибку, а вам придется переделывать весь анализ заново. Аккуратная таблица с данными в любой момент может быть предъявлена, как результат сбора данных. Не делайте расчеты прямо в ней. Сохраните оригинал, работайте с копией.

40

Соседние файлы в папке ОЗИЗО Общественное здоровье и здравоохранение