Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Конспект статистические методы.docx
Скачиваний:
15
Добавлен:
30.09.2022
Размер:
923.65 Кб
Скачать

1.5 Как определить, в какой шкале измерено явление

Определение того, в какой шкале измерено явление (представлен признак), – ключевой момент анализа данных.

Операции, которые можно выполнять со шкалами низшего порядка, такими как номинальная, также применимы к шкалам высшего порядка, таким как шкала отношений. По этой причине затушеванная область на рисунке 1 показывает, что все операции правомерно выполнять с данными в шкалах интервалов или отношений, но только три из них можно использовать с номинальными данными.

Раздел 2

2.1 Генеральная совокупность и выборка

Генеральная совокупность представляет собой массив данных одной категории. Так, если мы ставим перед собой задачу исследовать коэффициент интеллекта (IQ) школьников выпускных классов школ г. Екатеринбурга, то генеральной совокупностью будут являться все школьники всех выпускных классов всех школ города. Выборка (выборочная совокупность) — это такая группа объектов, которая должна удовлетворять следующим условиям:

1. Это группа объектов, доступная для изучения

2. Это часть заранее намеченной генеральной совокупности

3. Это группа, отобранная случайным образом так, чтобы любой объект генеральной совокупности имел одинаковую вероятность попасть в выборку.

Основное свойство выборочной совокупности — репрезентативность. Репрезентативность — это способность выборки характеризовать соответствующую генеральную совокупность с определенной точностью и достаточной надежностью.

2.2 Описательная статистика

Центральные тенденции распределения и оценка разброса данных

Описательная статистика позволяет обобщать первичные результаты, полученные в наблюдении или эксперименте.

Процедуры сводятся к группировке данных по их значениям, построению распределения их частот, выявлению центральных тенденций распределения и оценке разброса данных по отношению к найденной центральной тенденции.

Мера центральной тенденции — число, служащее для описания множества значений одним-единственным числом (для краткости). Но при приведении ряда чисел к одному, то это снижает точность. Наиболее часто используемыми являются среднее арифметическое, мода и медиана.

Мода (Мо) — наиболее часто встречающееся значение признака.

Медиана — среднее значение упорядоченного множества данных (ранжированный ряд).

Среднее арифметическое значение равно сумме переменных, деленной на их число.

Для оценки разброса данных по отношению к найденной центральной тенденции используют размах, дисперсию или среднеквадратическое отклонение.

Размах вариаций есть математическая разность между максимальной и минимальной величиной признака.

Среднее отклонение равно сумме отклонений от среднего значения (т.е. сумма расстояний между xср и х), взятых по модулю.

Дисперсия2) представляет собой сумму квадратов отклонений от среднего (сумму квадратов расстояний между xср и х).

Стандартное отклонение (σ) соответствует квадратному корню из дисперсии.

Пример

Отличие среднего арифметического от математического ожидания. Математическое ожидание - это параметр генеральной совокупности – бесконечного ряда чисел. Так как ряд бесконечный, то значение математического ожидания вычислить невозможно. А среднее значение - это приблизительная оценка математического ожидания по выборке из генеральной совокупности.

Дан ряд чисел: 1,2,3,4,5. Следовательно n=5

Тогда среднее арифметическое равно:

Дисперсия -  характеризует отклонение от средней величины в данной выборке.

Формула:

1

-2

4

2

-1

1

3

0

0

4

1

1

5

2

4

Тогда сумма

Значит дисперсия

В знаменателе при больших значениях n (больше 100) можно n-1 заменить на n.

Среднеквадратическое отклонение — показатель рассеивания значений случайной величины относительно её математического ожидания. Из-за возведения в квадрат отдельных отклонений при вычислении дисперсии, то полученная величина оказывается далекой от первоначальных отклонений и потому не дает о них наглядного представления. Чтобы этого избежать и получить характеристику, сопоставимую со средним отклонением, проделывают обратную математическую операцию – из дисперсии извлекают квадратный корень.

Значит,