Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
352.doc
Скачиваний:
16
Добавлен:
30.04.2022
Размер:
2.75 Mб
Скачать

3. Статистический ряд. Гистограмма

Пусть изучается некоторая случайная величина X, закон распределения которой в точности неизвестен, и требуется определить этот закон из опыта или проверить экспериментально гипотезу о том, что величина X подчинена тому или иному закону. С этой целью над величиной X проводится ряд независимых опытов (наблюдений). В каждом из этих опытов случайная величина X принимает определенное значение. Совокупность наблюдаемых значений величины представляет собой первичный статистический материал, подлежащий обработке. Такая совокупность называется «простой статистической совокупностью» или «простым статистическим рядом». Одним из способов обработки простого статистического ряда является построение статистической функцией распределения случайной величины.

Статистической функцией распределения случайной величины X называется частота события X < x в данном статистическом материале

Для того чтобы найти значение статистической функции распределения при данном x, достаточно подсчитать число опытов, в которых величина X приняла значение, меньшее, чем x, и разделить на общее число n проведенных опытов.

Статистическая функция распределения любой случайной величины – прерывной или непрерывной – представляет собой прерывную ступенчатую функцию, скачки которой соответствуют наблюдаемым значениям случайной величины и по величине равны частотам этих значений.

При увеличении числа опытов n статистическая функция распределения приближается к подлинной функции распределения случайной величины X.

Построение статистической функции распределения уже решает задачу описания экспериментального материала. Однако при большом числе опытов простая статистическая совокупность становится слишком громоздкой и мало наглядной. Статистический материал должен быть подвергнут дополнительной обработке – строится так называемый «статистический ряд». Весь диапазон наблюдаемых значений X делится на интервалы или «разряды» и подсчитывается количество значений , приходящееся на каждый i-й разряд. Это число делится на общее число наблюдений n и находится относительная частота, соответствующая данному разряду:

Сумма относительных частот всех разрядов равна единице.

Таблица, в которой приведены разряды в порядке их расположения вдоль оси абсцисс и соответствующие относительные частоты называется статистическим рядом:

Таблица 1

Ii

x1;x2

x2;x3

. . .

xi;xi+1

. . .

xk;xk+1

pi*

p1*

p2*

. . .

pi*

. . .

pk*

Здесь Iiобозначение I- го разряда; xi;xi+1 – его границы; pi* - соответствующая относительная частота; k – число разрядов.

Значение, находящееся в точности на границе двух разрядов считают в равной степени принадлежащем к обоим разрядам и прибавляют к числам того и другого разряда по ½.

Число разрядов, на которые следует группировать статистический материал не должно быть слишком большим, (ряд становится невыразительным) и слишком маленьким (свойства распределения описываются слишком грубо). Рационально выбирать число разрядов 10 - 20. Длины разрядов могут быть как одинаковыми, так и разными. Кроме того, согласно формуле Стреджеса, рекомендуемое число интервалов разбиения , а длины частичных интервалов .

Наблюдения, упорядоченные по возрастанию, называют вариационным рядом. Его члены обычно обозначают и называют вариантами. Когда мы наблюдаем дискретную случайную величину, она может принимать одни и те же значения много раз. Число, показывающее, сколько раз появилось данное значение, называют частотой и обозначают .

Выборка в случае дискретных случайных величин может быть изображена в виде полигона частот или полигона относительных частот. Полигоном частот называют ломаную, отрезки которой соединяют точки , , …, , относительных частот – соответственно точки .

Статистический ряд часто оформляется в виде так называемой гистограммы относительных частот (изображение выборки непрерывных случайных величин). Гистограмма строится следующим образом. По оси абсцисс откладываются разряды, и на каждом из разрядов как на основании строится прямоугольник, площадь которого равна относительной частоте данного разряда. В качестве высоты прямоугольника берется относительная частота разряда, деленная на его длину. В случае равных по длине разрядов высоты прямоугольников пропорциональны соответствующим частотам. Полная площадь гистограммы равна единице.

При увеличении числа опытов можно выбирать все более и более мелкие разряды; при этом гистограмма будет все более приближаться к некоторой кривой, ограничивающей площадь, равную единице. Эта кривая представляет собой график плотности распределения величины Х.

При построении гистограмм в реальных исследованиях следует понимать, что формула Стерджеса для числа интервалов разбиения дает лишь рекомендацию, а не строгое правило. Проблема выбора этого числа заключается в следующем. При слишком малых k гистограмма получается слишком грубой, «смазанной», плохо отражающей свойства распределения. При слишком больших k гистограмма становится «колючей» и, в конце концов, распадается на отдельные «иглы» (узкие столбцы) вперемешку с пустыми интервалами. Оптимальное значение в общем случае неизвестно - оно зависит как от типа распределения, так и от конкретной выборки. Что касается концов интервалов и значений вариант, то для человеческого восприятия более удобно, чтобы они выражались более или менее «круглыми» числами.

Гистограммы обычно строят на компьютере. Исследователь легко может варьировать параметры гистограммы и выбрать тот вариант, при котором график выглядит наилучшим образом.

Пример. Анализируется выборка из 100 малых предприятий региона. Цель обследования - измерение коэффициента соотношения заемных и собственных средств ( ) на каждом i-м предприятии. Результаты измерений представлены в табл. 2.

Требуется построить гистограмму и график накопленных частот.

Решение. 1. Построим сгруппированный ряд наблюдений (табл.3).

2. Определим в выборке и

3. Разобьем весь диапазон на k равных интервалов: отсюда длина интервала

Таблица 2

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]