Добавил:
nastia.sokolowa2017@yandex.ru Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Общая_климатологияКн1

.pdf
Скачиваний:
5
Добавлен:
20.02.2024
Размер:
10.41 Mб
Скачать

Рассчитанные таким образом значения частот для всех градаций можно представить в виде ступенчатой кривой графически, откладывая по оси абсцисс интервалы, а по оси ординат – частоты. Такой график называется гистограммой (рис. 3.2). Значения частот можно выразить как в долях единицы, так и процентах. Если середины интервалов частот соединить ломаной линией, то мы получим дифференциальное распределение вероятностей, которое тем ближе к истинному распределению, чем больше число интервалов и чем меньше диапазон каждого интервала. Если интервалы достаточно узкие, то относительную частоту можно характеризовать площадью под кривой распределения. Можно утверждать и обратное: кривая, целиком находящаяся в положительной области, площадь которой равна единице, представляет собой кривую распределения или кривую плотности вероятности.

Рис. 3.2. Гистограмма распределения температур воздуха июля в 21 час в г. Санкт-Петербурге

Зная значения частот для различных интервалов, можно определить эмпирическую функцию распределения или накопленную

150

частоту. Получить такую накопленную частоту или кривую кумулятивной частоты (кумуляту) можно последовательным суммированием частот, начиная с частоты наименьшего интервала (в данном случае 5–7°С).

Накопленная частота F рассчитывается по следующей формуле:

s

 

F (xi x xi 1 ) k ,

(3.4)

k 1

где: x – случайная переменная (в данном случае температура воздуха), ранжированная по возрастанию.

График F(x) представляет собой возрастающую ступенчатую кривую, как показано на рис. 3.3.

Рис. 3.3. Распределение накопленных частот температур воздуха июля в 21 час в г. Санкт-Петербурге

151

Распределение накопленных частот может быть построено как по возрастанию, так и по убыванию случайной величины. Кроме того, эмпирическое распределение можно построить не по частотным интервалам, а прямо по ранжированным значениям в соответствии с рассчитанной эмпирической вероятностью или обеспеченностью, если рассматривается ранжирование по убыванию. В этом случае эмпирические вероятности ранжированных величин рассчитываются по следующей формуле:

P

m

,

(3.5)

m

n 1

 

где: Pm – вероятность m-ой случайной величины (x), ранжированной по убыванию (xi+1 < x < xi), m = 1,n – порядковый номер случайной величины в последовательности, ранжированной по убыванию.

Пример такого эмпирического распределения, построенного на основании формулы (3.5) приведен на рис. 3.4 для относительной (деленной на среднее многолетнее значение) температуры июля в г. Тихвине. Эмпирические обеспеченности P в данном случае представлены в процентах (%).

Рис. 3.4. Эмпирическое распределение относительных среднемесячных температур воздуха июля (K(t)) в г. Тихвине

152

Влитературе по математической статистике можно встретить

идругие формулы расчета эмпирической обеспеченности, например:

m 0,3

P 1 (3.6)

m

n 0,4

 

Однако эти формулы относятся не математическому ожиданию распределения порядковых статистик, как формула (3.5), а к другим показателям центра распределения (медиана, мода) и поэтому оценки эмпирической обеспеченности, рассчитанные по этим формулам, могут быть смещенными.

Нормальное распределение и другие аналитические распределения

Во многих случаях, если на основании наблюдений некоторого непрерывного признака строится распределение частот, то оно представляет собой симметричную колоколообразную (нормальную) кривую [1]. Особенно часто подобную форму имеют результаты повторных одинаковых измерений, например, длины спички или объема головы ребенка. Так Кетле (1796–1974) обнаружил, что рост солдат-ровесников подчиняется нормальному распределению. По его мнению, причиной такого распределения являются ошибки, которые делает природа при воспроизведении среднего человека. Подобные результаты формируют так называемый закон ошибок или нормальное распределение. Типичную нормальную кривую дает выражение:

Y ae bx2

,

(3.7)

где: a,b > 0 – параметры уравнения (3.7), x – случайная величина, Y – плотность распределения или дифференциальная вероятность.

Нормальное распределение или распределение Гаусса является наиболее распространенным во многих областях науки, т. к. оно вытекает из центральной предельной теоремы теории вероятно-

153

стей: “Если результат наблюдения является суммой многих случайных слабо взаимозависимых величин, каждая из которых вносит малый вклад относительно общей суммы, то при увеличении числа слагаемых распределение центрированного и нормированного результата стремится к нормальному”.

Нормальное распределение предложено Муавром (1667– 1754), но было подробно исследовано Гауссом и поэтому носит его имя. Это распределение обладает рядом благоприятных мате- матико-статистических свойств, что позволяет его рассматривать как краеугольный камень математической статистики. Поэтому нормальное распределение следует рассмотреть более подробно. Математическое выражение дифференциальной вероятностной кривой нормального распределения (f(х)) имеет следующий вид:

f (x)

 

1

 

exp

1

(

x

)

2

,

(3.8)

 

 

 

 

2

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

где: х – случайная величина, изменяющаяся от –∞ до +∞; µ – математическое ожидание, изменяющееся от –∞ до +∞; σ – среднее квадратическое отклонение (СКО), σ > 0.

В соответствии с (3.8), нормальное распределение имеет всего два параметра: параметр, характеризующий центр распределения - µ и разброс относительно центра, характеризуемый параметром σ. Обычно греческими буквами обозначаются параметры генеральной совокупности (в данном случае µ и σ), а латинскими обозначаются параметры, рассчитываемые по выборке, которыми в данном случае будут хср и s.

На рис. 3.5 приведены плотности вероятности или дифференциальные нормальные распределения при разных значениях параметров µ и σ. При математическом ожидании µ = 0 представлены три варианта распределений при разных σ = 0,2, 1,0 и 5,0, из рассмотрения которых следует, что, чем больше среднее квадратическое отклонение, тем больше разброс случайной величины и тем меньше вероятность центра распределения, т. е. увеличивается размах и уменьшается амплитуда. Если же изменяется математическое ожидание, в данном случае с 0 до –2, то все распределение

154

смещается влево. Таким образом, нормальное распределение полностью определяется всего двумя параметрами, причем среднее или математическое ожидание определяет положение распределения относительно оси x, а стандартное отклонение определяет форму кривой: чем оно больше, тем кривая более пологая.

Рис. 3.5. Плотности вероятности нормального распределения при различных значениях параметров µ и σ

Есть и другие важные свойства нормального распределения:

-кривая симметрична относительно среднего значения x = µ и ординаты равноудаленные от центра распределения имеют одинаковую плотность вероятности;

-для случая стандартизированного нормального распределения (µ = 0 и σ = 1) максимум ординаты кривой равен примерно 0,4, а при х стремящихся к пределам (–∞ или +∞), плотность вероятности стремится к нулю, т. е. события становятся практически невозможными;

155

- для нормального распределения справедливо правило трех сигм (рис. 3.6), в соответствии с которым для больших объемов выборок 68,27% всех наблюдений лежит на расстоянии 1σ по обе стороны от центра распределения, 95,45% – на расстоянии 2σ, и 99,73% – на расстоянии 3σ, а 50% всех наблюдений находится на расстоянии 0,67% от центра.

σ

Рис. 3.6. Графическая интерпретация правила трех сигм для нормального распределения

Интегральная форма нормального распределения или распределение накопленной вероятности имеет следующую запись:

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

2

 

2

 

 

F (x)

 

 

 

 

 

e ( x )

/ 2

 

dt

(3.9)

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

156

Интегральные нормальные функции или функции нормального распределения вероятности при тех же разных параметрах µ и σ (рис. 3.5), приведены на рис. 3.7.

Рис. 3.7. Функции распределения вероятности нормального распределения при различных значениях параметров µ и σ

Сокращенно нормальное распределение записывают как N(µ,σ), а стандартизированное или стандартное распределение N(0,1). Ординаты стандартизированного нормального распределения z = (x-µ)/σ (при µ = 0 и σ = 1) приведены, например, в «Практикуме по климатологии. Часть 1». Для каждого значения z по таблице можно найти вероятность того, что случайная переменная Z примет значение, большее, чем z. Вероятность под всей кривой стандартного распределения равна 1 и отсюда в формуле (3.7) по-

лучаются значения параметров a 1/ 2 ,b = 1/2.

Нормальное распределение подходит для объектов, находящихся в одинаковых условиях, что может выполняться часто, но далеко не всегда. Например, в гидрометеорологии эмпирические распределения практически никогда не являются нормальными,

157

т. к. несимметричны и часто содержат аномальные экстремумы. Поэтому помимо нормального распределения были разработаны и другие аналитические виды. Среди наиболее распространенных из них следующие.

Простейшим из непрерывных распределений является равномерное распределение случайной величины, принимающей значения, принадлежащие интервалу [a,b], и характеризующееся тем, что плотность вероятности на этом интервале постоянна (рис. 3.8).

Рис. 3.8. Примеры функций распределения вероятностей (слева направо и сверху вниз): равномерное, экспоненциальное, логнормальное, гамма-распределение, бета-распределение (а) – г)) и распределение Максвелла

158

С помощью равномерного распределения моделируются многие реальные процессы. Самый распространенный пример равномерного распределения – это график движения общественного транспорта. Например, если автобус ходит с интервалом в 10 минут, и вы в случайный момент времени подошли к остановке, то какова вероятность того, что автобус подойдёт в течение 1 минуты? Очевидно, что 1/10 и вероятность того, что придется ждать 5 мин – тоже 1/10 и то, что более 9 минут – такая же. Поэтому повторяемость событий в таком распределении одна и та же и равна 1/(a-b). Среди климатических характеристик равномерное распределение может в некоторых случаях соответствовать распределению направления ветра по румбам или распределение скорости ветра по градациям. Оно будет справедливо при одинаковой частоте событий в каждой градации.

Еще одним из простых и распространенных распределений является экспоненциальное распределение (рис. 3.8). Оно может быть получено из непрерывного равномерного распределения методом обратного преобразования. Плотность экспоненциального распределения имеет вид:

f(x) = 0 при x≤0 и f(x)= λex при x>0,

(3.10)

где λ>0 – положительная постоянная, называемая параметром экспоненциального распределения.

В соответствии с (3.10), распределение сосредоточено на положительной полуоси, и его случайная величина принимает только положительные значения. Среднее значение распределения равно µ = 1/λ и дисперсия σ2 = 1/λ2. Экспоненциальное распределение играет важную роль в задачах телекоммуникации, так как позволяет моделировать интервалы времени между наступлением событий. Наиболее наглядным является пример с магазином, в который время от времени заходят покупатели. При определённых допущениях время между появлениями двух последовательных покупателей будет случайной величиной с экспоненциальным распределением. Среднее время ожидания нового покупателя равно 1/λ, а сам

159

Соседние файлы в предмете Климатология и метеорология