ДАРБИНА—УОТСОНА КРИТЕРИЙ [Durbin-Watson statistic, D.—W.] — условный показатель, который применяется для выявления автокорреляции во временных рядах. При ее отсутствии в исследуемом ряде показатель D.—W. (обозначается d) приближается к числу 2, однако для правильного выбора необходимо учитывать, что в каждом конкретном случае величина d зависит от числа оцениваемых параметров и числа наблюдений. Применяется также дополнительный критерий для выявления отрицательной автокорреляции d1:
d1=4-d.
Показатель d вычисляется по формуле
где yt+1 и yt — соответствующие уровни динамического ряда.
Эластичность - мера изменения одного показателя по отношению к изменению другого, от которого зависит первый. Математически это производная от одного показателя по другому, изменение одного показателя, обусловленное приращением другого показателя на единицу.
Эласти́чность (англ. elasticity) — численная характеристика изменения одного показателя (например:спроса или предложения) к другому показателю (например: цене, доходу) и показывающая, на сколько процентов изменится первый показатель при изменении второго на 1%.
Товары с эластичным спросом по цене:
Предметы роскоши (драгоценности, деликатесы)
Товары, стоимость которых ощутима для семейного бюджета (мебель, бытовая техника)
Легкозаменяемые товары (мясо, фрукты)
Товары с неэластичным спросом по цене:
Предметы первой необходимости (лекарства, обувь, электричество)
Товары, стоимость которых незначительна для семейного бюджета (карандаши, зубные щётки)
Труднозаменяемые товары (хлеб, электрические лампочки, бензин)
Эластичными (по цене) считаются спрос или предложение, когда изменение величины спроса (предложения) больше изменения цены (|E|>1).
Неэластичными считаются спрос или предложение, когда изменение величины спроса (предложения) меньше изменения цены (|E|<1).
Эластичность для участка 1—2: ;
Корреля́ция (корреляционная зависимость) — статистическая взаимосвязь двух или нескольких случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми). При этом изменения значений одной или нескольких из этих величин сопутствуют систематическому изменению значений другой или других величин.[1] Математической мерой корреляции двух случайных величин служит корреляционное отношение [2], либо коэффициент корреляции (или )[1]. В случае, если изменение одной случайной величины не ведёт к закономерному изменению другой случайной величины, но приводит к изменению другой статистической характеристики данной случайной величины, то подобная связь не считается корреляционной, хотя и является статистической[3].
Коэффициент детерминации (R2)— это доля дисперсии отклонений зависимой переменной от её среднего значения, объясняемая рассматриваемой моделью связи (объясняющими переменными). Модель связи обычно задается как явная функция от объясняющих переменных. В частном случае линейной связи R2 является квадратом коэффициента корреляции между зависимой переменной и объясняющими переменными.
Общая формула для вычисления коэффициента детерминации:
где yi — наблюдаемое значение зависимой переменной, а fi — значение зависимой переменной предсказанное по уравнению регрессии -среднее арифметическое зависимой переменной.
При проверке гипотезы о наличии связи модель связи может быть неизвестна. Тогда ее задают в виде кусочно-постоянной функции (в этом случае коэффициент детерминации равен квадрату корреляционного отношения) либо оценивают неизвестные значения функции связи, используя методы сглаживания эмпирической зависимости (например метод скользящих средних)[1].
Интерпретация
Иногда показателям тесноты связи можно дать качественную оценку (шкала Чеддока):
Количественная мера тесноты связи |
Качественная мера тесноты связи |
0,7 - 0,9 |
Высокая |
0,9 - 0,99 |
Весьма высокая |
Функциональная связь возникает при значении равном 1, а отсутствие связи — 0. При значениях показателей тесноты связи меньше 0,7 величина коэффициента детерминации всегда будет ниже 50 %. Это означает, что на долю вариации факторных признаков приходится меньшая часть по сравнению с остальными неучтенными в модели факторами, влияющими на изменение результативного показателя. Построенные при таких условиях регрессионные модели имеют низкое практическое значение.
С другой стороны, близость коэффициента детерминации к единице может быть следствием того, что модель излишне точно описывает имеющиеся эмпирические данные, которые содержат случайную составляющую. Например, если у нас имеется n точек, то мы можем подобрать модель в виде полинома n - 1 степени, которая точно пройдет через все точки. Но если эмпирические данные измерены не точно, такая модель не имеет смысла. Поэтому наряду с коэффициентом детерминации используют другие показатели адекватности и качества моделей.
Линейный коэффициент парной корреляции для линейной регрессии:
,
(0,3 ; 0,5) - связь слабая
(0,5 ; 0,7) - связь умеренная
(0,7 ; 0,8) - связь достаточно тесная
(0,8 ; 0,9) - связь тесная
(0,9 ; 1) - связь очень тесная
Индекс корреляции для нелинейной регрессии:
,
Оценка качества построенной модели дает коэффициент (индекс) детерминации и среднюю ошибку аппроксимации.
Поскольку ошибка меньше 15%, то данное уравнение можно использовать в качестве регрессии.
Средняя ошибка аппроксимации среднее отклонение расчетных значе-ний от фактических. Допустимый предел значений средней ошибки аппроксимации не более 8-10%
Диспе́рсия случа́йной величины́ — мера разброса данной случайной величины, то есть её отклонения от математического ожидания. Обозначается D[X] в русской литературе и (англ. variance) в зарубежной. В статистике часто употребляется обозначение или . Квадратный корень из дисперсии, равный , называется среднеквадрати́чным отклоне́нием, станда́ртным отклоне́нием или стандартным разбросом.
Долю дисперсии, объясняемую регрессией в общей дисперсии результативного признака (y) характеризует коэффициент детерминации:
,
Данные формулы справедливы, если:
, (1)=0
Если , то
Средний коэффициент эластичности показывает на сколько процентов в среднем по совокупности изменится результат y от своей средней величины при изменении фактора x на 1% от своего среднего значения.
,
F-тест оценивает качество уравнения регрессии.
Выдвигается гипотеза H0, которая говорит о статистической незначимости уравнения регрессии и показателя тесноты связи.
n – число уровней
m – число параметров при переменных x
Fрасчетное сравнивают с табличным значением.
Если , то гипотеза отклоняется, т.е. уравнение значимо и надежно.
Для оценки статистической значимости коэффициентов регрессии и корреляции используют t-критерий Стьюдента и доверительные интервалы каждого из показателей.
Выдвигается гипотеза H0, которая говорит о случайно природе показателей.
; ; ma - случайная ошибка
; ; mb - случайная ошибка
; ; mr - случайная ошибка
ta , tb , tr сравнивают с табличными значениями.
Если , то гипотеза отклоняется, т.е. a, b, r неслучайно отличаются от нуля и сформировались под влиянием систематических действий фактора x.
Нахождение коэф-в а и б:
Используя метод наименьших квадратов получаем следующую систему
Решая ее, находим a и b:
9 |
45 |
323 |
45 |
285 |
1773 |
3 способ: через средние
Рассмотрим систему:
Поделим на n:
Тогда:
b=2,633333
a=22,72222
Дарбин-Уотсон:
Рассчитать значение статистики Дарбина-Уотсона, сделать вывод о наличии автокорреляции в ряду остатков.
|
|
0,88 |
1,32 |
|
2,97507093 |
=4- |
1,02492907 |
по модулю больше , следовательно, свойство не выполняется, т.е. автокорреляция остатков присутствует.
Проверка независимости значений уровней случайной компоненты, т.е. проверка отсутствия существенной автокорреляции с помощью d критерия Дарбина-Уотсона
Если , то свойство не выполняется, присутствует автокорреляция.
Если , свойство выполняется, остатки независимы, отсутствует автокорреляция.
Если , то находят d’, d’=4-d, далее смотрят, в какой интервал попадает d’.
Если , то критерий Дарбина-Уотсона ответа не дает. Применяют критерий первого коэффициента автокорреляции.
Далее расчетное значение сравнивают с табличным. При rтабличное=0,36
Если , то свойство выполняется
Прогноз:
Точечный прогноз – это прогноз, которым называется единственное значение прогнозируемого показателя. Это значение определяется подстановкой в уравнение выбранной кривой роста (регрессии, тренда) величины времени t, соответствующей периоду упреждения.
L=t+n; L=10
L=t+k; L=11
Интервальный прогноз – это интервал значений, в котором с достаточной долью уверенности можно ожидать появление прогнозируемой величины (используется доверительный интервал).
- точечный прогноз (у расч = у лучшее (х расч))
- значение t критерия Стьюдента
- среднеквадратическое отклонение
L – х расч.
Таблица «Регрессия »:
|
ВЫВОД ИТОГОВ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Регрессионная статистика |
|
|
|
|
|
|
|
|
|
Множественный R |
0,969463736 |
|
|
|
|
|
|
|
|
R-квадрат |
0,939859935 |
= R^2 |
|
|
|
|
|
|
|
Нормированный R-квадрат |
0,932784633 |
|
|
|
|
|
|
|
|
Стандартная ошибка |
0,028189747 |
|
|
|
|
|
|
|
|
Наблюдения |
20 |
- количество наблюдений (n) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Дисперсионный анализ |
|
|
|
|
|
|
|
|
|
|
df |
SS |
MS |
F |
Значимость F |
|
|
|
|
Регрессия |
2 |
0,211120549 |
0,105560275 |
132,836727 |
4,19656E-11 |
|
|
|
|
Остаток |
17 |
0,013509251 |
0,000794662 |
|
|
|
|
|
|
Итого |
19 |
0,2246298 |
|
(F-критерий ) |
(ошибка в F) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% |
|
Y-пересечение |
-0,818243732 |
0,114909614 |
-7,120759573 |
1,71499E-06 |
-1,060681823 |
-0,575805641 |
-1,060681823 |
-0,575805641 |
|
x2 |
0,002079897 |
0,000928674 |
2,239642292 |
0,038770256 |
0,000120567 |
0,004039226 |
0,000120567 |
0,004039226 |
|
x6 |
0,02026846 |
0,001266584 |
16,00245899 |
1,10447E-11 |
0,017596202 |
0,022940719 |
0,017596202 |
0,022940719 |