Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Эконометрика. Начальный курс

.pdf
Скачиваний:
15
Добавлен:
20.11.2023
Размер:
21.93 Mб
Скачать

6.1. Гетероскедастичность

181

объему. В первую группу попадают наблюдения с LOGLIVSP > 3.8 (155 наблюдений), во вторую — с LOGLIVSP < 3.35 (149 наблюде­ ний).

Из-за возникновения dummy trap проблемы в первом случае пришлось «выбросить» переменную R1, а во втором —переменные R2, R3 и R4, таким образом, количество регрессоров в обоих случа­ ях отличалось от первоначального числа 13. Соответственно число степеней свободы равнялось 143 = 155 —12 и 139 = 149 —10 (12 и 10 — это количество регрессоров соответственно в первой и во второй регрессии). Здесь использовано очевидное обобщение теста Голдфелда-Куандта на случай разного количества регрессоров.

После прогонки регрессий в каждой из групп получены следу­ ющиезначения сумм квадратовостатков: e\ei = 6.80 и е^вг = 3.76.

Таким образом, F = « 1.7. Вероятность того, что случай­

ная величина с распределением Фишера F(143,139) принимает зна­ чение меньше единицы, равна 95%. Полученная величина F = 1.7 превышает Foos(143,139), и гипотеза гомоскедастичности остатков должна быть отвергнута.

Замечание

Отметим отдельно, что надо внимательно относиться к интерпре­ тации результатов тестов на гетероскедастичность. Дело в том, что неверная спецификация функциональной формы модели мо­ жет привести к тому, что тест отвергает гипотезу гомоскеда­ стичности. Поясним это на простейшем примере. Пусть истин­ ная модель имеет вид exp(yt) = а + (3xt + с гомоскедастиины­ ми ошибками, т. е. V(et) = а2, а мы оцениваем линейную модель yt = а + (3xt + et. В результате мы получим картину, похожую на приведенную на рис. 6.1.

Мы видим, что квадраты остатков регрессии е2, которыми опе­ рируют тесты на гетероскедастичность, зависят от значения пере­ менной xt, и, соответственно, тесты отвергают гипотезу гомоске­ дастичности, что в данном случае является следствием ошибки спецификации модели.

Рассмотрим пример, в котором мы встречаемся с данной си­ туацией.

182

Гл. 6. Гетероскедастичность и корреляция по времени

Рис. 6.1

Пример. Зарплата в Нидерландах (Arthur van Soest). Продол­ жение 1 (см. начало —п. 4.4, стр. 134).

Попробуем исследовать на этих данных зависимость зарпла­ ты от возраста. Мы ожидаем, что до некоторого возраста зарпла­ та растет (идет накопление опыта), а далее —убывает. Простей­ ший способ учесть этот эффект —включить в уравнение как AGE так и AGE2. Мы ожидаем получить положительный коэффициент при AGE и отрицательный при AGE2. Результаты регрессии W на остальные переменные приведены в таблице 6.3.

 

 

 

 

Таблица 6.3

Dependent Variable: W____________________________________

Variable

Coefficient

Std.Error

t-Statistic

Probability

const

8.0110

6.7978

1.1785

0.2405

SEX

-3.6826

1.2275

-3.0000

0.0032

EDU

3.3468

0.5511

6.0726

0.0000

AGE

0.1707

0.3687

0.4631

0.6400

AGE2

0.0036

0.0048

0.7433

0.4585

R-sqitared

0.5173

 

 

 

White Heteroscedasticity Test:

 

 

F-statistic

 

6.4422

Probability

0.0000

Obs*R-squared

31.9177

Probability

0.0000

6.1. Гетероскедастичность

183

Из таблицы видно, что коэффициенты при интересующих нас переменных AGE и AGE2 не значимы. Тест Уайта пока­ зывает наличие гетероскедастичности. Прежде чем начать кор­ рекцию гетероскедастичносги, вспомним, что тест может да­ вать такой результат при ошибке спецификации функциональ­ ной формы. В самом деле, поскольку, как правило, все над­ бавки к зарплате формулируются в мультипликативной фор­ ме («увеличение на 5%»), то более естественно взять в каче­ стве зависимой переменной логарифм зарплаты In W. Резуль­ таты регрессии In W на остальные переменные приведены в таблице 6.4.

Dependent Variable: In W

 

 

Таблица 6.4

Std.Error

 

 

Variable

Coefficient

t-Statistic

Probability

const

1.4217

0.2585

5.5001

0.0000

SEX

-0.1447

0.0467

-3.0005

0.0023

EDU

0.1244

0.0210

5.9367

0.0000

AGE

0.0660

0.0140

4.7045

0.0000

AGE2

-0.00061

0.0002

-3.3225

0.0011

R-squared

0.6098

 

 

 

White Heteroscedasticity Test:

 

0.1625

F-statistic

 

1.5619

Probability

Obs*R-squared

9.2254

Probability

0.1613

Теперь оба коэффициента значимо отличаются от нуля и име­ ют «правильные знаки». Тест Уайта показывает отсутствие гетеро­ скедастичности. Из последнего уравнения можно также получить, что возраст, при котором достигается максимальная зарплата, ра­ вен примерно 54 годам, что согласуется со здравым смыслом. По­ водимому следует заключить, что в первом уравнении резуль­ тат теста указывал на ошибку спецификации. Пример показыва­ ет, что при эконометрическом анализе полезна любая дополни­ тельная информация (в нашем случае — механизм формирования зарплаты).

184

Гл. 6. Гетероскедастичность и корреляция но времени

6.2.Корреляция по времени

Авторегрессионный процесс первого порядка

При анализе временных рядов часто приходится учитывать стати­ стическую зависимость наблюдений в разные моменты времени. Иными словами, для многих временных рядов предположение о некоррелированности ошибок не выполняется. В этом разделе мы рассмотрим наиболее простую модель, в которой ошибки образу­ ют так называемый авторегрессионный процесс первого порядка (точное определение будет дано ниже). Как было показано ранее (глава 5), применение обычного метода наименьших квадратов к этой системе дает несмещенные и состоятельные оценки парамет­ ров, однако можно показать (см., например, Johnston and DiNardo, 1997), что получаемая при этом оценка дисперсии оказывается смещенной вниз, что может отрицательно сказаться при проверке гипотез о значимости коэффициентов. Образно говоря, МНК ри­ сует более оптимистичную картину регрессии, чем есть на самом деле.

Как и раньше, рассмотрим модель

у = Х 0 + е ,

(6.5)

где t-я компонента вектора у представляет значение зависимой переменной в момент времени t, t = 1 ,...,п . Будем для опре­ деленности считать, что первым регрессором в X является кон­ станта. Запишем подробнее уравнение для наблюдения в момент времени t:

Vt = А + / % а ;* 2 Н----------- Ь P k ^ tk + в * = + £ «> ( 6 . 6 )

где х[ = (1,Х(2, • • • ,xtk) t-я строка матрицы X .

Один из наиболее простых способов учета коррелированности ошибок (в разные моменты времени) состоит в предположе­ нии, что случайная последовательность {е*, t — 1 ,... ,п} образу­ ет авторегрессионный процесс первого порядка. Это означает, что ошибки удовлетворяют рекуррентному соотношению

£t = p£t-1 +

(6.7)

6.2. Корреляция по времени

185

где {14, t = 1,...,п } — последовательность независимых нор­ мально распределенных случайных величин с нулевым средним и постоянной дисперсией <т2, а р — некоторый параметр, называе­ мый коэффициентам авторегрессии (|р| < 1). Строго говоря, для полного описания модели надо определить £о- Будем считать, что £о ~ нормальная случайная величина с нулевым средним и дис­ персией а2 = <х£/(1 - р2), не зависящая от {i/t, t = 1 ,... ,п}. Из дальнейшего станет ясно, почему у £о именно такие параметры. Взяв математическое ожидание от обеих частей (6.7), получим Б £( = р Е £(_i, откуда следует, что Е ££ = 0, t = 1 , ... ,« . По­ скольку £t_i выражается через v\ , ... , vt- i (см. (6.7)), то £t_i и щ независимы. Поэтому

Умножая (6.7) на £t_i и вновь пользуясь независимостью £t_i и i получим

E(£t £t_l) = COV(£*,£*_!) = p V (£t_i) = p o 2.

(6.9)

Аналогично Cov (££)££_г) = (Per2 и вообще

Cov(£t,£t_m) = рто\.

(6.10)

Таким образом, последовательность {£*} образует стационар­ ный1 случайный процесс. Именно этим обстоятельством дикто­ вался выбор параметров начальной величины £о- На самом деле, с течением времени зависимость ££ от £о быстро уменьшается, по­ этому в большинстве книг по эконометрике проблему начальных условий для {£t} просто не рассматривают, неявно подразумевая, что процесс (6.7) при любом начальном значении быстро сходит­ ся к стационарному. Отметим также, что условие \р\ < 1 является необходимым для стационарности.

'Более подробно понятие стационарности будет рассмотрено в главе 11.

186

Гл. 6- Гетероскедастичность и корреляция по времени

Из (6.9) следует, что

Р = Cov (et,et_г)/<т2 = Cov (et,et_i)/(V (et)1/2V ( ^ . i ) 1/2),

т. e. p есть в точности коэффициент корреляции между двумя со­ седними ошибками. Пользуясь (6.10), можно выписать ковариаг ционную матрицу случайного вектора е:

 

■ 1

р

р2 ...

 

„1

р

1

р ...

РП" 2

П = 11 - р г2

р2

р

1 ...

рп_3

 

 

рП-Э ...

 

 

L>n_i

рп- 2

1

Оценивание в модели с авторегрессией

Проблему оценивания системы (6.5) рассмотрим отдельно для случая, когда коэффициент р известен, и отдельно — когда неиз­ вестен.

1. Значение р извест но. В этом случае для оценивания систе­ мы (6.5) можно применить обобщенный метод наименьших квад­ ратов. В данном случае нетрудно найти матрицу Р , для которой Р ' Р = ГГ1 (см. (5.5)). Здесь весьма просто догадаться, какое линейное преобразование исходной системы (6.5) надо провести, чтобы получить классическую модель. Напишем (6.6) для момен­ та времени t 1 (t > 2)

Vt-1 = x't-\ P + e*-i,

умножим обе части на р и вычтем почленно из (6.6). Тогда с уче­ том (6.7) получим

V i ~ P V t - i = (* t - p x t - i Y P +

(6.11)

При t = 1 достаточно обе части уравнения (6.6) умножить на л/1 —Р2'

\ Л - Р22/1 = л /1 — Д2 х ' ф + y / i - Р2£ \ .

(6.12)

6.2. Корреляция по времени

187

В системе (6.11), (6.12) ошибки удовлетворяют условиям уже обычной регрессионной модели. Действительно, в (6.11) случай­

ные величины {i/t,

t =

2 ,...,п } независимы и имеют постоян­

ную дисперсию

а в

(6.12) ошибка у/1 — р2£i не зависит от

{i/t, t = 2 ,... ,п} и, согласно (6.8), также имеет дисперсию а2. На практике часто опускают преобразование (6.12), игнори­

руя тем самым первое наблюдение. С одной стороны, благодаря этому, преобразование исходной модели (6.5) становится единооб­ разным. В частности, для получения оценки параметра (3\ доста­ точно оценку свободного члена в (6.11) разделить на (1-р). С дру­ гой стороны, отбрасывание первого наблюдения может привести к потере важной информации, особенно в выборках небольшого размера.

2. Значение р неизвест но. Ситуации, когда параметр авто­ регрессии р известен, встречаются крайне редко. Поэтому возни­ кает необходимость в процедурах оценивания при неизвестном р. Как правило, они имеют итеративный характер. Опишем три наи­ более употребительные. Мы не будем устанавливать сходимость этих процедур, практика их применения показала, что они доста­ точно эффективны.

Процедура К охрейна-О ркат т а {C ochrane-O rcutt). На­ чальным шагом этой процедуры является применение обычного метода наименьших квадратов к исходной системе (6.5) и получе­ ние соответствующих остатков е = (e i,... ,е„)'. Далее,

1)в качестве приближенного значения р берется его МНКоценка г в регрессии et = де4_j + vt\

2) проводится преобразование (6.11) (или (6.11), (6.12)) при

р = г, и находятся МНК-оценкн /3 вектора параметров /3;

3)строится новый вектор остатков е = у — X /3;

4)процедура повторяется, начиная с п. 1).

Процесс обычно заканчивается, когда очередное приближение р мало отличается от предыдущего. Иногда просто фиксируется

188 Гл. 6. Гетероскедастичность и корреляция по времени

количество итераций. Процедура Кохрейна-Оркатта реализована в большинстве эконометрических компьютерных программ.

Процедура Х илд рет а -Л у (H ildreth-Lu). Суть процедуры достаточно проста. Из интервала (—1,1) возможного изменения коэффициента р берутся последовательно некоторые значения (например, числа с постоянным шагом 0.1 или 0.05) и для каждо­ го из них проводится оценивание преобразованной системы (6.11). Определяется то значение этого параметра, для которого сумма квадратов отклонений в (6.11) минимальна. Затем в некоторой окрестности этого значения устраивается более мелкая сетка и процесс повторяется. Итерации заканчиваются, когда будет до­ стигнута желаемая точность. Время работы процедуры, очевидно, сокращается, если есть априорная информация об области изме­ нения параметра р.

Процедура Д арвина (Durbin). Преобразованная система (6.11) переписывается в следующем виде:

Vt = P i (1 - р ) + p y t- 1+ 02Xt2 - p fh x t - 12 + • • ■+ PkXtk - p fa x t - 1k + Vt,

T. e. yt-i включается в число регрессоров, а р — в число оцени­ ваемых параметров. Для этой системы строятся обычные МНКоценки г и Bj параметров р и pPj соответственно. В качестве оцен­ ки 0j берут Bj/r. Можно улучшить качество оценок /3, подста­ вив полученное значение г в систему (6.11), и найти новые МНКоценки параметров (3.

Тест Дарбина-Уотсона на наличие или отсутствие корреляции по времени

Большинство тестов на наличие корреляции по времени в ошиб­ ках системы (6.5) используют следующую идею: если корреляция есть у ошибок е, то она присутствует и в остатках е, получаемых после применения к (6.5) обычного метода наименьших квадра­ тов. Здесь мы рассмотрим только одну реализацию этого подхода. Пусть нулевая гипотеза состоит в отсутствии корреляции, т. е. HQ:

6.2. Корреляция по времени

189

р = 0. В качестве альтернативной может выступать либо просто Hi: «не Но», либо односторонняя гипотеза, например, Hi: р > 0.

Наиболее широко используется тест Дарбина-Уотсона (Dur­ bin-Watson). Он основан на статистике

(6.13)

Будем считать, что постоянный член включен в число регрес­ соров. Тогда нетрудно проверить, что эта статистика тесно свя­ зана с выборочным коэффициентом корреляции между et и et_i. Действительно, проводя элементарные выкладки, имеем

Предполагая число наблюдений достаточно большим, можно считать, что приближенно выполнены следующие равенства: sir £ ?= 2 е« = - e i/(n - 1) ~ о и £Г=2 et_i = -е „ /(п - 1) « О

(поскольку выполнено точное равенство £ Г =1 е£ = 0 в силу нали­ чия постоянного регрессора). Поэтому выборочный коэффициент корреляции г между е£ и et_i можно приближенно представить в виде

£ £ ■ 2 e t £ t - \ ЕГ=2 e«et - i

Наконец, пренебрегая в (6.14) слагаемыми е\ и

по сравне­

нию с общей суммой ]СГ=1 et ) окончательно получим

 

DW « 2(1 - г).

(6.15)

190

Гл. 6. Гетероскедастичность и корреляция по времени

Понятен и содержательный смысл статистики DW: если меж­ ду е£ и et- \ имеется достаточно высокая положительная корреля­ ция, то в определенном смысле et и et_i близки друг к другу и величина статистики DW мала. Это согласуется с (6.15): если ко­ эффициент г близок к единице, то величина DW близка к нулю. Отсутствие корреляции означает, что DW близка к 2. Таким об­ разом, если бы распределение статистики DW было известно, то для проверки гипотезы Но: р = 0 против альтернативы Hi: р > О можно было бы для заданного уровня значимости (например, для 5%-ного уровня) найти такое критическое значение d*, что если DW > d*, то гипотеза Но не отвергается, в противном случае она отвергается в пользу Hi. Проблема, однако, состоит в том, что распределение DW зависит не только от числа наблюдений п и количества регрессоров А:, но и от всей матрицы X , и, значит, практическое применение этой процедуры невозможно, посколь­ ку нельзя же составить таблицу критических значений d* для всех матриц Х \ Тем не менее, Дарбин и Уотсон доказали (Durbin, Wat­ son, 1951), что существуют две границы, обычно обозначаемые <2ц и di, du > di (и = upper — верхняя, l = low — нижняя), кото­ рые зависят лишь от п, к и уровня значимости (а следовательно, могут быть затабулированы) и обладают следующим свойством: если DW > du, то DW > d* и, значит, гипотеза Но не отвергается, а если DW < d|, то DW < d*, и гипотеза Но отвергается в пользу H i. В случае di < DW < d„ ситуация неопределенна, т. е. нельзя высказаться в пользу той или иной гипотезы. Если альтернатив­ ной является гипотеза об отрицательной корреляции Hi: р < 0, то соответствующими верхними и нижними границами будут 4 —d[ и 4 —d„. Целесообразно представить эти результаты в виде таблицы (см. таблицу 6.5).

Наличие зоны неопределенности, конечно, представляет опре­ деленные трудности при использовании теста Дарбина-Уотсона. Ее ширина может быть довольно значительной. К примеру, при п = 19, к = 3 она образует интервал (0.97, 1.68). Отметим, что некоторые компьютерные пакеты, например SHAZAM, численно вычисляют точные критические значения (зависящие от Л -).