8860
.pdfи вычисляем их соотношение RS R S - это значение сравнивается с таблич-
ными: верхними и нижними границами (более подробную информацию пред-
лагается найти самостоятельно)
4). Гомоскедастичность остатков – постоянство дисперсии остатков или
дисперсия каждого отклонения одинакова для всех xi . Невыполнение данного
условия означает наличие гетероскедастичности.
Способы выявление гетероскедостичности: 4.1) Графический (построение графика). 4.2) Критерий Гольдфельда-Квандта:
Шаг 1. Упорядочение n наблюдений по мере возрастания значений фак-
тора x .
Шаг 2. Исключение из рассмотрения C центральных наблюдений, при этом n C / 2 p , где p - это число оцениваемых параметров.
Шаг 3. Разделение совокупности из (n - C) на две группы (с малыми и большими значениями фактора) и определение по каждой из групп уравнения
регрессии.
Шаг 4. Нахождение отношения R |
S12ост |
(большее делим на меньшее). |
||||||
S 22ост |
||||||||
|
|
|
|
|
||||
|
n C 2 p |
|
n C 2 p |
R Fтабл , то име- |
||||
Найденное значение Fтабл ; |
|
|
; |
|
|
, если |
||
2 |
|
|
2 |
|||||
|
|
|
|
|
|
ет место гетероскедастичность.
5). Отсутствие автокорреляции в остатках. Ищется коэффициент корре-
ляции r i j (j=i+1), если его значение по модулю значительно (близко к еди-
нице), то имеет место автокорреляции остатков. Более точным является крите-
рий для проверки автокорреляции остатков Дарбина-Уотсона.
4. Построение и анализ модели множественной регрессии
71
a)Отбор факторов – введение фиктивных переменных и анализ матрицы корреляции между факторами (и показателем). Удаление явно
коррелирующих факторов. Проверка на мультиколлинеарность.
Парная регрессия дает хороший результат, если на рассмотрение оказы-
вает один фактор и влияниями других факторов можно пренебречь. Как прави-
ло, необходимо учесть влияние двух и более факторов.
Проблемы при построении модели множественной регрессии: 1). Отбор факторов, включаемых в модель.
2). Объем выборки должен быть достаточно большим ( n 7m , где n –
объем выборки, а m – число факторов).
3). Выбор спецификации модели, то есть функциональной зависимости
(линейные и нелинейные).
Отбор факторов.
Факторы, включаемые в модель должны отвечать следующим условиям:
Факторы должны быть количественно измеримы, если необходимо вклю-
чить в модель качественный фактор, не имеющий количественного из-
мерения, то ему нужно придать количественную определенность одним их двух способов – разработать шкалу и придать количественное значе-
ние фактору или использовать фиктивных переменные (вид несущих
стен, наличие – отсутствие балкона и т.д.). Фиктивные переменные при-
нимают значения 0 либо 1.
|
0 |
отсутствие балкона |
. Фиктивные переменные должны ис- |
|
z |
|
|
|
|
|
|
|
||
1 |
наличие балкона |
|
пользоваться в модели исследования цены квартиры на рынке жилья.
Факторы не должны быть интеркоррелированы и тем более находиться в точной функциональной связи. (Интеркоррелированность – это зависи-
мость факторов, когда при построение регрессии вида yˆ a b1 x1 |
b2 x2 |
выполняется неравенство, следовательно, связь между x1 и y |
менее |
72
сильна, чем связь между x1 и x2 , в таком случае включать x1 в регресси-
онную модель не нужно.)
Если между факторами существует высокая корреляция, то нельзя вы-
явить их изолированное влияние на исследуемый показатель и параметры урав-
нения регрессии не возможно верно интерпретировать. Считается, две пере-
менные явно коллинеарные, то есть находятся между собой в линейной зависимости, если | rxi x j | 0,7 .
Негативным считается явление мультиколлениарности факторов. Это яв-
ление проявляется тогда, когда более чем два фактора связаны между собой за-
висимостью, близкой к линейной, то есть имеет место совокупное воздействие факторов друг на друга. Чем сильнее мультиколлениарность факторов, тем ме-
нее надежна оценка параметров регрессии с помощью метода наименьших квадратов, при этом затрудняется интерпретация параметров множественной регрессии. Данную модель нельзя использовать для прогнозирования, так как она ненадежна.
Для оценки мультиколлениарности факторов будем использовать опреде-
литель матрицы парных коэффициентов корреляции между факторами. В MS Excel используем функцию МОПРЕД.
Если между факторами существует полная линейная зависимость, то все линейные коэффициенты межфакторной корреляции будут равны единице,
Det MR 0 , если же факторы вообще не связаны, то Det MR 1.
При проверке мультиколлинеарности рекомендуется пользоваться упро-
щенным критерием и сравнивать детерминант матрицы парной корреляции факторов с числом 0,3. Предлагается найти в литературе или в сети Интернет иные критерии проверки мультиколлинеарности. Осуществить процесс опреде-
ления и устранения факторов, ответственных за мультиколлинеарность.
Самый простой способ устранения мультиколлениарности – это устране-
ния факторов, ответственных за мультиколлинеарность. Для поиска перемен-
ной, ответственной за мультиколлениарность факторов, строят регрессии, где в
73
качестве зависимой переменной рассматривается каждый из факторов и устра-
няют тот фактор, связь которого с другими наиболее сильная.
b)Построение модели множественной линейной регрессии, вычисление средней ошибки аппроксимации. Проверка качества модели по критерию Фишера, частному критерию Фишера и критерию Стьюдента. Множественный индекс детерминации и коэффициент
корреляции.
Оценка параметров уравнения множественной регрессии производится с помощью метода наименьших квадратов. При этом оцениваются параметры линейного уравнения; если используется нелинейная модель, то производим сначала ее линеаризацию. При использовании функции ЛИНЕЙН выделяем
( m 1) столбцов и 5 строчек и получаем искомые значения
bm |
bm 1 |
b1 |
b0 |
mb |
mb |
mb |
mb |
m |
m 1 |
1 |
0 |
R 2 |
my |
|
|
F |
df2 |
S регрессии2 |
Sостаточная2 |
Не зависимо от форм связи показатель множественной корреляции может быть найден, как индекс множественной корреляции:
Ryx x |
|
|
1 |
остаточная2 |
x |
y2 |
|||
i x |
|
n |
|
Отметим, что Ryx2 1 x2 xm Ryx2 i max , то есть индекс детерминации больше
или равен максимальному индексу парной корреляции |
ryx x |
x |
|
|
ryx |
. |
|
1 2 |
|
m |
|
i max |
|
Статистическая значимость уравнения множественной регрессии в целом оценивается с помощью F-критерия Фишера, значение которого может быть найдено по формуле
F |
Dфакт |
|
|
R2 |
|
n m 1 |
D |
|
R2 |
m |
|||
|
1 |
|
||||
|
|
|
|
|
|
|
74
где m - число факторов, включенных в модель.
Наряду с этим критерием используется частный F-критерий Фишера для
обоснования включения фактора в модель.
F |
Ryx2 |
x x x |
Ryx2 |
x |
x |
x |
m |
n m 1 |
|||
1 |
2 i m |
|
1 |
i 1 |
i 1 |
|
|
|
|||
xi |
|
1 Ryx2 |
x x |
|
|
|
|
1 |
|
||
|
|
|
1 |
i |
m |
|
|
|
|
|
|
Найденное значение сравниваем с табличным значением Fтабл, рассчи- |
|||||||||||
танным с n m 1 степенями свободы. |
|
|
|
|
|
|
|||||
Если Fx превышает Fтабл, |
то включение фактора xi в модель, статиче- |
||||||||||
i |
|
|
|
|
|
|
|
|
|
|
|
ски оправданно и коэффициент регрессии bi |
статистически значим. |
Оценки значимости коэффициента чистой регрессии по t-критерию Сть-
юдента могут быть проведены также и с помощью частного F-критерия.
|
|
|
|
|
|
|
|
|
bi |
|
t |
b |
|
F |
t |
b |
|
||||
|
|
|||||||||
|
|
x |
|
|
|
mb |
||||
|
i |
|
i |
|
i |
|
||||
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
i |
|
Значение t сравнивается с |
табличным, за |
|
степень свободы берется |
n m 1 .
Если величина частного F-критерия больше табличного, то это не только указывает на значимость рассматриваемой регрессии, но и на значимость част-
ного коэффициента корреляции.
r 2 |
|
|
|
|
,x |
, ,x |
F |
|
|
|
|
||||
yx x ,x , ,x |
|
|
x |
|
|
|
|
||||||||
i 1 2 i 1 |
|
i 1 |
|
|
m |
|
i |
|
|
|
|
||||
c) Частные уравнения регрессии. |
|
|
|
|
|
|
|
|
|
|
|||||
На основе линейного уравнения регрессии могут быть найдены частные |
|||||||||||||||
уравнения регрессии |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
yx | x2 , x3 , , xm f x1 |
|
||||||||||||||
y |
1 |
| x , x |
3 |
, , x |
m |
f x |
2 |
|
|
||||||
|
x2 |
1 |
|
|
|
|
|
|
|
, |
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
y |
xm |
| x , x |
2 |
, , x |
m 1 |
f x |
m |
|
|||||||
|
1 |
|
|
|
|
|
|
|
|
то есть уравнения регрессии, которые связывают результативный признак y с
75
соответствующим фактором xi (i 1, m) при закреплении других, учитывае-
мых во множественной регрессии факторов, на среднем уровне. yx1 | x2 , x3 , , xm a b1 x1 b2 x2 bm xm
yx2 | x1 , x3 , , xm a b1 x1 b2 x2 bm xm
…
или в виде
yx1 | x2 , , xm A1 b1 x1 yx2 | x1 , , xm A2 b2 x2
…
где A1 a b2 x2 bm xm , A2 a b1x1 bm xm и т.д.
В отличие от парной регрессии, частные уравнения регрессии характери-
зуют изолированное влияние фактора на результат, при этом иные факторы за-
креплены на неизменном уровне.
Это позволяет на основе частных уравнений регрессии определять част-
ные коэффициенты эластичности.
Эyxi |
bi |
|
xi |
|
yˆ xi |
| x1 , x2 ,...xi 1 , xi 1 , , xm |
|||
|
|
Средние показатели коэффициента эластичности:
x
Эyi bi yˆ | x , xi ...,x
1 2 m
d)Построение уравнения регрессии в стандартизированном масштабе.
Анализ коэффициентов модели.
Уравнение регрессии в стандартизированном масштабе имеет вид:
|
|
|
|
ˆ |
|
|
2tx |
....... mtx |
, |
||||
|
|
|
|
t y 1tx |
|||||||||
|
|
|
|
|
1 |
|
|
|
2 |
|
m |
||
где t y |
y y |
, |
tx |
xi x |
– это стандартизированные переменные. Они обла- |
||||||||
y |
x |
||||||||||||
|
|
i |
|
|
|
|
|
|
|
|
|||
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0 , t2 |
t2 |
1. |
||||||
дают следующими свойствами – t |
y tx |
||||||||||||
|
|
|
|
|
|
|
|
|
i |
y |
xi |
|
76
– это стандартные коэффициенты регрессии, их находят при помощи МНК. В силу того, что все переменные t заданы, как центрированные, стан-
дартные коэффициенты сравнимы между собой.
По значениям стандартизированных коэффициентов регрессии можно ранжировать факторы по силе из воздействия на результат.
e)Расчет коэффициентов частной корреляции, сопоставление с коэффициентами модели в стандартизированном масштабе.
Частные коэффициенты (индексы) корреляции характеризуют тесноту связи между результатом и соответствующим фактором при устранении влия-
ния других факторов, включенных в уравнение регрессии.
С помощью частных коэффициентов корреляции можно проранжировать факторы по их степени влияния, а также они могут быть использованы при ре-
шении проблемы отбора факторов.
Показатели частной корреляции представляют собой отношения сокра-
щения остаточной дисперсии за счет дополнительного включения в анализ но-
вого фактора к остаточной дисперсии, имевший место до введения его в мо-
дель.
Сопоставление коэффициентов частной корреляции разного порядка по мере увеличения числа включаемых факторов показывает процесс «очищения» зависимости результативного признака с исследуемым фактором. При наличии m факторов коэффициент частной корреляции, измеряющий влияние на y
фактора xi при неизменном уровне других факторов определяется по формуле:
|
|
|
|
|
|
|
|
|
|
1 Ryx2 |
,x , ,x , ,x |
|||
ryx |
|
|
|
|
|
|
|
1 |
|
|
1 |
2 |
i |
m |
|
x , ,x |
,x ,x |
,x |
|
|
|
Ryx2 |
|
|
|
|
|||
i |
|
1 i 1 |
i i 1 |
|
m |
|
|
1 |
,x , ,x |
,x |
, ,x |
|||
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
1 |
2 |
i 1 |
i 1 |
m |
Ранжирование факторов по их воздействию на результат с помощью частных коэффициентов корреляции должно согласовываться со значениями параметров уравнения регрессии в стандартизированном масштабе i .
77
f)Проверка условий применимости МНК (обязательно критерии Гольдфельда-Квандта и Дарбина-Уотсона)
После проведенного анализа для построенной модели множественной ре-
грессии предлагается исключить (добавить) один или несколько факторов и осуществить построение новой, «улучшенной» модели. Указанные действия повторять до выбора наилучшей модели по имеющимся данным. Выбор наилучшей модели обосновать.
g)Прогноз цены для ряда квартир, не включенных в выборку и сопоставление прогнозных и реальных данных.
4.Методические указания по организации самостоятельной работы
4.1 Общие рекомендации для самостоятельной работы
Самостоятельная работа студентов является основным способом овладе-
ния учебным материалом в свободное от обязательных учебных занятий время.
Целями самостоятельной работы студентов являются:
- систематизация и закрепление полученных теоретических знаний и прак-
тических умений студентов;
-углубление и расширение теоретических знаний;
-формирование умений использовать нормативную, правовую, справоч-
ную документацию и специальную литературу;
-развитие познавательных способностей и активности студентов:
-формирования самостоятельности мышления, способностей к саморазви-
тию, самосовершенствованию и самореализации.
Запланированная в учебном плане самостоятельная работа студента рас-
сматривается как связанная либо с конкретной темой изучаемой дисциплины,
либо с подготовкой к курсовой, дипломной работе, а также к защите ВКР. В
данном разделе рассматривается только самостоятельная работа первого вида.
Самостоятельная работа выполняется в два этапа: планирование и реали-
зация.
Планирование самостоятельной работы включает:
78
-уяснение задания на самостоятельную работу;
-подбор рекомендованной литературы;
-составление плана работы, в котором определяются основные пункты предстоящей подготовки.
Составление плана дисциплинирует и повышает организованность в рабо-
те.
На втором этапе реализуется составленный план. Реализация включает в себя:
-изучение рекомендованной литературы;
-составление плана (конспекта) по изучаемому материалу (вопросу);
-взаимное обсуждение материала.
Необходимо помнить, что на лекции обычно рассматривается не весь ма-
териал. Оставшийся восполняется в процессе самостоятельной работы. В связи с этим работа с рекомендованной литературой обязательна.
Работа с литературой и иными источниками информации включает в себя две группы приемов: техническую, имеющую библиографическую направлен-
ность, и содержательную. Первая группа – уяснение потребностей в литерату-
ре; получение литературы; просмотр литературы на уровне общей, первичной оценки; анализ надежности публикаций как источника информации, их отно-
симости и степени полезности. Вторая – подробное изучение и извлечение не-
обходимой информации.
Для поиска необходимой литературы можно использовать следующие спо-
собы:
-поиск через систематический каталог в библиотеке;
-просмотр специальных периодических изданий;
-использование материалов, размещенных в сети Интернет.
Для того, чтобы не возникало трудностей понимания текстов учебника,
монографий, научных статей, следует учитывать, что учебник и учебное посо-
бие предназначены для студентов и магистрантов, а монографии и статьи ори-
79
ентированы на исследователя. Монографии дают обширное описание пробле-
мы, содержат в себе справочную информацию и отражают полемику по тем или иным дискуссионным вопросам. Статья в журнале кратко излагает позицию ав-
тора или его конкретные достижении в исследовании какой-либо научной про-
блемы.
В процессе взаимного обсуждения материала закрепляются знания, а также приобретается практика в изложении и разъяснении полученных знаний, разви-
вается речь.
При необходимости студенту следует обращаться за консультацией к пре-
подавателю.
Составление записей или конспектов позволяет составить сжатое пред-
ставление по изучаемым вопросам. Записи имеют первостепенное значение для самостоятельной работы студентов. Они помогают понять построение изучае-
мого материала, выделить основные положения, проследить их логику.
Ведение записей способствует превращению чтения в активный процесс. У
студента, систематически ведущего записи, создается свой индивидуальный фонд подсобных материалов для быстрого повторения прочитанного. Особенно важны и полезны записи тогда, когда в них находят отражение мысли, возник-
шие при самостоятельной работе.
Можно рекомендовать следующие основные формы записи: план, кон-
спект, тезисы, презентация.
План – это схема прочитанного материала, краткий (или подробный) пере-
чень вопросов, отражающих структуру и последовательность материала. По-
дробно составленный план вполне заменяет конспект.
Конспект – это систематизированное, логичное изложение материала ис-
точника. Объем конспекта не должен превышать 10 страниц. Шрифт Times New Roman, кегль 14, интервал 1,5. Список литературы должен состоять из 5-8
источников, по возможности следует использовать последние издания учебных пособий и исследований.
80