- •И.А. Калашникова с.И. Моисеев эконометрика Учебное пособие
- •Воронеж 2013
- •И.А. Калашникова с.И. Моисеев эконометрика
- •Введение
- •Тема 1. Введение в эконометрику
- •Экономические модели должны отвечать ряду требований. К ним относятся:
- •Создание любой теоретической модели, в том числе и экономической, проходит несколько этапов:
- •Тема 2. Предмет эконометрика
- •Тема 3. Парная линейная регрессия и корреляция
- •Критические значения распределения Стьюдента
- •Тема 4. Парная нелинейная регрессия и корреляция
- •Тема 5. Множественная регрессия и корреляция
- •Решение. На основании исходных данных составляем систему уравнений (1) для определения коэффициентов и . Находим коэффициенты системы, вычисляя суммы:
- •Критические точки распределения f Фишера
- •Тема 6. Специальные методы построения регрессионных моделей. Предпосылки метода наименьших квадратов
- •Фиктивные переменные во множественной регрессии
- •Тема 7. Системы эконометрических уравнений
- •Тема 8. Временные ряды
- •Тема 9. Динамические эконометрические модели
- •Заключение
- •Библиографический список
- •Глоссарий
- •Оглавление
- •394026 Воронеж, Московский просп., 14
Тема 3. Парная линейная регрессия и корреляция
1. Статистическая зависимость (независимость) случайных переменных.
2. Анализ линейной статистической связи экономических данных.
Статистическая зависимость (независимость)
случайных переменных.
Экономические явления, обладая большим разнообразием, характеризуются множеством признаков, отражающих те или иные их свойства. Эти признаки изменяются (варьируются) во времени и пространстве. Нередко изменения признаков взаимозависимы и взаимообусловлены. В одних случаях связь (зависимость) между признаками оказывается очень тесной (например, часовая выработка и заработная плата), а в других случаях связь между признаками вовсе не обнаруживается или выражается очень слабо (например, пол студентов и их успеваемость). Чем теснее связь между признаками, тем точнее принимаемые решения и легче управление системами.
Среди многих форм связей явлений важнейшую роль играет причинная, определяющая все другие формы. Сущность причинности состоит в порождении одного явления другим. В любой конкретной связи одни признаки выступают в качестве факторов, воздействующих на другие и обусловливающие их изменение, другие - в качестве результатов действия этих факторов. Иными словами, одни представляют собой причину, другие - следствие. Признаки, характеризующие следствие, называются результативными (зависимыми, объясняемыми переменными у), признаки, характеризующие причины - факторными (независимыми, объясняющими переменными x).
Различают два типа зависимости между явлениями и их признаками: функциональную* или жестко детерминированную (например, зависимость выработки продукции па одного рабочего от объема выпушенной продукции и численности рабочих), и статистическую* или стохастически детерминированную (например, зависимость между производительностью труда и себестоимостью единицы продукции).
Для социально-экономических явлений характерно то, что наряду с существенными факторами на них оказывают воздействие многие другие, в том числе случайные факторы. В связи с этим существующая зависимость не проявляется здесь в каждом отдельном случае, как при функциональных связях, а лишь «в общем и среднем» при большом числе наблюдений. В этом случае говорят о статистической зависимости. Частным случаем статистической зависимости является корреляционная зависимость.
Корреляционная связь является «неполной» зависимостью, которая проявляется не в каждом отдельном случае, а только в средних величинах при достаточно большом числе случаев.
Функциональная связь всегда выражается формулами, что в большей степени присуще точным наукам (математике, физике), с одинаковой силой проявляется у всех единиц совокупности, является полной и точной, так как обычно известен перечень всех факторов и механизм их воздействия на переменную в виде уравнения.
Корреляционная зависимость – это разнообразие факторов, их взаимосвязи и противоречивые действия вызывают широкое варьирование переменной у . Она обнаруживается не в единичных случаях, а в массе и требует для своего исследования массовых наблюдений . Связь между переменными х и у неполная и проявляется лишь в средних величинах.
Функциональная и корреляционная связь в зависимости от направления действия бывает прямая и обратная. По аналитическому выражению зависимость может быть прямолинейной (линейной) и криволинейной (нелинейной). В зависимости от количества признаков, включенных в модель, корреляционные связи делят на однофакторные и многофакторные.
Корреляционная зависимость исследуется с помощью методов корреляционного и регрессионного анализа.
Корреляционно-регрессионный анализ проводится поэтапно в определенной логической последовательности.
Корреляционно-регрессионный анализ проводится поэтапно в определенной логической последовательности. Этапы проведения комплексного корреляционно-регрессионного анализа следующие:
1. Предварительный анализ явлений и выявление причин возникновения взаимосвязей между признаками, характеризующими эти явления
2. Разделение признаков на факторные и результативные, выбор наиболее существенных признаков для их исследования на предмет включения в корреляционно-регрессионные модели
3. Построение матрицы коэффициентов парной корреляции и оценка возможных вариантов группировки признаков корреляционно-регрессионных моделей
4. Предварительная оценка формы уравнения регрессии
5. Решение уравнения регрессии, вычисление коэффициентов регрессии и их смысловая интерпретация
6. Расчет теоретически ожидаемых (воспроизведенных по уравнению регрессии) значений результативного признака
7. Определение и сравнительный анализ дисперсий: обшей, факторной и остаточной; оценка тесноты связи между признаками, включенными в регрессионную модель
8. Общая оценка качеств; модели, отсев несущественных (или включение дополнительных) факторов, построение модели, т.е. повторение п. 1—7
9. Статистическая оценка достоверности параметров уравнения регрессии, построение доверительных границ для теоретически ожидаемых по уравнению регрессии значений функции
10. Практические выводы из анализа
Наиболее разработанной в эконометрике является методология парной линейной корреляции, рассматривающая влияние вариации переменной x на переменную у и представляющая собой однофакторный корреляционный и регрессионный анализ.
Анализ линейной статистической связи экономических данных.
Одной из важнейших задач эконометрических исследований является задача выявления связей между факторами, влияния одного фактора на другой. Такие задачи изучаются разделами прикладной математики и статистики – в регрессионном и корреляционном анализе.
Рассмотрим два показателя Х и Y. Предположим, что они зависимы, то есть изменение одного из них влечет за собой изменение другого. Если при этом, зная точно значение одного показателя можно точно определить значение другого, то связь между показателями называется функциональной. Например, зная точно объем проданного за день товара можно точно рассчитать выручку от его продаж. Однако на практике в подавляющем большинстве случаев встречаются зависимости иного вида, когда изменение одного показателя лишь в среднем приводит к изменению другого. Такие зависимости называются статистическими. Для них, зная значение Х, нельзя точно определить Y, так как на Y кроме Х влияет еще множество неучтенных факторов. Поэтому, зная Х можно лишь в среднем оценить значение Y. Примеры таких зависимостей в экономике: зависимости между ценой и спросом или предложением (функции спроса и предложения), между объемом произведенной продукции и затратами ресурсов (производственные функции), между доходом и потреблением и т.д. Характер статистической зависимости изучается в регрессионном анализе, а сила статистической связи – в корреляционном анализе.
Предположим, что экономисту необходимо исследовать зависимость между показателями Х и Y. Такая зависимость называется парной. Для этого он измеряет в разных условиях значения показателя Х и одновременно значения Y, получая выборки пар значений . Необходимо определить характер статистической зависимости между Х и Y, то есть уравнение вида , которое позволяет по значению переменной x оценить в среднем значение y, спрогнозировав его. Это уравнение называется уравнением регрессии. Для нахождения уравнения регрессии используется метод наименьших квадратов, согласно которому среди всех возможных уравнений регрессии наилучшим является то, для которого сумма квадратов отклонений линии регрессии от опытных данных будет минимальна.
Рассмотрим простейший случай уравнения регрессии – линейную регрессию, когда уравнение регрессии имеет вид прямой линии: . Можно показать, что в соответствии с методом наименьших квадратов для нахождения неизвестных параметров а и b нужно использовать следующие формулы:
a = , b = , (3.1)
где = (x1+x2+…+xn), = (y1+y2+…+yn),
= (x12+x22+…+xn2), = (x1y1+x2y2+…+xnyn). (3.2)
Для проверки полученных результатов можно построить график, на который наносятся исходные точки и линия регрессии (пример 1).
Рассмотрим теперь вопрос оценки качества статистической связи. Мерой оценки силы статистической зависимости между показателями Х и Y служит коэффициент парной корреляции , который в случае линейной связи между факторами вычисляется по формуле (3.3):
rxy = , (3.3)
где = (y 1 2 + y 2 2 +… + y n 2), остальные параметры вычисляются по формулам (2).
Коэффициент корреляции обладает следующими свойствами:
1. Коэффициент корреляции изменяется в пределах .
2. Модуль коэффициента корреляции характеризует силу статистической связи, чем больше , тем сильнее связь, в частности если , то связь функциональная, если близок к нулю, то связь слабая или отсутствует.
3. Знак коэффициента корреляции характеризует направление статистической связи, если , то с ростом Х показатель Y также растет, если , то с ростом Х показатель Y убывает.
4. Величина называется коэффициентом детерминации, его можно интерпретировать как среднюю долю влияния показателя Х на Y.
Для ответа на вопрос: можно ли считать связь между показателями достаточно сильной, чтобы считать Х и Y зависимыми и уравнение их регрессии имело смысл, используется методика проверки значимости коэффициента корреляции. При проверке исследователем задается некоторая маленькая вероятность , называемая уровнем значимости. Он имеет смысл вероятности совершить ошибку, заключающуюся в принятии предположения о независимости показателей, в то время, когда они зависимы. Вместо иногда задают величину р = 1- , называемую доверительной вероятностью. Ее можно интерпретировать как вероятность, с которой можно доверять полученному результату. На практике обычно выбирают =0,1; 0,05 или 0,01.
Далее, задав или р , для случая парной линейной регрессии вычисляется величина t по формуле (3.4):
t = . (3.4)
По специальной таблице, называемой критическими значениями распределения Стьюдента, которая приведена в табл. 1, определяется критическое значение данной величины . Если , то можно считать, что коэффициент корреляции значим, показатели Х и Y зависимы, уравнение регрессии можно использовать для прогнозов и оценок. Если , то коэффициент корреляции незначим, показатели Х и Y независимы, уравнение регрессии теряет смысл.
Таблица 1