Дисперсия это в эконометрике – Тема 1. Обзор понятий и формулы вычисления: ковариации, дисперсии и корреляции. Эконометрика: основные понятия и определения
Дисперсия, формула дисперсии, виды дисперсии, простая дисперсия, взвешенная дисперсия
Понятие дисперсии
Дисперсия в статистике находится как среднее квадратическое отклонение индивидуальных значений признака в квадрате от средней арифметической. В зависимости от исходных данных она определяется по формулам простой и взвешенной дисперсий:
1. Простая дисперсия (для несгруппированных данных) вычисляется по формуле:
2. Взвешенная дисперсия (для вариационного ряда): где n — частота (повторяемость фактора Х)Пример нахождения дисперсии
На данной странице описан стандартный пример нахождения дисперсии, также Вы можете посмотреть другие задачи на её нахождение
Пример 1. Имеются следующие данные по группе из 20 студентов заочного отделения. Нужно построить интервальный ряд распределения признака, рассчитать среднее значение признака и изучить его дисперсию
Построим интервальную группировку. Определим размах интервала по формуле: где X max– максимальное значение группировочного признака;n – количество интервалов: Принимаем n=5. Шаг равен: h = (192 — 159)/ 5 = 6,6
Составим интервальную группировку
Для дальнейших расчетов построим вспомогательную таблицу: X’i– середина интервала. (например середина интервала 159 – 165,6 = 162,3)Среднюю величину роста студентов определим по формуле средней арифметической взвешенной:
Определим дисперсию по формуле:Пример 2. Определение групповой, средней из групповой, межгрупповой и общей дисперсии
Пример 3. Нахождение дисперсии и коэффициента вариации в группировочной таблице
Пример 4. Нахождение дисперсии в дискретном ряду
Из этой формулы следует, что дисперсия равна разности средней из квадратов вариантов и квадрата и средней.
Дисперсия в вариационных рядах с равными интервалами по способу моментов может быть рассчитана следующим способом при использовании второго свойства дисперсии (разделив все варианты на величину интервала). Определении дисперсии, вычисленной по способу моментов, по следующей формуле менее трудоемок:
где i — величина интервала;
А — условный ноль, в качестве которого удобно использовать середину интервала, обладающего наибольшей частотой;
m2 — момент второго порядка
Дисперсия альтернативного признака (если в статистической совокупности признак изменяется так, что имеются только два взаимно исключающих друг друга варианта, то такая изменчивость называется альтернативной) может быть вычислена по формуле:
Подставляя в данную формулу дисперсии q =1- р, получаем:
Виды дисперсии
Общая дисперсия измеряет вариацию признака по всей совокупности в целом под влиянием всех факторов, обуславливающих эту вариацию. Она равняется среднему квадрату отклонений отдельных значений признака х от общего среднего значения х и может быть определена как простая дисперсия или взвешенная дисперсия.
Внутригрупповая дисперсия характеризует случайную вариацию, т.е. часть вариации, которая обусловлена влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Такая дисперсия равна среднему квадрату отклонений отдельных значений признака внутри группы X от средней арифметической группы и может быть вычислена как простая дисперсия или как взвешенная дисперсия.
Таким образом, внутригрупповая дисперсия измеряет вариацию признака внутри группы и определяется по формуле:
где хi — групповая средняя;
Например, внутригрупповые дисперсии, которые надо определить в задаче изучения влияния квалификации рабочих на уровень производительности труда в цехе показывают вариации выработки в каждой группе, вызванные всеми возможными факторами (техническое состояние оборудования, обеспеченность инструментами и материалами, возраст рабочих, интенсивность труда и т.д.), кроме отличий в квалификационном разряде (внутри группы все рабочие имеют одну и ту же квалификацию).
Средняя из внутри групповых дисперсий отражает случайную вариацию, т. е. ту часть вариации, которая происходила под влиянием всех прочих факторов, за исключением фактора группировки. Она рассчитывается по формуле:
Межгрупповая дисперсия характеризует систематическую вариацию результативного признака, которая обусловлена влиянием признака-фактора, положенного в основание группировки. Она равняется среднему квадрату отклонений групповых средних от общей средней. Межгрупповая дисперсия рассчитывается по формуле:
Правило сложения дисперсии в статистике
Согласно правилу сложения дисперсий общая дисперсия равна сумме средней из внутригрупповых и межгрупповых дисперсий:
Смысл этого правила заключается в том, что общая дисперсия, которая возникает под влиянием всех факторов, равняется сумме дисперсий, которые возникают под влиянием всех прочих факторов, и дисперсии, возникающей за счет фактора группировки.
Свойства дисперсии
1. Если все значения признака уменьшить (увеличить) на одну и ту же постоянную величину, то дисперсия от этого не изменится.
2. Если все значения признака уменьшить (увеличить) в одно и то же число раз n, то дисперсия соответственно уменьшится (увеличить) в n^2 раз.
Источник: Балинова B.C. Статистика в вопросах и ответах: Учеб. пособие. — М.: ТК. Велби, Изд-во Проспект, 2004. — 344 с.
univer-nn.ru
2. Ковариация, дисперсия и корреляция
2.1. Выборочная ковариация
Выборочная ковариация является мерой взаимосвязи между двумя переменными. При наличии наблюдений двух переменных (и) выборочная ковариация междуизадается формулой:
. (2.1)
В разделе 2.4 мы определим также ковариацию генеральной совокупности. Для различения этих ковариаций мы используем обозначение с прописной буквыприменительно к выборочной ковариации и– для ковариации междуив генеральной совокупности. Иногда последнюю выгодно будет обозначить как. Аналогичные обозначения мы используем и для дисперсии:— применительно к выборочной дисперсии ик дисперсии для генеральной совокупности (теоретической).
Сформулируем основные правила расчета ковариации.
Правило 1. Если , то.
Доказательство:
.
Правило 2. Если , где– константа, то.
Доказательство:
.
Правило 3. Если , где– константа, то.
Доказательство: .
2.2. Альтернативное выражение для выборочной ковариации
Другим эквивалентным выражением для выборочной ковариации между иявляется
(2.2)
Формула (2.2) оказывается более удобной при ручном расчете ковариации.
Приведем доказательство эквивалентности выражений (2.1) и (2.2).
.
В результате сложения по столбцам, а также воспользовавшись тем, что и, получим
.
2.3. Теоретическая ковариация
Если и– случайные величины, то теоретическая ковариацияопределяется как математическое ожидание произведения отклонений этих величин от их средних значений:
, (2.3)
где и– теоретические средние значенияисоответственно.
Если теоретическая ковариация неизвестна, то для ее оценки может быть использована выборочная ковариация, вычисленная по ряду наблюдений. К сожалению, оценка будет иметь отрицательное смещение, т.к.
. (2.4)
Причина заключается в том, выборочные отклонения измеряются по отношению к выборочным средним значениям величин ии имеют тенденцию к занижению отклонений от истинных средних значений. Очевидно, мы можем рассчитать несмещенную оценку путем умножения выборочной оценки на. Доказательство соотношения (2.4) можно провести аналогично тому, как это сделано в разделе 1.7. Правила для теоретической ковариации такие же, как и для выборочной ковариации.
Если инезависимы, то их теоретическая ковариация равна нулю, поскольку
, (2.5)
благодаря свойству независимости и факту, что иравняется соответственнои.
2.4. Выборочная дисперсия
Для выборки из наблюденийвыборочная дисперсия определяется как среднеквадратичное отклонение в выборке:
(2.6)
Определенная таким образом выборочная дисперсия представляет собой смещенную оценку теоретической дисперсии. В разделе 1.7 показано, что , определенная как
,
является несмещенной оценкой . Отсюда следует, что ожидаемое значение величиныравнои что, следовательно, она имеет отрицательное смещение. Отметим, что если размер выборкистановится большим, тостремится к единице и, таким образом, математическое ожидание величиныстремится к. Можно легко показать, что ее предел по вероятностиравени, следовательно, она является примером состоятельной оценки, которая смещена для небольших выборок.
Условимся по аналогии с ковариацией обозначать теоретическую (или генеральную) дисперсию переменной какили, если это удобно,
Почему выборочная дисперсия в среднем занижает значение теоретической дисперсии? Причина заключается в том, что она вычисляется как среднеквадратичное отклонение от выборочного среднего, а не от истинного значения. Т.к. выборочное среднее автоматически находится в центре выборки, то отклонения от него в среднем меньше отклонений от теоретического среднего значения.
2.5. Правила расчета дисперсии
Прежде, чем сформулируем и докажем основные правила расчета дисперсии, заметим, что дисперсия переменной
.
Учитывая это равенство, мы можем воспользоваться правилами расчета выборочной ковариации, чтобы вывести правила расчета дисперсии. Кроме того, мы можем получить другую формулу для представления , используя соотношение (2.2) для выборочной ковариации.
. (2.7)
Правило 1. Если , то.
Доказательство:
.
Правило 2. Если , где– константа, то.
Доказательство:
.
Правило 3.Если , где– константа, то.
.
Правило 4. Если , где – константа, то .
Доказательство:
.
Теоретическая дисперсия подчиняется тем же самым правилам, но доказательства здесь опускаются, поскольку они требуют применения интегрального исчисления.
2.6. Теоретическая дисперсия выборочного среднего
Если две переменные независимы (а, следовательно, их совокупная ковариация равняется нулю), то теоретическая дисперсия суммы этих переменных будет равна сумме этих теоретических дисперсий:
Из данного результата можно получить более общее правило о том, что теоретическая дисперсия суммы любого числа переменных равняется сумме их дисперсий при условии, что если случайная переменная имеет дисперсию, то дисперсия выборочного среднегобудет равна, где– число наблюдений в выборке:
. (2.9)
Как было показано в обзоре, выборочное среднее является наиболее эффективной несмещенной оценкой теоретического среднего при условии, что наблюдения проводятся независимо друг от друга на основе одного и того же распределения.
2.7. Коэффициент корреляции
По сравнению с ковариацией более точной мерой зависимости является тесно связанный с ней коэффициент корреляции. Подобно дисперсии и ковариации, коэффициент корреляции имеет две формы: теоретическую и выборочную. Теоретический коэффициент корреляции традиционно обозначается греческой буквой . Для переменныхиэтот коэффициент обозначается следующим образом:
. (2.10)
Если инезависимы, торавен нулю, т.к. равна нулю теоретическая ковариация. Если между переменными существует положительная зависимость, то, а следовательно, ибудут положительными. Если существует строгая положительная линейная зависимость, топримет максимальное значение, равное 1. Аналогичным образом при отрицательной зависимостибудет отрицательным с минимальным значением –1.
Выборочный коэффициент корреляции –определяется путем замены теоретических значений дисперсии и ковариации в выражении (2.10) на их несмещенные оценки. Мы показали, что такие оценки могут быть получены умножением выборочных дисперсии и ковариации на. Следовательно,
, (2.11)
или
. (2.12)
Подобно величине ,имеет максимальное значение, равное единице, которое получается при строгой линейной положительной зависимости между выборочными значениямии(когда на диаграмме рассеяния все точки находятся точно на восходящей прямой линии). Аналогичным образомпринимает значение –1, когда существует линейная отрицательная зависимость (точки лежат точно на нисходящей прямой линии). Величинапоказывает, что зависимость между наблюдениямиив выборке отсутствует. Разумеется, тот факт, что, необязательно означает, что, и наоборот.
Коэффициент корреляции является более подходящим измерителем зависимости, чем ковариация. Основная причина этого заключается в том, что ковариация зависит от единиц, в которых измеряются переменные и, в то время, как коэффициент корреляции есть величина безразмерная.
2.8. Коэффициент частной корреляции
Анализ критериев значимости для коэффициента корреляции будет дан в главе 4, где эти показатели рассматриваются вместе с критериями значимости коэффициентов регрессии. Будет выяснено, что в примере со спросом на такой, например товар, как бензин, коэффициент корреляции незначимо отличается от нуля, что кажется неправдоподобным с точки зрения здравого смысла.
Одна из причин получения такого результата заключается в очень небольшом размере выборки (). Возможно, что при большом размере выборки оказалось бы, что коэффициент корреляции значимо отличается от нуля. Здесь, однако, есть и еще одна причина для получения отрицательного результата: мы не учитывали влияние увеличения дохода на потребительский спрос в целом и на спрос на бензин в частности. Положительный эффект увеличения дохода в основном компенсировал отрицательный эффект роста цен, и, таким образом, спрос на бензин оставался стабильным. Следующий этап исследования состоит в выделении влияния этих двух факторов. Мы можем сделать это, используя так называемый коэффициент частной корреляции, который определяется следующим образом:
, (2.13)
где – коэффициент частной корреляции междуив случае постоянства воздействия величины, аи– обычные коэффициенты корреляции междуи,и,исоответственно.
studfiles.net
Коэффициент корреляции и коэффициент детерминации
Эмпирический коэффициент детерминации
Эмпирический коэффициент детерминации широко используется в задачах статистики и является показателем, который представляет долю межгруппопой дисперсии в общей дисперсии результативного признака и характеризует силу влияния группировочного признака на образование общей вариации. Он может быть рассчитан по формуле:
Данный коэффициент показывает долю вариации результативного признака у под влиянием фактора х. При отсутствии связи эмпирический коэффициент детерминации равен нулю, а при функциональной сильной связи — единице.
Эмпирическое корреляционное отношение
Эмпирическое корреляционное отношение представляется как корень квадратный из эмпирического коэффициента детерминации. Оно показывает тесноту связи между статистическими данными и определяется по формуле:
где числитель — дисперсия групповых средних;
знаменатель — общая дисперсия.
Корреляционное отношение равно нулю, если связи между данными нет. В таком случае все групповые средние будут равны между собой и межгрупповой вариации не будет.
Корреляционное отношение равно единице тогда, когда связь функциональная. В этом случае дисперсия групповых средних будет равна общей дисперсии, т. е. внутригрупповой вариации не будет.
Чем значения корреляционного отношения ближе к единице, тем сильнее, ближе к функциональной зависимости связь между признаками.
Критерий Пирсона
Критерий Пирсона вычисляется по формуле:
где fэ и fт — эмпирические и теоретические частоты.
С помощью критерия Пирсона по таблицам определяют вероятность P(х^2). Входами в таблицу являются значения х^2 и число степеней свободы k = n — р -1.
Если Р > 0,05, то считается, что эмпирические и теоретические распределения близки. При Р принадлежащим [0,02; 0,05] совпадение между ними удовлетворительное, а в других случаях — недостаточное.
Коэффициент асимметрии
Коэффициент асимметрии рассчитывается по формуле:
где числитель — центральный момент третьего порядка.
б^3 — куб среднего квадратичного отклонения.
Коэффициент асимметрии является безмерной величиной, что позволяет использовать его для различных распределений. При левосторонней асимметрии Mо > Mt > xср, при правосторонней — обратные соотношения. Это позволяет применять наиболее простой показатель асимметрии:
Эксцесс в статистике
Эксцесс есть степень крутости эмпирического распределения по отношению к нормальному. Он определяется по формуле:
где числитель — центральный момент четвертого порядка
Когда распределение островершинное по отношению к нормальному, эксцесс будет положительным, если плосковершинное — отрицательным. Для нормального распределения Е = 0.
Источник: Балинова B.C. Статистика в вопросах и ответах: Учеб. пособие. — М.: ТК. Велби, Изд-во Проспект, 2004. — 344 с.
univer-nn.ru
Определения по эконометрике – Сдал на 10! Ответы на вопросы по учёбе
T-отношение (t-критерий) — отношение оценки коэффициента, полученной с помощью МНК, к величине стандартной ошибки оцениваемой величины.
Аддитивная модель временного ряда – это модель, в которой временной ряд представлен как сумма перечисленных компонент.
Критерий Фишера — способ статистической проверки значимости уравнения регрессии, при котором расчетное (фактическое) значение F-отношения сравнивается с его критическим (теоретическим) значением.
Линейная регрессия — это связь (регрессия), которая представлена уравнением прямой линии и выражает простейшую линейную зависимость.
Метод инструментальных переменных — это разновидность МНК. Используется для оценки параметров моделей, описываемых несколькими уравнениями. Главное свойство — частичная замена непригодной объясняющей переменной на такую переменную, которая некоррелированна со случайным членом. Эта замещающая переменная называется инструментальной и приводит к получению состоятельных оценок параметров.
Метод наименьших квадратов (МНК) — способ приближенного нахождения (оценивания) неизвестных коэффициентов (параметров) регрессии. Этот метод основан на требовании минимизации суммы квадратов отклонений значений результата, рассчитанных по уравнению регрессии, и истинных (наблюденных) значений результата.
Множественная линейная регрессия — это множественная регрессия, представляющая линейную связь по каждому фактору.
Множественная регрессия — регрессия с двумя и более факторными переменными.
Модель идентифицируемая — модель, в которой все структурные коэффициенты однозначно определяются по коэффициентам приведенной формы модели.
Модель рекурсивных уравнений — модель, которая содержит зависимые переменные (результативные) одних уравнений в роли фактора, оказываясь в правой части других уравнений.
Мультипликативная модель – модель, в которой временной ряд представлен как произведение перечисленных компонент.
Несмещенная оценка — оценка, среднее которой равно самой оцениваемой величине.
Нулевая гипотеза — предположение о том, что результат не зависит от фактора (коэффициент регрессии равен нулю).
Обобщенный метод наименьших квадратов (ОМНК) — метод, который не требует постоянства дисперсии (гомоскедастичности) остатков, но предполагает пропорциональность остатков общему множителю (дисперсии). Таким образом, это взвешенный МНК.
Объясненная дисперсия — показатель вариации результата, обусловленной регрессией.
Объясняемая (результативная) переменная — переменная, которая статистически зависит от факторной переменной, или объясняющей (регрессора).
Остаточная дисперсия — необъясненная дисперсия, которая показывает вариацию результата под влиянием всех прочих факторов, неучтенных регрессией.
Предопределенные переменные — это экзогенные переменные системы и лаговые эндогенные переменные системы.
Приведенная форма системы — форма, которая, в отличие от структурной, уже содержит одни только линейно зависящие от экзогенных переменных эндогенные переменные. Внешне ничем не отличается от системы независимых уравнений.
Расчетное значение F-отношения — значение, которое получают делением объясненной дисперсии на 1 степень свободы на остаточную дисперсию на 1 степень свободы.
Регрессия (зависимость) — это усредненная (сглаженная), т. е. свободная от случайных мелкомасштабных колебаний (флуктуаций), квазидетерминированная связь между объясняемой переменной (переменными) и объясняющей переменной (переменными). Эта связь выражается формулами, которые характеризуют функциональную зависимость и не содержат явно стохастических (случайных) переменных, которые свое влияние теперь оказывают как результирующее воздействие, принимающее вид чисто функциональной зависимости.
Регрессор (объясняющая переменная, факторная переменная) — это независимая переменная, статистически связанная с результирующей переменной. Характер этой связи и влияние изменения (вариации) регрессора на результат исследуются в эконометрике.
Система взаимосвязанных уравнений — это система одновременных или взаимозависимых уравнений. В ней одни и те же переменные выступают одновременно как зависимые в одних уравнениях и в то же время независимые в других. Это структурная форма системы уравнений. К ней неприменим МНК.
Система внешне не связанных между собой уравнений — система, которая характеризуется наличием одних только корреляций между остатками (ошибками) в разных уравнениях системы.
Случайный остаток (отклонение) — это чисто случайный процесс в виде мелкомасштабных колебаний, не содержащий уже детерминированной компоненты, которая имеется в регрессии.
Состоятельные оценки — оценки, которые позволяют эффективно применять доверительные интервалы, когда вероятность получения оценки на заданном расстоянии от истинного значения параметра становится близка к 1, а точность самих оценок увеличивается с ростом объема выборки.
Спецификация модели — определение существенных факторов и выявление мультиколлинеарности.
Стандартная ошибка — среднеквадратичное (стандартное) отклонение. Оно связано со средней ошибкой и коэффициентом доверия.
Степени свободы — это величины, характеризующие число независимых параметров и необходимые для нахождения по таблицам распределений их критических значений.
Тренд — основная тенденция развития, плавная устойчивая закономерность изменения уровней ряда.
Уровень значимости — величина, показывающая, какова вероятность ошибочного вывода при проверке статистической гипотезы по статистическому критерию.
Фиктивные переменные — это переменные, которые отражают сезонные компоненты ряда для какого-либо одного периода.
Эконометрическая модель — это уравнение или система уравнений, особым образом представляющие зависимость (зависимости) между результатом и факторами. В основе эконометрической модели лежит разбиение сложной и малопонятной зависимости между результатом и факторами на сумму двух следующих компонентов: регрессию (регрессионная компонента) и случайный (флуктуационный) остаток. Другой класс эконометрических моделей образует временные ряды.
Эффективность оценки — это свойство оценки обладать наименьшей дисперсией из всех возможных.
sdalna10.com
Задача №22. Виды дисперсии и их расчёт
Имеются данные о распределении семей сотрудников финансовой корпорации по количеству детей:
Число детей | Число семей сотрудников по подразделениям | ||
---|---|---|---|
первое | второе | третье | |
0 | 4 | 7 | 5 |
1 | 6 | 10 | 13 |
2 | 3 | 3 | 3 |
3 | 2 | 1 | — |
Вычислить:
а) внутригрупповые дисперсии;
б) среднюю из внутригрупповых дисперсий;
в) межгрупповую дисперсию;
г) общую дисперсию;
Проверьте правильность произведения расчётов с помощью правила сложения дисперсий.
Решение:
Совокупность семей сотрудников финансовой корпорации разбита на три группы по количеству детей.
а) Групповая дисперсия равна среднему квадрату отклонений отдельных значений признака внутри группы от средней арифметической этой группы. Внутригрупповые дисперсии вычисляются по формуле:
Нахождению внутригрупповой дисперсии предшествует расчёт средней арифметической по каждой группе.
Рассчитаем внутригрупповые дисперсии:
б) Средняя из внутригрупповых дисперсий – это средняя арифметическая взвешенная из дисперсий групповых:
в) Межгрупповая дисперсия равна среднему квадрату отклонений групповых средних от общей средней:
Для её расчета необходимо вычислить общую среднюю:
Определим межгрупповую дисперсию:
Вычислим общую дисперсию обычным способом:
Проверим полученный результат, исчислив общую дисперсию по правилу сложения дисперсий: общая дисперсия равна сумме средней из внутригрупповых дисперсий и межгрупповой дисперсии:
ecson.ru
Эконометрика
Эконометрика
Наиболее распространённым в эконометрике методом является метод Монте-Карло.
Метод Монте-Карло, в конечном счете, заключается в том, что многократно повторяется расчет экономический по сымитированным моделям.
Метод имитации очень принятый метод в эконометрике.
Специфика экономических данных
Поскольку значительный блок эконометрического инструментария составляют методы математической статистике, поскольку эти методы связаны с вероятностной природой данных, то этот инструментарий применим только в случае соблюдения условий «статистического ансамбля», то есть много кратного воспроизведения эксперимента, наблюдения, в идентичных условиях.
Но для большинства явлений в экономике такое требование не соблюдается и поэтому экономические процессы развиваются по уникальной траектории. Поэтому экономические данные, которые собираются для эконометрических исследований, должны иметь следующие особенности:
1) Многие экономические показатели не отрицательны. Их надо описывать не отрицательными случайными величинами
2) По сравнению с другими науками, в экономике доля не числовых данных существенно выше, поэтому к ним легче применять методы статистики объектов не числовой природы (по цветы, по гамме, по запаху)
3) Неопределенность в экономике корректно описывается не только в терминах вероятностно-статистических моделей, но и в терминах других наук, в частности математика и статистика интервалов.
Как применяется Эконометрика на практике.
Выделяют два направления применимости:
для прогноза экономических показателей состояния и развития анализируемой системы;
Имитация различных возможных сценариев социально-экономического развития, Когда статистически выявленные взаимосвязи между различными характеристиками используются для прослеживания того, как возможные изменения в параметрах повлияют на характеристики нашего числового ряда.
Существует множество специализированного программного продуктов для специализированных эконометрических исследований (Статистика; Математика; Матлаб; Маткаб). По этим программам существенно упростилась задача решения экономических моделей.
История эконометрики
Основные ученные: Р. Фриш, Я. Тинберген, Э. Маленво, Тинтнер
Наши ученые: Слуцкий, Антарович.
Возникновение эконометрического метода 17 век. Книга: политическая арифметика, В. Петти и Е. Линг. Занимались налогообложением, торговлей и финансами.
Середина 19 века. Пирсон.
Законы заработной платы, эссе по статистической экономике. Мурр.
Маршалл. Анализ макроэкономических проблем на основе временных рядов.
Жугляр. Кондратьев.
Построение экономических барометров.
Основные аспекты эконометрического моделирования
Вопросы: постановка задачи эконометрического моделирования.
Основные математические предпосылки эконометрического моделирования
Эконометрическая модель и экспериментальные данные
Линейная регрессионная модель
Система одновременных моделей
Основные этапы и проблемы эконометрического моделирования
Рассмотрим следующую ситуацию. Допустим, мы хотим продать автомобиль. Решили дать объявление в газете. Какую цену указать в объявлении.
Опишем формализовано
Определить цену как величину, формируемую под воздействием некоторых факторов. Такую величину, зависимую от факторов, называют зависимыми объясняемыми переменными. А факторы, от которых они зависят — объясняющими. Формируем мнение о состоянии рынка и получаем ожидаемое значение зависимой переменной при заданных значениях объясняющих переменных факторов.
Есть и случайные факторы: возможные сроки продажи автомобиля, потребность продавца в конкретной сумме, характер продавца и другие, случайные величины.
Менеджер крупного салона по торговле автомобилями на вторичном рынке захочет иметь точное представление об ожидаемой цене.
Общим моментом для любой эконометрической модели является разбиение любой переменной на наблюдаемые зависимые переменные и объясняющие переменные, которые разбиваются на объясненную часть, зависящая от значение объясняющих переменных и на случайные составляющие.
Y=f(x)+ε
Предположим, что цену автомобиля определили и получили следующее выражение
Ϋ^=18000-1000х1-0,5х2
Игрик со шляпкой — ожидаемая цена автомобиля
Икс первая — год выпуская автомобиля
Икс второе — пробег автомобиля.
Как формируется цена или рассматриваемая общая экономическая переменная. Во вторых полученная структура дает возможность выявить влияние каждой из объясняющих переменных на цену автомобиля. То есть, если икс один и икс два по нулю, то восемнадцать тысяч это цена нового автомобиля.
Результат позволяет прогнозировать цену на автомобиль, если известные его основные параметры.
Математические предпосылки эконометрического моделирования.
Пусть имеется p объясняющих переменных х
Х1,х2,….,хр и зависимая переменная у
У=f(x1,x2,…,Xp)
У — случайная величина, которая при заданном значение факторов имеет некоторое распределение
Если случайная величина икрек не прерывна, то можно считать, что ее распределение при каждом допустимом наборе факторов х1…хр имеет условную плотность
fx1,x2,…,xp(Y)
Обычно в эконометрических исследованиях делается предположение относительно распределения у. Предполагается, что условное распределение при каждом допустимом расположение факторов нормальное.
Но можно отпустить предположение о нормальном.
Объясняющие переменны икс житые, могут считаться как случайными, так и детерминированными, принимающими определенные значения.
Например, мы можем заранее для себя определить параметры автомобиля и искать объявления о продаже автомобиле именно с такими параметрами. В этом случае не управляемой случайно величиной остается только зависимая переменная цена. А можем случайным образом выбрать объявление о продаже и тогда объясняющая переменная иксы и параметры при них так же оказываются случайными величинами. Классическая эконометрических модель рассматривает икс житое как детермированное, а объяснённая часть игрек представляет собой функцию от значений факторов объясняющих переменных. Таким образом, модель в классическом виде имеет вид
У=f(x1,x2,…,Xp)+ε
Наиболее естественным выбором объясненной части игрек является ее среднее значение, то есть условное математическое ожидание, полученное при данном наборе значений объясняющих переменных иск житое
Мхj(У)=f(x1,x2,…,Xp)
При таком выборе сама модель будет иметь вид
Y=Mx(Y)+ε
Эпсилон в этом случае является возмущением или ошибкой. В курсе математической статистике это уравнение называется уравнением регрессионной модели. Отметим, что эконометрическая модель не обязательно является регрессионной, то есть объяснённая часть не всегда представляет собой условное математическое ожидание зависимой переменной.
Систематические ошибки измерения объясняющих переменных являются одной из возможных причин того, что эконометрическая модель не будет регрессионной.
Эконометрика рассматривает возможные пути устранения этого неприятного обстоятельства, заменяя один набор объясняющих переменных — другим.
С математической точки зрения регрессионные модели оказываются существенно более простыми объектами, чем эконометрическая модель общего типа. Рассмотрим некоторые свойства регрессионной модели
Возьмем от обеих частей математическое ожидание при заданном наборе значений. В этом случае математическое ожидание от игрека это числовая величина, равная своему математическому ожиданию.
То есть и математическое ожидание такой случайной ошибки тоже равно нулю. То есть в регрессионной модели ожидаемые значение ошибки тоже равно нулю. Отсюда следует, что случайные ошибки и объясняющие переменные икс не коррелируются друг с другом и это обстоятельство позволяет считать полученные количественные результаты состоятельными. То есть готовыми к вычислениям и получению результатов
Чтобы получить достаточно достоверные и информативные данные о распределение какой-либо случайной величины, необходимо иметь выборку ее определений достаточно большого объема, поскольку эта выборка зависимых и объясняющих переменных является главными в любом эконометрическом исследовании.
Как правило, такие выборки представляют собой наборы значений, где ι от 1 до н, а р количество объясняющих переменных, н — количество наблюдений.
И вот как раз эн должно быть достаточно большим — не меньше десятков. Н должно быть много больше р.
Как выясняется, проблема заключается в том, что наблюдение игрек итое, получаемые как случайные величины, часто получают различные наборы иск итых.
В классическом курсе эконометрики рассматривается два типа данных. Пространственные данные. И временной динамический ряд.
В экономике под пространственной выборкой понимают набор показателей экономических переменных, полученных в данный момент времени. Таким образом, мы будем называть пространственной выборкой серию из эн независимых наблюдений случайной величины икс житое игрек, игрек итое, входящее в игрек отзываются между собой независимыми, то есть коэффициент корреляции между эпсилон итое и эпсилон житое равен нулю’ то есть они не коррелированы. Как определить является ли выборка серией независимых наблюдений. На практике на этот вопрос нет однозначного ответа, и, обычно, за независимые принимаются величины, не связанные между собой причинным образом.
Рассмотрим на примере продажи машины. Продавцы дает независимые данные и поэтому можно предположить, что они независимые. Но он смотрит на прежние цены, поэтому нельзя сказать, что они независимые. Поэтому в пространственной выборке сложно соответствовать теории. Поэтому мы руководствуемся условиями временным рядом (это выборка наблюдений, в которой важны не только сами наблюдаемые значения случайных величин, но и порядок их следования друг за другом). Чаще всего на практике эти данные являются серией наблюдений одной и тоже случайно величины в последовательные моменты времени. То есть они являются динамическими временными рядами. При этом предполагается, что тип наблюдения один и тот же, например нормальный. Но в зависимости от времени его параметры меняются. Модели временных рядов, как правило, оказываются сложнее моделей пространственной выборки, так как наблюдения во временных рядах не являются независимыми, а, следовательно, их ошибки могут коррелироваться друг с другом. А это лишь усложняет анализ модели. Поэтому имея только ряд наблюдений, не зная его природы, невозможно определить, перед нами пространственная выборка или временной ряд.
Пусть, например, имеется пятьсот пар чисел. Икс года выпуска, а игреки цена автомобиля. Данные взяли из какого-то статистического сборника. Тогда тут возможны следующие варианты. Н газет было упорядоченно по дате выпуска, а из каждой газеты было выбрано по одному объявлению. А может быть, что газеты были перемешены. И мы, не глядя на дату, выбрали объявления. В этом случае можно считать, что наша выборка пространственная. Но при этом возможно случайным образом, что мы получили один и тот же набор случайных данных.
Парный регрессионный анализ.
1). Функциональная, статистическая и корреляционные зависимости
2) Линейная, парная репрессия.
3) коэффициент корреляции
4) некоторые оценки функции регрессии.
Методы и модели регрессивного анализа занимают центральное место в экономическом аппарате эконометрики. В практике экономических исследований имеющиеся данные не всегда можно считать выборкой, соответствующей классификации представительная или репрезентативная.
В этих случаях пытаются определить кривую, которая дает наилучшее по методу наименьших квадратов, приближение к исходным данным. Вот эти методы приближения получили название регрессионного анализа. Задачами регрессионного анализа является установление формы зависимости между переменными, оценка функции регрессии и оценка неизвестных значений (прогноз) зависимой переменной.
В естественных науках часто речь идет о функциональной зависимости, связи, когда определенному значению одной переменной соответствует значение другой.
В экономике в большинстве случаев между переменными величинами существуют зависимости такие, когда каждому значению одной переменной соответствует множество возможных значений другой переменной. Формально говорят так: каждому значению одной переменной соответствует определенное распределение другой переменной.
Эта зависимость получила название статистической или стохастической вероятностной. Возникновение этого понятия статистической связи вызвана тем, что зависимая переменная подвержены влиянию ряда неконтролируемых или неучтенных факторов, а так же тем, что измерение значения переменных неизменно сопровождается некоторыми случайными ошибками.
Для исследователя представляет интерес усредненная по икс схема зависимости, то есть необходимость измерения условного математического ожидания Му. Математического ожидания случайной переменной у, вычисленной в предположении, что переменная икс приняла определенное значения из набора икс итых.
Корреляционной зависимостью между двумя переменными называется функциональная зависимость между значениями одной из них и условным математическим лишнего ожиданием другой.
В регрессивном анализе рассматривается только односторонняя зависимость от одной или нескольких неслучайных переменных икс.
Для точного описания уравнения регрессии необходимо знать условных закон распределения у от х. Но такую информацию в статистической практике получить невозможно, поскольку мы всегда ограниченны объемом информации, поэтому речь может идти о приближённом значении. Такой выборочной оценкой является выборочная линия или кривая регрессии.
Рассмотрим в качестве примера зависимость между сменной добычей угля на одного рабочего.
Добыча угля У(Т) и мощность пласта Х(м)
Из полученного уравнения регрессии следует, что если пласт увеличивается, то добыча угля на одного рабочего увеличивается на 1,016.
Теснота связи определяется коэффициентом корреляции, который показывает, на сколько величин средних квадратических изменится в среднем у, если х увеличится.
Выборочный коэф. корреляции. При 1 функциональная, при нуле отсутствует.
Коэффициент корреляции не единственный индикатор тесноты связи.
Существует набор показателей, которые измеряют устойчивость коэффициентов, которые вместе с коэф. Корреляции измеряют тесноту связи более точно.
Линейный регрессионный анализ показывает уравнение взаимосвязи двух переменных в виде у = фи от икс плюс эпсилон, где эпсилон случайная переменная, которая характеризует отклонение от функции регрессии. Ее называют ошибкой, возмущением.
Регрессионный анализ может проводиться для линейной функции при определенных предпосылках.
Дисперсия эпсилон итая постоянная для любого и.
Классическая линейная нормальная регрессионная модель.
Теорема Гаусса Маркова
Если регрессионная модель удовлетворяет предпосылкам, то оценки б нулевое и первое имеют наименьшую дисперсию в классе всех не смещенных оценках.
Производственные функции и из применения
Понятия производственной функции.
Двух факторные производственные функции и свойства.
Наиболее часто употребляемые производственные функции, используемые для прогнозирования.
Производственные функции, то есть соотношения между выпуском продукции и эгрегированных, укрупненными показателями ресурсов, относятся к числу наиболее известных и широко употребляемых экономико-математических моделях. Они отражают в математической форме один из основным математических процессов — процесс производства продукции. И позволяют проводить разнообразные аналитические расчеты, определять эффективность использования ресурсов и целесообразность их дополнительного во влечения в сферу производства. Прогнозировать выпуск продукции при тех или иных вариантах развития производства. Не менее важную роль играют Пф в процессе качественного анализа поведения системы, являясь при этом неотъемлемой часть большинства комплексных моделей динамики. Еще в первой четверти прошлого века относительная простота и высокая экономическая ценность аппарата Пф привлекла внимание исследователей. И на основе этого аппарата созданы модели экономического роста, которые и по сей день применяются достаточно широко, не потеряли своей значимости для теоретического анализа долгосрочных стремлений динамики краткосрочного процесса и для прогноза. Во всех учебниках и монографиях, посвященных математической экономике обязательно присутствуют определение понятия производственной функции. Различают два подхода к этому подходу в широком или узком смысле. Рассмотрим эти подходы.
В широком смысле: вектор выпуска продукции у итое. В качестве фактора, влияющих на показания производства в Пф включаются как затраты средств труда, так и другие показатели, которые не могут быть отнесены к затратам, например природные факторы.
Если через икс житое обозначить фактор, влияющий на результат производства, то можем описать все факторы вектором.
С отношениями между факторами и выпускаемой продукции, где А — вектор.
Определяется действием огромного количества различных факторов — технических, экономических, социальных, природных — поэтому в рамках производственной функции учесть все факторы задача невыполнимая и бесполезная. Особенно с учетом того, что некоторые факторы могут не иметь количественных оценок, а только качественные. А воздействие других факторов так незначительно, что им можно пренебречь. Поэтому производственная функция включает в себя лишь те факторы, которые оказывают решающее воздействие на изучаемый характер.
1) Но из-за наличия неучтенных показателей и не всегда однозначном действии учетных, производственная функция является функцией только в статистическом смысле. Это значит, что описываемая ею математическая зависимость проявляется только в общем и в среднем для массы наблюдений.
2) По своему содержанию Пф охватывают все возможные зависимости в сфере производства на разных уровнях — предприятия, компания, отрасль, экономика в целом.
3) Выделяются макроэкономических и микроэкономические Пф. С помощью макро изучаются высоко укрепленные характеристики процессов производства на уровне отраслей, групп отраслей и экономики в целом. К микро Пф относятся функции, которые описывают взаимосвязь результата производства и факторов на уровне предприятий и групп предприятий.
4) Пф подразделяются на статические и динамические. В стат. время не учитывается как фактор, измеряющий основные характеристики зависимости. А динамические включают фактор времени и время в них — самостоятельная переменная, влияющая на результативный показатель. И сами параметры и показатели так же могут рассматриваться как функции времени.
Рассмотрим макроэкономическую функцию как статическую.
Игрек — национальных доход. К — объем основных производственных фондов. Л — численность занятых в сфере материального производства.
Предполагается, что эта производственная функция обладает следующими свойствами. 1)Она является дважды непрерывно дифференцируемой. 2) связанных с направлением результата действия при увеличении затрат к и л выпуск не уменьшается. 4) По мере увеличения одного фактора при постоянном количестве других предельная эффективность этого фактора не возрастает. Свойства
Этот факт имеет логическое объяснение. Поскольку каждая единица должна совместиться с все меньшим количеством других факторов, эффективность использования растущего фактора уменьшается.
При пропорциональном увеличении ресурсов К и Л производство увеличивается по закону (5)
Еще функции.
Достаточно важной характеристикой процесса является эластичность выпуска.
Предельная эффективность в экономическом смысле характеризует влияние прироста национального дохода на небольшой прирост одного фактора.
Средняя эффективность — равняется отношению национального дохода к капиталу и отношения нац дохода к численности, то есть производительности труда
С помощью Пф можно отразить изменения характеристик производства во времени. Научно технический прогресс.
Теоретические и методологические основы социально-экономического прогнозирования
1. Основные подходы к прогнозированию
2. Виды прогнозов.
3. Основные методы прогнозирования. Общая характеристика.
4. Методы анализа временных рядов.
5. Каузальные методы.
Анализ социально экономических систем как на макро- мезо- и микроуровне позволяет прогнозировать тенденции и возможные направления развития системы. Анализ СЭС — социально экономических систем.
Это полезно и необходимо для стратегического управления и планирования в сэс. Полезность прогнозной информации зависит от многих факторов. Запишем несколько рекомендаций по сбору информации для прогнозирования.
1. Прогнозы полезны для планирования только в том случае, если компоненты, составляющие прогнозы, тщательно продуманы, а ограничения, содержащиеся в прогнозе, откровенно названы, а не спрятаны
2. Следует обязательно определить изменения, которые должны произойти, чтобы прогноз оказался достоверным. И после этого следует тщательно оценить вероятность каждого возможного события
3. Необходимо продумать и обосновать представительность репрезентативность источников данных.
4. Нужно определить степень ценности опыта прошлого при составлении прогнозной модели. Настолько ли быстры изменения, что прогноз не успеем составить?
5. Необходимо определить уровень структурированности прогноза.
Будем понимать под прогнозом научно обоснованное суждение о возможных состояниях объекта в будущем и о сроках их осуществления. Для характеристикой прогноза является прогнозный фонд, под которым будем понимать совокупность внешних по отношению к прогнозу и объекту прогнозирования условий, существенных для решения задачи прогноза.
В качестве объекта прогнозирования выступают процессы, явления, события, на которые направлена практическая деятельность человека. В зависимости от природы объекта различают прогнозы социальные, экономические, научно-технические, политические и другие.
Основные понятия прогнозирования.
Прогнозирование — процесс разработки прогнозов.
Прием прогнозирования — одна или несколько математических или логических операций, направленных на получение конкретного результата от прогноза.
Примеры приемов — вычисление средне взвешенных оценок, сглаживание и выравнивание динамического ряда.
Метод прогнозирования — способ исследования объекта прогнозирования направленный на разработку прогноза.
Методы являются основанием для методики прогнозирования — совокупности специальных правил и приемов разработки конкретного прогноза.
Прогнозирующие системы — системы методов прогнозирования и методов их реализации. Средствами реализации могут быть экспертная группа, технические и программные средства и так далее.
Прогнозирующие системы сами по себе могут быть: автоматизированными и неавтоматизированными, дискретными и непрерывными, они могут быть на разных уровнях: государственном, отраслевом, на уровне предприятий и на уровне технологических процессов.
По логике составления прогнозов, от настоящего к будущему или наоборот, различают поисковый или изыскательский прогноз и нормативный прогноз.
Поисковый — это определение возможных состояний объекта прогнозирования в будущем, начиная от сегодняшнего состояния и пути развития в будущее.
Нормативный прогноз — определение путей и сроков достижения возможных состояний объекта в будущем, которое принимается в качестве цели.
Методы кроме поискового и нормативного различаются интервальный и точечный прогноз.
Интервальный прогноз — его результатом является интервал с характеристиками объекта прогнозирования для заданной вероятности осуществления прогноза. Этот интервал называется доверительными интервалом.
Под характеристиками прогнозирования будем понимать качественное или количественное отображение какого-либо свойства объекта. В социально-экономических прогнозах это будет показатель. В технических — какое-нибудь важное свойства.
Точечный прогноз — результат представлен в виде единственного значения конкретной характеристики объекта прогнозирования. По горизонту прогнозирования.
Прогнозы делятся на кратко средне и долгосрочные.
В социалистической экономики — плановой — были приняты следующие виды планирования: оперативно-календарная (до одного месяца), текущая — от месяца до года, перспективная от года до пяти лет и долгосрочная от пяти и далее.
Классификация сегодня
Оперативный прогноз — для социальных, технических и оперативных объектов
Краткосрочный — от месяца до года
Среднесрочный — от года до пяти
И долгосрочный от пяти до пятнадцати
Дальнесрочный — от пятнадцати лет
Но чаще всего прогнозы по развитию системы прогнозы рассчитывается в трех вариантах: оптимистический, средний и пессимистический сценарий.
Методы прогнозирования группируются в три класса
Качественные, аналитические методы динамических рядов под названием анализ временных рядом, каузальные (причинные) методы.
В общем виде качественные методы используют такие данные, как обобщенное мнение экспертов о продажах в будущем.
Анализ временных рядов опирается целиком на количественные данные и экстраполяцию продолжения в будущем тренда, основной тенденции.
Каузальные методы — пытаются определить взаимозависимости между независимыми и зависимыми переменными в системе взаимосвязанных уравнений.
Каждая из этих трех основных групп классов разбита на подгруппы: качественные методы — метод Дельфи, исследование рынка, метод группового согласия, метод исторических аналогий
Анализ временных рядов: скользящая средняя, экспоненциального сглаживания, прогноз тренда
Каузальные методы: регрессионный анализ, эконометрическое моделирование, модель «затраты-выпуск», анализ жизненного цикла и имитация.
Выбор метода прогнозирования, сложная задача, неоднозначно решаемая и зависящая от многих факторов. При выборе метода прогнозирования, ЛПР должно учитывать два вида затрат:
1. Можно назвать издержки неточности. Связан со стоимостью получения информации требуемой точности.
2. Издержки самого прогнозирования. Насколько точен сам метод. Стоимостным критерием является минимизация совокупных затрат.
Некоторые методы требуют большого количества исторических данных, их не всегда можно собрать. Будут огромные затраты.
Время — одни пригодны для краткосрочных, другие для долгосрочных. Им нужна разная информация.
Время разработки прогноза.
Метод Дельфи
Сбор и обработка индивидуальных мнений экспертов производится исходя из следующих принципов.
Вопросы должны ставиться так, чтобы можно было дать количественную характеристику ответам экспертов.
studfiles.net
Графики гетероскедастичности в эконометрике | univer-nn.ru
В соответствии с одной из предпосылок МНК нужно, чтобы дисперсия остатков была гомоскедастичной. Это означает, что для каждого значения фактора X остатки е, имеют одну и ту же дисперсию. Если это условие не соблюдается, то имеет место гетероскедастичность. Наличие гетероскедастичности можно наглядно продемонстрировать на поле корреляции (см. рис.).
Гомоскедастичность остатков означает, что дисперсия остатков одна и та же для каждого значения X. Используя трехмерное изображение, можно получить следующие графики, которые проиллюстрируют гомо- и гетероскедастичность Рисунок с гомоскедастичностью показывает, что для каждого значения Х, распределения остатков одинаково в отличие от гетероскедастичности. Для множественной регрессии вид графиков является наиболее наглядным способом изучения гомо- и гетероскедастичности. Наличие гетероскедастичности может в ряде случаях привести к смещенности оценок коэффициентов регрессии, хотя несмещенность оценок коэффициентов регрессии, как правило, зависит от соблюдения второй предпосылки МНК, т. е. независимости остатков и величин факторов. Гетероскедастичность будет сказываться на уменьшении эффективности оценок b. В ча-стности, становится затруднительным использование формулы стандартной ошибки коэффициента регрессии Sb, которая предполагает единую дисперсию остатков для любых значений фактора.Определение гетероскедастичности
При малом объеме выборки, что характерно для большинства задач эконометрики, для оценки гетероскедастичости используют метод Гольдфельда — Квандта, который был разботан в 1965 г. Гольдфельдом и Квандтом, где они рассмотрели однофакторную линейную модель, для которой дисперсия остатков возрастает пропорционально квадрату фактора. Чтобы оценить нарушение гомоскедастичности, они предложили выполнить следующие операции.
- Упорядочить наблюдения по мере возрастания фактора Х.
- Исключить из рассмотрения С центральных наблюдений, причем (n — С): 2 > р, где р — число оцениваемых параметров.
- Разделить совокупность из (n — С) наблюдений на две группы (с малыми и большими значениями фактора X).
- Определить остаточную сумму квадратов для первой (S1) и второй (S2) групп и нахождение отношения: R = S1 : S2.
При выполнении нулевой гипотезы о гомоскедастичности отношение R будет удовлетворять критерию Фишера с (n — С — 2p) : 2 степенями свободы для каждой остаточной суммы квадратов. Чем больше величина R превышает табличное значение F-критерия, тем в большей степени нарушена предпосылка о равенстве дисперсий остаточных величин.
Источник: Эконометрика: Учебник / Под ред. И.И. Елисеевой. – М: Финансы и статистика, 2002. – 344 с.
Для перехода на страницу решения контрольных по эконометрике жмите сюда
univer-nn.ru