Признаки факторные и результативные – Группировочные (факторные) и результативные признаки. Размах и коэффициент вариации

Тема 11. Статистическое изучение корреляционных взаимосвязей

Основные задачи корреляционно-регрессионного анализа

  • Выявления наличия (или отсутствия) корреляционной связи между изучаемыми признаками.

  • Определение формы корреляционной зависимости, то есть вида функции регрессии (линейной, логарифмической, параболической и др.).

  • Построение уравнения регрессии.

  • Оценка степени тесноты корреляционной связи.

Понятие корреляционной зависимости

Одна из основных задач статистики -установление и измерение связей между явлениями.

При изучении связей выделяют факторные и результативные признаки.

Факторные— это признаки, оказывающие влияние на изменение результативных признаков.

Результативныепредставляют собой результат влияния факторных признаков.

Связь изучается между вариацией результативного и факторного признаков, а не между их отдельными величинами

Виды взаимосвязей

Функциональная связьхарактеризуется строго определенным изменением значения переменной упри изменении другой переменнойх.

Такие связи обычно встречаются в естественных науках: математике, физике и др.

Частным случаем стохастической или статистической связи является корреляционная связь.

Статистическая зависимостьхарактеризуется изменением распределения одной переменной под влиянием изменения другой.

Например, уровень машины в зависимости от занимаемой должности

Корреляционной связьюназывают важнейший частный случай статистической связи, состоящий в том, что разным значениям одной переменной соответствуют различныесредние значениядругой. С изменением значения признакахзакономерным образом изменяется среднее значение признакау;в то время как в каждом отдельном случае значение признакау(с различными вероятностями) может принимать множество различных значений.

Например, скорость машины зависит от мощности двигателя

Виды зависимостей между факторным и результативным признаками

1) По направлению связи выделяют прямую и обратную зависимости:

Прямая зависимость— направление изменения результативной переменной совпадает с изменением направления факторной переменной.

Например, общая производительность зависит от тактовой частоты процессора

Обратная зависимость— направление изменения результативной переменной противоположно направлению изменения факторной переменной.

Например, чем выше температура процессора, тем меньше его производительность

2) по количеству факторных признаков выделяют парную и множественную зависимости:

Парная зависимость(однофакторная) — это связь между одной факторной переменной и одной результативной переменной.

Например, чем быстрее бежит спортсмен, тем быстрее он достигнет финиша

Множественная зависимость(многофакторная) — это связь между несколькими факторными переменными и одной (иногда несколькими) результативной переменной.

Например, чем быстрее бежит один спортсмен, чем медленнее бегут остальные по сравнению с ним, тем больше шансов, что он получит медаль.

Выявление наличия (или отсутствия) корреляционной связи между изучаемыми признаками производится:

  • на основе параллельного сопоставления (сравнения)значений хиу;

  • с помощью группировок;

  • путем построения и анализа специальных корреляционных таблиц;

  • графическим способом.

Теснота связи между факторным и результативным признаками колеблется от -1 до +1

Термин «регрессионный анализ» подразумевает всестороннее исследование корреляционных связей, в том числе:

  • нахождение уравнений регрессии,

  • определение возможных ошибок параметров уравнений регрессии и показателей тесноты связи,

  • оценка существенности коэффициента регрессии и уравнения связи.

Простейшей системой корреляционной связи является линейная связь между двумя признаками —парная линейная корреляция.

Практическое значение ее в том, что есть системы, в которых среди всех факторов, влияющих на результативный признак, выделяется один важнейший фактор, который в основном определяет вариацию результативного признака. Измерение парных корреляций составляет необходимый этап в изучении сложных, многофакторных связей. Есть такие системы связей, при изучении которых следует предпочесть парную корреляцию. Внимание к линейным связям объясняется ограниченной вариацией переменных и тем, что в большинстве случаев нелинейные формы связей для выполнения расчетов преобразуются в линейную форму.

Уравнение парной линейной корреляционной связи называется уравнением парной регрессиии имеет вид:у = а + bх,

где усреднее значение результативного признака при определенном значении факторного признаках; асвободный член уравнения;bкоэффициент регрессии, измеряющий среднее отношение отклонения результативного признака от его средней величины к отклонению факторного признака от его средней величины на одну единицу его измерения -вариация

у,приходящаяся на единицу вариациих.

Параллельное рассмотрение коррелирующих значений проводится:

  • показателем тесноты связи -коэффициентом Фехнера;

  • ранговым коэффициентом Спирмэна;

  • группировками;

  • на основе таблиц сопряженности.

studfiles.net

Факторные Результативные.

Статистика как наука.

Статистика– это самостоятельная общественная наука, изучающая количественную сторону массовых социально- экономических явлений и процессов в неразрывной связи с их качественной стороной.

(Выявление закономерностей в общественных процессов , с помощью анализа различных явлений, это и является объектом(совокупность явлений) изучения статистики.) – комментарий

Объект изучения — Статистическая совокупность

Множествоявлений, изучаемых статистикой, которые имеют один или несколько общих признаков и различаются между собой по другим признакам.

Предметом изучения статистики является количественная сторона массовых социально-экономических явлений, т.е. уровни, размеры, конкретные массы, объемы, площади и т.п.

Статистический показатель– это обобщающая количественная характеристика социально-экономических явлений и процессов в их качественной определенности в условиях конкретного времени и места.

Три элемента статистического показателя:

  • Место

  • Количество

  • Время

Статистический показатель

  • Экстенсивные(первичный показатель, получаем в начале, пример первичных итогов\фонд заработной платы) – (объемные, количественные) показатели — результат непосредственного подсчета или суммирования статистических данных.

  • Интенсивные – результат деления экстенсивных показателей друг на друга.

Теоретические основы статистики.

Единица совокупности – отдельные элементы, образующие статистическую совокупность и являющиеся носителями определенных признаков.

Признак – свойство, характерная черта или иная особенность единиц, объектов(явлений), которые могут быть определены или измерены.

Совокупность называется однородной, если самые существенные признаки для каждой единицы совокупности являются в основном однотипными и

разнородной, если она объединяется разные типы явлений.

Факторными называются признаки оказывающие влияние на другие признаки.

Результативныминазываются признаки испытывающие влияние других признаков.

Количественные. Качественные.

Количественныевыражаются числом.

  • Дискретные (прерывные)- принимают только целые значения.

  • Непрерывные– принимают любые значения в определенных пределах

Атрибутивные– выражены словесно.

Вариацияколеблемость, многообразие, изменчивость величины признака у отдельных единиц совокупности.

Метод статистической науки

  • Статистическая методология— система приемов, способов и методов, направленных на изучение количественных закономерностей, проявляющихся в структуре, динамике и взаимосвязях социально-экономических явлений.

Этапы статистического исследования:

  • Статистическое наблюдение

  • Первичная обработка, сводка и группировка результатов наблюдения

  • Анализ полученных сводных материалов

Метод массовых наблюдений заключается:

В регистрации отобранных признаков у каждой единицы совокупности.

Метод статистических группировок и таблиц

  • Комплекс последовательных действий по обобщению конкретных единичных фактов, образующих совокупность в целях выявления типичных черт и закономерностей, присущих изучаемому явлению в целом.

Методы анализа с помощью обобщающих показателей.

  • Обобщающие показатели : абсолютные, относительные, средние величины и индексные системы.

  • Показатели вариации.

  • Анализ внутренних связей в объекте исследования — изучение структуры.

  • Исследование динамики на основе обобщающих аналитических показателей, специальных приемов обработки и моделирования рядов динамики.

  • Методы корреляционно-регрессионного анализа.

  • Графические методы.

Тема 2 : «Статистическое наблюдение»

Статистическое наблюдение– это массовое, планомерное, систематическое, научно-организованное наблюдение за явлениями общественной жизни.

Программно-методологические вопросы статистического наблюдения

  • Цель наблюдения

  • Объект и единица наблюдения.

  • Отчетная единица.

  • Программа статистического наблюдения

  • Статистический формуляр

  • Место и время наблюдения

Объектом статистического наблюденияназывается совокупность единиц изучаемого явления, о котором должны быть собраны статистические данные.

Единица наблюдения– первичный элемент объекта статистического наблюдения, выступающий в качестве носителя признаков, подлежащих регистрации и являющийся основой статистического счета.

Отчетная единица– субъект, от которого должны быть получены необходимые статистические данные о ед. наблюдения.

Программа статистического наблюдения— перечень признаков (вопросов), подлежащих регистрации в процессе статистического наблюдения и оформлении их в виде формуляра.

Статистический формуляр– документ единого образца, который содержит программу наблюдения и в котором записываются результаты наблюдения.

Критический момент– время, по состоянию на которое фиксируются данные.

Период регистрации— время, в течении которого собираются сведения о единицах наблюдения.

Формы статистического наблюдения:

  1. Статистическая отчетность

  2. Специально организованное наблюдение

  3. Регистры

Отчетность– совокупность отчетных документов (отчетов), содержащих систему показателей, которые характеризуют итоги производственно-хозяйственной деятельности предприятий и организаций за отчетный период.

Специально-организованное статистическое наблюдение— организуется с какой-либо особой, специальной целью на определенный момент или дату, для получения дополнительной статистической информации, которой нет в отчетности.

Регистровое наблюдение – это форма непрерывного статистического наблюдения за долговременными процессами, имеющими фиксированное начало, стадии развития и фиксированное завершение.

( регистры населения, регистры предприятий )

studfiles.net

Причинно-следственные связи, факторные и результативные признаки, виды связей

Исследование объективно существующих связей между явлениями – важнейшая задача общей теории статистики. В процессе статистического исследования вскрываются причинно-следственные отношения между явлениями, что позволяет выявлять факторы (признаки), оказывающие существенное влияние на вариацию изучаемых явлений и процессов. Причинно-следственные отношения – это связь явлений и процессов, при которой изменение одного из них – причины – ведет к изменению другого – следствия.

Социально-экономические явления представляют собой результат одновременного воздействия большого числа причин. Следовательно, при изучении этих явлений необходимо, абстрагируясь от второстепенных, выявлять главные, основные причины. В основе первого этапа статистического изучения связей лежит качественный анализ явления, связанный с анализом его природы методами экономической теории, социологии, конкретной экономики.

Второй этапа – построение модели связи. Она базируется на методах статистики: группировки, средних величин, таблиц и т.д. Третий последний этап – интерпретация результатов, вновь связан с особенностями изучаемого явления. Статистика разработала множество методов изучения связей, выбор которых зависит от целей исследования и поставленных задач. Связи между признаками и явлениями, ввиду их большого разнообразия, классифицируются по ряду оснований. Признаки, обуславливающие изменение других, связанных с ними признаков,  называются факторными, или просто факторами. Признаки, изменяющиеся под действием факторных признаков, являются результативными. Связи между явлениями и их признаками классифицируются по степени тесноты связи, направлению и аналитическому выражению.

В статистике различают функциональную связь и стохастическую зависимость. Функциональной называют такую связь, при которой определенному значению факторного признака соответствует одно и только одно значение результативного признака. Функциональная связь проявляется во всех случаях наблюдения и для каждой конкретной единицы исследуемой совокупности.

Если причинная зависимость проявляется не в каждом отдельном случае, а в общем среднем, при большом числе наблюдений, то такая зависимость называется стохастической. Частным случаем стохастической является корреляционная связь, при которой изменение среднего значения результативного признака обусловлено изменением факторных признаков.

По степени тесноты связи различают количественные критерии (таблица 1).

Таблица 1

Количественные критерии оценки тесноты связи

Величина коэффициента корреляции

Характер связи

До 0,3

практически отсутствует

0,3 – 0,5

слабая

0,5 – 0,7

умеренная

0,7 – 1

сильная

По направлению выделяют связь прямую и обратную. При прямой связи с увеличением или с уменьшением значений факторного признака происходит увеличение или уменьшение значений результативного. В случае обратной связи значения результативного признака изменяются под воздействием факторного, но в противоположном направлении по сравнению с изменением факторного признака.

По аналитическому выражению выделяют связи прямолинейные (или просто линейные) и нелинейные. Если статистическая связь между явлениями может быть приближенно выражена уравнением прямой линии, то ее называют линейной связью; если же она выражается уравнением какой-либо кривой линии (параболы, гиперболы, степенной, показательной, экспоненциальной и т.д.), то такую связь называют нелинейной, или криволинейной.

В статистике не всегда требуются количественные оценки связи, часто важно определить лишь ее направление  и характер, выявить форму воздействия одних факторов на другие. Для выявления наличия связи, ее характера и направления в статистике используются методы приведения параллельных данных; аналитических группировок; графический; корреляционный, регрессионный.

Метод приведения параллельных данных основан на сопоставлении двух или нескольких рядов статистических величин. Такое сопоставление позволяет установить наличие связи и получить представление о ее характере.

Статистическую связь между двумя признаками можно изобразить графически и по графику судить о наличии, направлении и форме связи. На оси абсцисс откладываются значения факторного признака, на оси ординат – результативного. На графике откладываются все единицы, обладающие определенными значениями х и у. При отсутствии  тесных связей наблюдается беспорядочное расположение точек на графике. Чем сильнее связь между признаками, тем теснее будут группироваться точки вокруг определенной линии, выражающей форму связи.

Корреляционный метод имеет своей задачей количественное определение тесноты связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной  связи).

Корреляция – это статистическая зависимость между случайными величинами, не имеющими строго функционального характера, при которой изменение одной из случайных величин приводит к изменению математического ожидания другой.

Первоначально исследования корреляции проводились в биологии, а позднее распространились и на другие области, в том числе на социально-экономическую. Одновременно с корреляцией начала использоваться и регрессия. Корреляция и регрессия тесно связаны между собой: корреляция оценивает силу (тесноту) статистической связи, регрессия исследует ее форму. Та и другая служат для установления соотношения между явлениями, для определения наличия или отсутствия связи.

Корреляционный и регрессионный анализ как общее понятие включает в себя измерение тесноты, направления связи и установление аналитического выражения (формы) связи (регрессионный анализ).

 

 

www.ekonomstat.ru

Понятие факторного и результативного признака

1.Исходные данные

арифметический вариационный факторный признак

Таблица 1

№Результативный признак Факторные признаки№ 3 (товарная продукция лесозаготовок, тыс. руб)№ 5 (вывозка древесины, лесоматер. Кругл, тыс. м)№ 24 (выработка товарной продукции на 1 работающего, руб)№ 26 (удельные трудозатраты на лесозаготовках, чел.-дней/ 1000 м)ух1х2х317600330860054025400310740046035800370750048044200270710044057200400850052068600170880058079600280950064085600170740048091170053010300640106400230840052011620037077005101232002805300350134000320700039014910013090005901574002208500530х1, х2, х3 — независимая переменная (факторный признак)

у — зависимая переменная (результативный признак)

2.Проверка однородности исследуемой совокупности

В таблице 2 проранжируем исходные данные по результативному признаку (у).

Таблица 2. Ранжированные исходные данные

№Результативный признакФакторные признаки№ 3№ 5№ 24№ 26ух1х2х312320028053003501340003207000390442002707100440254003107400460856001707400480358003707500480116200370770051010640023084005205720040085005201574002208500530176003308600540686001708800580149100130900059079600280950064091170053010300640

у = 11700 — испытуемый элемент совокупности.

Таблица 3. Расчет параметров для проверки однородности исследуемой совокупности

№уi12320010562500,001340006002500,00442005062500,00254001102500,0085600722500,0035800422500,0011620062500,001064002500,0057200562500,00157400902500,00176001322500,00686004622500,001491007022500,00796009922500,00Сумма9030048295000,00

Определим среднюю арифметическую вариационного дискретного ряда без испытуемого элемента по формуле:

= = = 6450

Определим дисперсию без учета испытуемого элемента по формуле:

s2 = = = 3449642,86.

Среднеквадратическое отклонение составит:

s = = = 1857,32

Рассчитаем допустимый предел:

D = 4*s = 4*1857,32 = 7429,28

Тогда допустимые границы вариации признака составят:

= [6450 — 7429,28; 6450 + 7429,28] = [-979,28; 13879,28].

Испытуемый элемент у = 11700 входит в расчетные пределы [-979,28; 13879,28]. Соответственно, исследуемая совокупность является однородной и данный элемент не исключается из дальнейшего анализа.

3.Расчет показателей вариации

Для анализа вариации построим таблицу 4. Данная таблица заполняется на основе таблицы, приведенной в Приложении, и следующих формул:

= ;

s2 = ;

s = ;

Таблица 4. Анализ вариации

Показатели вариацииyx1x2x3; 6800292,008066,67511,33; 4934666,679922,671352888,696384,89sу; sxi2221,4199,611163,1479,91Vy; Vxi32,6734,1114,4215,63

Проверка фактического распределения результативного признака на близость к нормальному Проверка проводится по способу Вестергарда, согласно которому фактическое распределение данных можно считать близким к нормальному, если оно удовлетворяет следующим условиям (таблица 5).

Таблица 5

Если в интервалеСодержится25%50%75%100%

Результаты проверки оформим в таблице 6.

Таблица 6. Проверка на близость к нормальному распределению фактического распределения результативного признака

Интервалы (числовые данные)Частота признака при распределенииНормальномФактическомабсолютномотносительном, %абсолютномотносительном, %(6134; 7466)425425(5245; 8355)850850(4357; 9244)11751075(136; 13464)1510015100

Фактическое распределение результативного признака достаточно близко к нормальному распределению.

4.Отбор факторных признаков

Основание и отбор факторных признаков можно произвести на основе симметричной матрицы линейных коэффициентов парной корреляции.

Коэффициент парной линейной корреляции можно рассчитать по следующей формуле:

ryxi = .

Результаты представим в таблице 7.

Таблица 7. Симметричная матрица линейных коэффициентов парной корреляции

ух1х2х3у10,1850,9580,968х10,18510,1780,072х20,9580,17810,964х30,9680,0720,9641

ryx1 = = 0,185 — связь слабая, прямая.

ryx2 = = 0,958 — связь сильная, прямая.

ryx3 = = 0,968 — связь сильная, прямая.

rx1х2 = = 0,178 — связь очень слабая, прямая.

rx1х3 = = 0,072 — связь слабая, прямая.

rх2х3 = = 0,964 — связи сильная, прямая.

Наиболее тесно связанным результативным признаком является факторный признак х3, поскольку ryx3 = 0,968 — max.

5.Расчет квадратичной ошибки коэффициента корреляции

Если совокупность относится к однородной и нормально-распределенной, то ошибку коэффициента корреляции можно вычислить по формуле:

hyxi = .

Результаты расчетов запишем в таблице 8.

Таблица 8. Расчет квадратической ошибки коэффициента корреляции

ух1х2х3у-0,1760,0220,017х10,176-0,0080,266х20,0220,008-0,019х30,0170,2660,019-

hyx1 = =(1-0,34225)/3,741657=0,176.

hyx2 = = 0,022.

hyx3 = = 0,017.

hx1х2 = = (1-0,031684)/3,741657=0,008.

hx1х3 = = (1-0,005184)/3,741657=0,266.

hx2х3 = = 0,019.

6.Нахождение и статистическая оценка уравнения регрессии

Сделаем предположение о линейной зависимости изучаемых признаков и запишем уравнение линейной регрессионной зависимости:

y = b0 + b1?x3.

Для определения параметров b0 и b1 в этом регрессионном уравнении решим следующую систему нормальных уравнений:

.

b0 = = =-6958,59;

b1 = = =26,907.

Таблица 9. Расчет теоретических значений результативного признака

Факторный признакРезультативный признакХ3у35032002458,8639040003535,1444042004880,4946054005418,6348056005956,7748058005956,7751062006763,9852064007033,0552072007033,0553074007302,1254076007571,1958086008647,4759091008916,54640960010261,896401170010261,89Построим график эмпирической и теоретической линий регрессии.

Рис.

Коэффициент b1 = 26,907 показывает, что при увеличении фактора х3 на 1 ед. результативный признак у увеличивается на 6958,59 ед.

7.Определение линейной зависимости между тремя признаками

Из таблицы 7 выберем еще один факторный признак, связанный с результативным и имеющим наибольшее значение ryxi. Это будем факторный признак х1.

Составим уравнение множественной корреляции:

yx1x2 = b0 + b1*x1 + b3*x3

и система нормальных уравнений примет вид:

b0 = = — 7596,767565;

b1 = = — 2,591077;

b3 = = 26,675696.

Уравнение множественной регрессии, выражающее зависимость результирующего признака от факторных признаков х1 и х3, примет вид:

у = — 7597 — 2,591*х1 + 26,676*х3.

С увеличением факторного признака х1 на 1 ед., значение результирующего признака уменьшится на 2,591 ед. при неизменном значении факторного признака х3.

Увеличение же факторного признака х3 может привести к увеличению результирующего признака на 26,676 ед. при неизменном значении факторного признака х1.

Рассчитаем коэффициент множественной корреляции:

Ryx1x3 = = = 0,97.

Коэффициент множественной детерминации R2yx1x3 = 0,9409 показывает, что вариация значения результирующего признака на 94,09% обусловливается двумя анализируемыми факторами. Рассчитаем ошибку коэффициента множественной корреляции:

SR = = = 0,013.

Рассчитаем совокупный коэффициент детерминации.

R2 = ,

где — дисперсия факторных признаков.

= — =

= — 68002 = -5459800.

R2 = = 1,1.

Проверка: коэффициент множественной корреляции, возведенный в квадрат, должен равняться коэффициенту детерминации:

(Ryx1x3)2 = R2

,972 = 1

Выводы

На основании расчетов первого раздела выяснили, что испытуемый элемент у = 11700 входит в расчетные пределы [-979,28; 13879,28].

Исследуемая совокупность является однородной и данный элемент не исключался из дальнейшего анализа.

По расчетам второго разделал определили, что совокупность является близкой к нормальному распределению.

В третьем разделе провели расчеты линейного коэффициента корреляции и его ошибки. Выявили факторы, которые будут использованы для дальнейших расчетов: х1 и х3.

В четвертом разделе определили взаимосвязь между результативным признаком и факторным признаком х3. Данная зависимость описывается уравнением у = 26,907*х3. -6958,59. Коэффициент b1 = 26,907 показывает, что при увеличении фактора х1 на 1 ед. результативный признак у увеличивается на 6958,59 ед.

В последнем разделе определили взаимосвязь между результативным признаком и факторными признаками х1 и х3.

Уравнение множественной регрессии, выражающее зависимость результирующего признака от факторных признаков х1 и х3, примет вид:

у = — 7597 — 2,591*х1 + 26,676*х3.

С увеличением факторного признака х1 на 1 ед., значение результирующего признака уменьшается на 2,591 ед. при неизменном значении факторного признака х3.

Увеличение же факторного признака х3 может привести к увеличению результирующего признака на 26,679 ед. при неизменном значении факторного признака х1.

Вариация значения объема реализованной продукции на 94,09% обусловливается двумя анализируемыми факторами.

Список литературы

.Практикум по эконометрике. /Под ред. Елисеевой И.И. м.: Финансы и статистика, 2008.

.Эконометрика. Учебник. /Под ред. Елисеевой И.И. М.: Финансы и статистика, 2009.

.Финансы и статистика, 2006. — 576 с.

.Эконометрика: Учебно-методическое пособие / Шалабанов А.К., Роганов Д.А. — Казань: ТИСБИ, 2002. — 56 с.

.Доугерти К. Введение в эконометрику: Пер. с англ. — М.:ИНФРА-М, 1999. — 402 с.

.Кремер Н.Ш., Путко Б.А. Эконометрика: Учебник для вузов /под ред. проф. Н.Ш. Кремера. — М.: ЮНИТИ-ДАНА, 2002. — 311 с.

.Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика.Начальный курс: Учебник. — М.: Дело, 2001. — 400 с.

.Катышев П.К., Магнус Я.Р., Пересецкий А.А. Сборник задач к начальному курсу эконометрики. — М.: Дело, 2002. — 208 с.

.Прикладная статистика. Основы эконометрики: Учебник для вузов: В 2-х т. — Т. 1. Айвазян С.А., Мхитарян В.С. Теория вероятностей и прикладная статистика. — М: ЮНИТИ-ДАНА, 2001. — 656 с.

.Прикладная статистика. Основы эконометрики: Учебник для вузов: В 2-х т. — Т. 2. Айвазян С.А. Основы эконометрики. — М: ЮНИТИ-ДАНА, 2001. — 432 с.

.Эконометрика: Учебник / Тихомиров Н.П., Дорохина Е.Ю. — М.: Издательство «Экзамен», 2003. — 512 с.

.Сборник задач по эконометрике: Учебное пособие для студентов экономических вузов / Сост. Е.Ю. Дорохина, Л.Ф. Преснякова, Н.П. Тихомиров. — М.: Издательство «Экзамен», 2003. — 224 с.

.Эконометрика: Учебн. пособие для вузов / А.И. Орлов — М.: Издательство «Экзамен», 2002. — 576 с.

.Мардас А.Н. Эконометрика. — СПб: Питер, 2001. — 144 с.

.Гмурман В.Е. Теория вероятностей и математическая статистика: Учебн. пособие для вузов. — М.: Высш. шк., 2002. — 479 с.


yamiki.ru

Статистическое изучение взаимосвязи Факторный и результативный признаки

Статистическое изучение взаимосвязи

Факторный и результативный признаки ¡ ¡ Факторный признак выполняет роль причины Результативный признак выполняет роль следствия и испытывает влияние факторного признака

Виды взаимосвязей ¡ ¡ ¡ По характеру: Функциональная – одному результативному признаку соответствует только один факторный признак Корреляционная – проявляется в массе явлений, каждому значению факторного признака может соответствовать несколько значений результативного признака

Виды связей ¡ ¡ ¡ По направлению: Прямая или положительная направление изменения результативного признака совпадает с направлением изменения факторного признака Обратная или отрицательная – направление изменения результативного признака не совпадает с направлением изменения факторного

Виды связей По форме ¡ Линейная – изменение результата равномерно с изменением факторного признака ¡ Нелинейная — изменение результата происходит неравномерно с изменением факторного признака ¡

Методы изучения взаимосвязей Балансовый метод – исходя из балансового равенства может быть рассчитан любой недостающий элемент З 1 + П = З 2 + Р + В – З 1 ¡ Индексный метод – см. тему индексы ¡

Методы изучения взаимосвязей ¡ ¡ ¡ Графический метод – построение графика, нанесение всех данных на график. Методы регрессии и корреляции – построение уравнения взаимосвязи и оценка тесноты связи Непараметрические методы – используются при изучении взаимосвязей между качественными признаками (пол, образование, цвет)

Непараметрический метод. Построение таблицы сопряженности Высшее Среднее ИТОГО Довольны Не работой довольны работой а b ИТОГО a+b c d c+d a+c b+d a+b+c+d

Непараметрические показатели тесноты связи. ¡ Коэффициент ассоциации Данный коэффициент меняется от -1 до +1. Чем ближе показатель с +1 или -1, тем сильнее взаимосвязь между явлениями

Непараметрические показатели тесноты связи. ¡Коэффициент контингенции ¡Коэффициент всегда меньше коэффициента ассоциации. Связь считается подтвержденной, если Kа или Кк 0, 3 0, 5

Коэффициент Фехнера ¡ Коэффициент Фехнера – коэффициент совпадения знаков, который основан на применении первых степеней отклонений связанных рядов. ¡ Коэффициент изменяется от -1 до +1. Чем ближе показатель к указанным границам, тем сильнее взаимосвязь

Значение коэффициента Фехнера [-0, 9; -1] Качественная характеристика силы связи Очень высокая обратная [-0, 7; -0, 9] Высокая обратная [-0, 5; -0, 7] Заметная обратная [-0, 3; -0, 5] Умеренная обратная [-0, 1; -0, 3] Слабая обратная 0 Связь отсутствует 0, 1 — 0, 3 Слабая прямая 0, 3 — 0, 5 Умеренная прямая 0, 5 — 0, 7 Заметная прямая 0, 7 — 0, 9 Высокая прямая 0, 9 — 1 Очень высокая прямая

Коэффициент Фехнера. Пример. Урожайность пшеницы в зависимости от внесенных удобрений № хозяйства Урожайность пшеницы Количество внесенных удобрений 1 15, 4 0, 7 2 12, 9 0, 3 3 18, 7 1, 2 4 15, 8 1, 3 5 19, 0 1, 6 6 14, 4 0, 7 7 13, 3 0, 7 8 17, 2 0, 8 9 18, 4 2, 0 10 16, 8 1, 3

Коэффициент Фехнера. Пример. ¡ ¡ Рассчитаем среднее значение каждого показателя и сравним со значениями в каждом хозяйстве. Если среднее значение выше, чем уровень показателя в хозяйстве, то ставим знак «-» , если ниже – знак «+» . Среднее значение и урожайности, и количества внесенных удобрений рассчитывается по формуле средней арифметической простой.

Коэффициент Фехнера. Пример. ¡ ¡ Средняя урожайность: 16, 1 Среднее количество внесенных удобрений: 1, 1

Коэффициент Фехнера. Пример. № хозяйства Урожайность пшеницы Количество внесенных удобрений 1 15, 4 0, 7 2 12, 9 0, 3 3 18, 7 1, 2 4 15, 8 1, 3 5 19, 0 1, 6 6 14, 4 0, 7 7 13, 3 0, 7 8 17, 2 0, 8 9 18, 4 2, 0 10 16, 8 1, 3 Знак отклонений По пшенице По удобрениям

Коэффициент Фехнера. Пример. № хозяйства Урожайность пшеницы Количество внесенных удобрений Знак отклонений 1 15, 4 0, 7 — — 2 12, 9 0, 3 — — 3 18, 7 1, 2 + + 4 15, 8 1, 3 — + 5 19, 0 1, 6 + + 6 14, 4 0, 7 — — 7 13, 3 0, 7 — — 8 17, 2 0, 8 + — 9 18, 4 2, 0 + + 10 16, 8 1, 3 + + По пшенице По удобрениям

Коэффициент Фехнера. Пример. Коэффициент Фехнера показывает, что между количеством удобрений и урожайностью существует прямая связь и достаточно тесная

Коэффициент корреляции ¡ Для оценки тесноты связи применяют коэффициент корреляции: Или ¡ Коэффициент корреляции изменяется -1 до +1. Чем ближе r по своему абсолютному значению (-1 к +1), тем теснее взаимосвязь. Если r положительный, то взаимосвязь прямая, если отрицательный, то взаимосвязь обратная.

Уравнение регрессии ¡ Если связь линейная, то регрессионное уравнение имеет вид: ¡ Значения коэффициентов определяются при решении системы уравнений следующего вида:

present5.com

Понятие факторного и результативного признака

Понятие факторного и результативного признака

1.Исходные данные

арифметический вариационный факторный признак

Таблица 1

№Результативный признак Факторные признаки№ 3 (товарная продукция лесозаготовок, тыс. руб)№ 5 (вывозка древесины, лесоматер. Кругл, тыс. м)№ 24 (выработка товарной продукции на 1 работающего, руб)№ 26 (удельные трудозатраты на лесозаготовках, чел.-дней/ 1000 м)ух1х2х317600330860054025400310740046035800370750048044200270710044057200400850052068600170880058079600280950064085600170740048091170053010300640106400230840052011620037077005101232002805300350134000320700039014910013090005901574002208500530х1, х2, х3 — независимая переменная (факторный признак)

у — зависимая переменная (результативный признак)

2.Проверка однородности исследуемой совокупности

В таблице 2 проранжируем исходные данные по результативному признаку (у).

Таблица 2. Ранжированные исходные данные

№Результативный признакФакторные признаки№ 3№ 5№ 24№ 26ух1х2х312320028053003501340003207000390442002707100440254003107400460856001707400480358003707500480116200370770051010640023084005205720040085005201574002208500530176003308600540686001708800580149100130900059079600280950064091170053010300640

у = 11700 — испытуемый элемент совокупности.

Таблица 3. Расчет параметров для проверки однородности исследуемой совокупности

№уi12320010562500,001340006002500,00442005062500,00254001102500,0085600722500,0035800422500,0011620062500,001064002500,0057200562500,00157400902500,00176001322500,00686004622500,001491007022500,00796009922500,00Сумма9030048295000,00

Определим среднюю арифметическую вариационного дискретного ряда без испытуемого элемента по формуле:

= = = 6450

Определим дисперсию без учета испытуемого элемента по формуле:

s2 = = = 3449642,86.

Среднеквадратическое отклонение составит:

s = = = 1857,32

Рассчитаем допустимый предел:

D = 4*s = 4*1857,32 = 7429,28

Тогда допустимые границы вариации признака составят:

= [6450 — 7429,28; 6450 + 7429,28] = [-979,28; 13879,28].

Испытуемый элемент у = 11700 входит в расчетные пределы [-979,28; 13879,28]. Соответственно, исследуемая совокупность является однородной и данный элемент не исключается из дальнейшего анализа.

3.Расчет показателей вариации

Для анализа вариации построим таблицу 4. Данная таблица заполняется на основе таблицы, приведенной в Приложении, и следующих формул:

= ;

s2 = ;

s = ;

Таблица 4. Анализ вариации

Показатели вариацииyx1x2x3; 6800292,008066,67511,33; 4934666,679922,671352888,696384,89sу; sxi2221,4199,611163,1479,91Vy; Vxi32,6734,1114,4215,63

Проверка фактического распределения результативного признака на близость к нормальному Проверка проводится по способу Вестергарда, согласно которому фактическое распределение данных можно считать близким к нормальному, если оно удовлетворяет следующим условиям (таблица 5).

Таблица 5

Если в интервалеСодержится25%50%75%100%

Результаты проверки оформим в таблице 6.

Таблица 6. Проверка на близость к нормальному распределению фактического распределения результативного признака

Интервалы (числовые данные)Частота признака при распределенииНормальномФактическомабсолютномотносительном, %абсолютномотносительном, %(6134; 7466)425425(5245; 8355)850850(4357; 9244)11751075(136; 13464)1510015100

Фактическое распределение результативного признака достаточно близко к нормальному распределению.

4.Отбор факторных признаков

Основание и отбор факторных признаков можно произвести на основе симметричной матрицы линейных коэффициентов парной корреляции.

Коэффициент парной линейной корреляции можно рассчитать по следующей формуле:

ryxi = .

Результаты представим в таблице 7.

Таблица 7. Симметричная матрица линейных коэффициентов парной корреляции

ух1х2х3у10,1850,9580,968х10,18510,1780,072х20,9580,17810,964х30,9680,0720,9641

ryx1 = = 0,185 — связь слабая, прямая.

ryx2 = = 0,958 — связь сильная, прямая.

ryx3 = = 0,968 — связь сильная, прямая.

rx1х2 = = 0,178 — связь очень слабая, прямая.

rx1х3 = = 0,072 — связь слабая, прямая.

rх2х3 = = 0,964 — связи сильная, прямая.

Наиболее тесно связанным результативным признаком является факторный признак х3, поскольку ryx3 = 0,968 — max.

5.Расчет квадратичной ошибки коэффициента корреляции

Если совокупность относится к однородной и нормально-распределенной, то ошибку коэффициента корреляции можно вычислить по формуле:

hyxi = .

Результаты расчетов запишем в таблице 8.

Таблица 8. Расчет квадратической ошибки коэффициента корреляции

ух1х2х3у-0,1760,0220,017х10,176-0,0080,266х20,0220,008-0,019х30,0170,2660,019-

hyx1 = =(1-0,34225)/3,741657=0,176.

hyx2 = = 0,022.

hyx3 = = 0,017.

hx1х2 = = (1-0,031684)/3,741657=0,008.

hx1х3 = = (1-0,005184)/3,741657=0,266.

hx2х3 = = 0,019.

6.Нахождение и статистическая оценка уравнения регрессии

Сделаем предположение о линейной зависимости изучаемых признаков и запишем уравнение линейной регрессионной зависимости:

y = b0 + b1?x3.

Для определения параметров b0 и b1 в этом регрессионном уравнении решим следующую систему нормальных уравнений:

.

b0 = = =-6958,59;

b1 = = =26,907.

Таблица 9. Расчет теоретических значений результативного признака

Факторный признакРезультативный признакХ3у35032002458,8639040003535,1444042004880,4946054005418,6348056005956,7748058005956,7751062006763,9852064007033,0552072007033,0553074007302,1254076007571,1958086008647,4759091008916,54640960010261,896401170010261,89Построим график эмпирической и теоретической линий регрессии.

Рис.

Коэффициент b1 = 26,907 показывает, что при увеличении фактора х3 на 1 ед. результативный признак у увеличивается на 6958,59 ед.

7.Определение линейной зависимости между тремя признаками

Из таблицы 7 выберем еще один факторный признак, связанный с результативным и имеющим наибольшее значение ryxi. Это будем факторный признак х1.

Составим уравнение множественной корреляции:

yx1x2 = b0 + b1*x1 + b3*x3

и система нормальных уравнений примет вид:

b0 = = — 7596,767565;

b1 = = — 2,591077;

b3 = = 26,675696.

Уравнение множественной регрессии, выражающее зависимость результирующего признака от факторных признаков х1 и х3, примет вид:

у = — 7597 — 2,591*х1 + 26,676*х3.

С увеличением факторного признака х1 на 1 ед., значение результирующего признака уменьшится на 2,591 ед. при неизменном значении факторного признака х3.

Увеличение же факторного признака х3 может привести к увеличению результирующего признака на 26,676 ед. при неизменном значении факторного признака х1.

Рассчитаем коэффициент множественной корреляции:

Ryx1x3 = = = 0,97.

Коэффициент множественной детерминации R2yx1x3 = 0,9409 показывает, что вариация значения результирующего признака на 94,09% обусловливается двумя анализируемыми факторами. Рассчитаем ошибку коэффициента множественной корреляции:

SR = = = 0,013.

Рассчитаем совокупный коэффициент детерминации.

R2 = ,

где — дисперсия факторных признаков.

= — =

= — 68002 = -5459800.

R2 = = 1,1.

Проверка: коэффициент множественной корреляции, возведенный в квадрат, должен равняться коэффициенту детерминации:

(Ryx1x3)2 = R2

,972 = 1

Выводы

На основании расчетов первого раздела выяснили, что испытуемый элемент у = 11700 входит в расчетные пределы [-979,28; 13879,28].

Исследуемая совокупность является однородной и данный элемент не исключался из дальнейшего анализа.

По расчетам второго разделал определили, что совокупность является близкой к нормальному распределению.

В третьем разделе провели расчеты линейного коэффициента корреляции и его ошибки. Выявили факторы, которые будут использованы для дальнейших расчетов: х1 и х3.

В четвертом разделе определили взаимосвязь между результативным признаком и факторным признаком х3. Данная зависимость описывается уравнением у = 26,907*х3. -6958,59. Коэффициент b1 = 26,907 показывает, что при увеличении фактора х1 на 1 ед. результативный признак у увеличивается на 6958,59 ед.

В последнем разделе определили взаимосвязь между результативным признаком и факторными признаками х1 и х3.

Уравнение множественной регрессии, выражающее зависимость результирующего признака от факторных признаков х1 и х3, примет вид:

у = — 7597 — 2,591*х1 + 26,676*х3.

С увеличением факторного признака х1 на 1 ед., значение результирующего признака уменьшается на 2,591 ед. при неизменном значении факторного признака х3.

Увеличение же факторного признака х3 может привести к увеличению результирующего признака на 26,679 ед. при неизменном значении факторного признака х1.

Вариация значения объема реализованной продукции на 94,09% обусловливается двумя анализируемыми факторами.

Список литературы

.Практикум по эконометрике. /Под ред. Елисеевой И.И. м.: Финансы и статистика, 2008.

.Эконометрика. Учебник. /Под ред. Елисеевой И.И. М.: Финансы и статистика, 2009.

.Финансы и статистика, 2006. — 576 с.

.Эконометрика: Учебно-методическое пособие / Шалабанов А.К., Роганов Д.А. — Казань: ТИСБИ, 2002. — 56 с.

.Доугерти К. Введение в эконометрику: Пер. с англ. — М.:ИНФРА-М, 1999. — 402 с.

.Кремер Н.Ш., Путко Б.А. Эконометрика: Учебник для вузов /под ред. проф. Н.Ш. Кремера. — М.: ЮНИТИ-ДАНА, 2002. — 311 с.

.Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика.Начальный курс: Учебник. — М.: Дело, 2001. — 400 с.

.Катышев П.К., Магнус Я.Р., Пересецкий А.А. Сборник задач к начальному курсу эконометрики. — М.: Дело, 2002. — 208 с.

.Прикладная статистика. Основы эконометрики: Учебник для вузов: В 2-х т. — Т. 1. Айвазян С.А., Мхитарян В.С. Теория вероятностей и прикладная статистика. — М: ЮНИТИ-ДАНА, 2001. — 656 с.

.Прикладная статистика. Основы эконометрики: Учебник для вузов: В 2-х т. — Т. 2. Айвазян С.А. Основы эконометрики. — М: ЮНИТИ-ДАНА, 2001. — 432 с.

.Эконометрика: Учебник / Тихомиров Н.П., Дорохина Е.Ю. — М.: Издательство «Экзамен», 2003. — 512 с.

.Сборник задач по эконометрике: Учебное пособие для студентов экономических вузов / Сост. Е.Ю. Дорохина, Л.Ф. Преснякова, Н.П. Тихомиров. — М.: Издательство «Экзамен», 2003. — 224 с.

.Эконометрика: Учебн. пособие для вузов / А.И. Орлов — М.: Издательство «Экзамен», 2002. — 576 с.

.Мардас А.Н. Эконометрика. — СПб: Питер, 2001. — 144 с.

.Гмурман В.Е. Теория вероятностей и математическая статистика: Учебн. пособие для вузов. — М.: Высш. шк., 2002. — 479 с.


diplomba.ru