Общая дисперсия характеризует – 24.Дисперсия. Свойства дисперсии.
Общая дисперсия
Характеризует вариацию признака, который зависит от всех условий в данной совокупности.
, где — общая средняя для всей изучаемой совокупности.
Межгрупповая дисперсия
Отражает вариацию изучаемого признака, который возникает под влиянием признака-фактора, положенного в основу группировки. Она характеризует колеблемость групповых (частных) средних около общей средней
, где — средняя по отдельным группам;- средняя общая; fi – численность отдельных групп.
Средняя из внутригрупповых дисперсий
Характеризует случайную вариацию в каждой отдельной группе. Эта вариация возникает под влиянием других, не учитываемых факторов, и не зависит от условия (признака-фактора), положенного в основу группировки. Определяется:
1. Рассчитаем общую дисперсию.
Пример.
Расчет общей дисперсии, складывающейся под влиянием всех факторов (объема выручки предприятия и форма собственности)
Объем выручки продукции в среднем на 1 предприятие, млрд.р. (х) | Число предприятий по форме собственности | Расчет общей дисперсии | ||||||
Государ-ственные fr | Приватизи-рованные fn | Всего F0 | x/ | x/f0 | x/— | (x/-)2f0 | ||
1,0-1,2 | 3 | 3 | 1,1 | 3,3 | -0,714 | 0,5098 | 1,5294 | |
1,2-1,4 | 4 | 4 | 1,3 | 5,2 | -0,514 | 0,2642 | 1,0568 | |
1,4-1,6 | 17 | 17 | 1,5 | 25,5 | 0,0986 | 1,6762 | ||
1,6-1,8 | 11 | 15 | 26 | 1,7 | 44,2 | -0,114 | 0,0129 | 0,3354 |
1,8-2,0 | 13 | 6 | 19 | 1,9 | 36,1 | +0,086 | 0,0074 | 0,1406 |
2,0-2,2 | 18 | 5 | 23 | 2,1 | +0,286 | 0,0818 | 1,8814 | |
2,2-2,4 | 6 | 6 | 2,3 | 13,8 | +0,486 | 0,2362 | 1,4172 | |
2,4-2,6 | 2 | 2 | 2,5 | 5,0 | +0,686 | 0,4706 | 0,9412 | |
Итого: | 50 | 50 | 100 | 181,4 | 8,9782 |
Находим выработку в среднем на одно предприятие
Определяем общую дисперсию
Т.е. колеблемость объема выручки по исследуемым предприятиям составила 0,089782 млрд.р, что обусловлено и мощностью предприятия и формой собственности.
2. Рассчитаем среднюю из внутригрупповых дисперсий
Теперь рассмотрим, как складываются показатели выручки и ее вариации по группам в зависимости от форм собственности.
Расчет средней дисперсии по государственным предприятиям
fГ | fГ | — | (-)2 | (-)2 fГ | |
1,7 | 11 | 18,7 | -0,3 | 0,09 | 0,99 |
1,9 | 13 | 24,7 | -0,1 | 0,01 | 0,13 |
2,1 | 18 | 37,8 | 0,1 | 0,01 | 0,18 |
2,3 | 13,8 | 0,3 | 0,09 | 0,54 | |
2,5 | 2 | 5,0 | 0,5 | 0,25 | 0,5 |
Итого: | 50 | 100 | 2,34 |
В среднем на одно государственное предприятие выручка составила
, колеблемость его в совокупности гос.предприятий равна
или 46,8 млн.р.
Таким образом, 46,8 млн.р характеризуют вариацию признака внутри группы гос.предпр.
Производим расчет показателей по приватизированным предприятиям
FП | fП | — | (-)2 | (-)2 fП | |
1,1 | 3 | 3,3 | -0,528 | 0,7288 | 0,8363 |
1,3 | 4 | 5,2 | -0,328 | 0,1076 | 0,4303 |
1,5 | 17 | 25,5 | -0,128 | 0,0164 | 0,2785 |
1,7 | 15 | 25,5 | 0 | 0,0052 | 0,778 |
1,9 | 6 | 11,4 | 0,72 | 0,0739 | 0,4439 |
2,1 | 5 | 10,5 | 0,272 | 0,2228 | 1,1139 |
Итого: | 50 | 81,4 | 0,472 | 3,1807 |
, что ниже выручки предприятий, находящихся в государственной собственности. Вариация равна
0,06361млрд.р. или 63,61 млн.р., что выше чем в группе гос.предприятий.
Средняя из групповых дисперсий дает обобщающую характеристику случайной вариации, возникающую под влиянием неучтенных факторов
3. Рассчитаем межгрупповую дисперсию
Мерой колеблемости частных средних вокруг общей средней является межгрупповая дисперсия (дисперсия групповых средних)
Расчет межгрупповой дисперсии
Группы предприятий по форме собственности | Средний объем выручки одного предприятия, | Число предприятий, | ()2 | ()2fi | |
Государственные | 2,0 | 50 | 0,186 | 0,0346 | 1,7298 |
Приватизированные | 1,628 | 50 | -0,186 | 0,0346 | 1,7298 |
Итого: | 100 | 3,4596 |
= 1,814 млрд.р.
studfiles.net
23) Дисперсия признака.
Дисперсия в статистике находится как среднее квадратическое отклонениеиндивидуальных значений признака в квадрате отсредней арифметической. В зависимости от исходных данных она определяется по формулам простой и взвешенной дисперсий:
1. Простая дисперсия (для несгруппированных данных) вычисляется по формуле:
2. Взвешенная дисперсия (для вариационного ряда):
где n — частота (повторяемость фактора Х)
Виды дисперсии
Общая дисперсия измеряет вариацию признака по всей совокупности в целом под влиянием всех факторов, обуславливающих эту вариацию. Она равняется среднему квадрату отклонений отдельных значений признака х от общего среднего значения х и может быть определена как простая дисперсия или взвешенная дисперсия.
Внутригрупповая дисперсия характеризует случайную вариацию, т.е. часть вариации, которая обусловлена влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Такая дисперсия равна среднему квадрату отклонений отдельных значений признака внутри группы X от средней арифметической группы и может быть вычислена как простая дисперсия или как взвешенная дисперсия.
Таким образом, внутригрупповая дисперсия измеряет вариацию признака внутри группы и определяется по формуле:
где хi — групповая средняя; ni — число единиц в группе.
Например, внутригрупповые дисперсии, которые надо определить в задаче изучения влияния квалификации рабочих на уровень производительности труда в цехе показывают вариации выработки в каждой группе, вызванные всеми возможными факторами (техническое состояние оборудования, обеспеченность инструментами и материалами, возраст рабочих, интенсивность труда и т.д.), кроме отличий в квалификационном разряде (внутри группы все рабочие имеют одну и ту же квалификацию).
Средняя из внутри групповых дисперсий отражает случайную вариацию, т. е. ту часть вариации, которая происходила под влиянием всех прочих факторов, за исключением фактора группировки. Она рассчитывается по формуле:
Межгрупповая дисперсия характеризует систематическую вариацию результативного признака, которая обусловлена влиянием признака-фактора, положенного в основание группировки. Она равняется среднему квадрату отклонений групповых средних от общей средней. Межгрупповая дисперсия рассчитывается по формуле:
24) Закон сложения (разложения) вариации и дисперсии
Согласно правилу сложения дисперсий общая дисперсия равна сумме средней из внутригрупповых и межгрупповых дисперсий:
Смысл этого правила заключается в том, что общая дисперсия, которая возникает под влиянием всех факторов, равняется сумме дисперсий, которые возникают под влиянием всех прочих факторов, и дисперсии, возникающей за счет фактора группировки.
Пользуясь формулой сложения дисперсий, можно определить по двум известным дисперсиям третью неизвестную, а также судить о силе влияния группировочного признака.
25) Понятие рядов распределения, их виды.
Часто встречаются группировки, где известна численность единиц в группах или удельный вес каждой группы в общем итоге. Такая группировка называется рядом распределения. Ряд распределения характеризуется двумя элементами:
1. Обозначение группы
2. Численность единиц в группах
Численность каждой группы называется частотами ряда распределения. Сумма всех частот определяет численность всей совокупности. Численность групп, выраженная в долях от общей численности единиц называется частостями и выражается в процентах.
Ряды распределения могут быть образованы по атрибутивному или количественному признакам. При группировке по атрибутивному признаку ряд распределения составляют отдельные группы, указываемые их наименованием и численность или удельный вес каждой группы в процентах к итогу.
При группировке данных по количественному признаку получаются ряды, называемые вариационными. В статистике различают вариационные ряды прерывные (дискретные) и непрерывные. Вариационный ряд будет дискретным, если его группы составлены по признаку изменяющемуся прерывно. Вариационный ряд называется непрерывным если группировочный признак, составляющий основание группировки может принимать в определенном интервале любые значения.
Статистический ряд распределения — это упорядоченое распределение единиц совокупности на группы по определенному варьирующему признаку.
В зависимости от признака, положенного в основу образования ряда распределения, различают атрибутивные и вариационные ряды распределения.
Атрибутивными называют ряды распределения, построенные по качественным признакам. Ряд распределения принято оформлять в виде таблиц. Ниже приведем атрибутивный ряд распределения юридической помощи адвокатов гражданам. Представленный в табл. 3.11 ряд показывает, как общее число случаев юридической помощи адвокатов распределялось по видам и формам правовой помощи в 1994 г.
Элементами этого ряда распределения являются значения атрибутивного признака, представленного названиями видов правовой помощи, оказанной адвокатами, и числа случаев, относящихся к каждому виду и форме помощи. Наибольший удельный вес (почти 79%) приходится на оказание юридической помощи и виде устных советов.
Атрибутивные ряды распределения характеризуют состав совокупности по тем или иным существенным признакам. Взятые на несколько периодов, эти данные позволят исследовать изменение структуры.
Вариационными называют ряды распределения, построенные по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот. Вариантами считаются отдельные значения признака, которые он принимает в вариационном ряду, т е. конкретное значение варьирующего признака. Частоты — это численности отдельных вариантов или каждой группы вариационного ряда, т. е. это числа, показывающие, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность всей совокупности, ее объем.
Частостями называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1 или 100%.
В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды.
Как известно, вариация количественных признаков может быть дискретной (прерывной) или непрерывной.
В случае дискретной вариации величина количественного признака принимает только целые значения. Следовательно, дискретный вариационный ряд характеризует распределение единиц совокупности по дискретному признаку.
studfiles.net
Презентация на тему: Выделяют дисперсии:
1)общую
2)межгрупповую
внутригрупповую
Величина общей дисперсии характеризует вариацию признака под воздействием всех факторов, вызывающих эту вариацию:
2 xj x 2 fj
f j
где j – номер варианты
Межгрупповая дисперсия (дисперсия групповых средних или факторная дисперсия) характеризует систематическую вариацию, т. е. различия в величине изучаемого признака, возникающие под влиянием одного фактора, положенного в основание группировки
2 xi x 2 ni
ni
где xi – среднее значение изучаемого
признака для i – й группыx – общая средняя для всей
совокупности
i- номер группы
ni – количество единиц вi – й группе
Внутригрупповая (средняя из групповых или остаточная) дисперсия характеризует случайную вариацию, т. е. ту часть вариации, которая вызвана действием других неучтённых факторов, и не зависящую от фактора, положенного в основании группировки:
Эмпирический коэффициент детерминации:
Эмпирический коэффициент детерминации показывает долю общей вариации изучаемого признака, обусловленную вариацией группировочного признака (факторного)
Эмпирическое корреляционное отношение :
Эмпирическое корреляционное отношение характеризует степень влияния группировочного признака на результативный показатель. Эмпирическое корреляционное отношение изменяется в пределах от -1до 1. Чем ближе IηI к единице, тем степень влияния больше
studfiles.net
Виды дисперсии, правило сложения дисперсий
Изучение вариации (колеблемости, рассеивания) (см. Показатели вариации) признака по всей совокупности в целом, предусматривает изучение вариации для каждой из составляющих ее групп, а также между этими группами. В простейшем случае, когда совокупность разбита на группы по одному фактору, изучение вариации достигается посредством исчисления и анализа трех видов дисперсий: общей, межгрупповой и внутригрупповой.
Общая дисперсия D(x) измеряет вариацию признака по всей совокупности под влиянием всех факторов, обусловивших эту вариацию. Она равна среднему квадрату отклонений отдельных значений признака (хi) от общей средней величины и может быть вычислена как: 1. простая дисперсия 2. взвешенная дисперсия
Межгрупповая дисперсия (факторная) характеризует систематическую вариацию результативного признака, обусловленную влиянием признака-фактора, положенного в основание группировки. Она равна среднему квадрату отклонений групповых (частных) средних от общей средней:
Внутригрупповая дисперсия (частная, остаточная, случайная) отражает случайную вариацию неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Она равна среднему квадрату отклонений отдельных значений признака внутри группы (хi) от средней арифметической этой группы (xср) (групповой средней) и может быть исчислена как:
1. простая дисперсия 2. взвешенная дисперсия
На основании внутригрупповой дисперсии по каждой группе можно определить общую среднюю из внутригрупповых дисперсий:
Дисперсия и среднее значение доли альтернативного признака
Среди варьирующих признаков, которые изучает статистика, встречаются признаки, которые проявляются в том, что у одних единиц совокупности эти признаки наблюдаются, у других нет. Иными словами: альтернативный признак — это такой единственный признак, который может принимать единица совокупности из всех возможных вариантов. Если рассматривать продукцию по категориям (сортам), то она может быть либо только I категории (сорта), либо только II категории (сорта) — в данном контексте следует рассматривать эти признаки как два противоположных события. Признаки, которыми обладают одни единицы и не обладают другие, называются альтернативными. Количественно вариация альтернативного признака в численности всей совокупности обозначается p, а доля единиц, не обладающих этим признаком, обозначается q и принимает значения: p=1, q=0
(смотри Ошибка выборки для доли альтернативного признака)
- Среднее значение для доли альтернативного признака
- Дисперсия альтернативного признака
Подставив в формулу дисперсии q = 1 – p, получим:
Таким образом, дисперсия альтернативного признака равна произведению доли на дополняющее эту долю до единицы число. Т.к. p+q=1, то средний квадрат отклонений не может быть больше 0,25. Среднеквадратическое отклонение доли альтернативного признака:
Правило сложения дисперсий
Согласно правилу сложения дисперсий, общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсий.
Пользуясь правилом сложения дисперсий, можно всегда по двум известным дисперсиям определить третью – неизвестную. Чем больше доля межгрупповой дисперсии в общей дисперсии, тем сильнее влияние группировочного признака на изучаемый признак. Поэтому в статистическом анализе широко используется эмпирический коэффициент детерминации — показатель, представляющий собой долю межгрупповой дисперсии в общей дисперсии результативного признака и характеризующий силу влияния группировочного признака на образование общей вариации:
При отсутствии связи эмпирический коэффициент детерминации равен нулю, а при функциональной связи – единице. Эмпирическое корреляционное отношение (см. пример) – это корень квадратный из эмпирического коэффициента детерминации:
Он показывает тесноту связи между группировочным и результативным признаками. Эмпирическое корреляционное отношение может принимать значения от 0 до 1. Если связь отсутствует, то корреляционное отношение равно нулю, т.е. все групповые средние будут равны между собой, межгрупповой вариации не будет. Значит, группировочный признак никак не влияет на образование общей вариации. Если связь функциональная, то корреляционное отношение будет равно единице. В этом случае дисперсия групповых средних равна общей дисперсии, т.е. внутригрупповой вариации не будет. Это означает, что группировочный признак целиком определяет вариацию изучаемого результативного признака. Чем значение корреляционного отношения ближе к единице, тем теснее, ближе к функциональной зависимости связь между признаками.
Смотри схему дисперсионного анализа: Проверка адекватности регрессионной модели
Примечание: приведены так же формулы расчета коэффициента детерминации и корреляционного отношения, которые используются при анализе рядов динамики.
Пример расчета дисперсии
Условие:
Объем дневной выручки в 5 торговых точках составил: 16, 21, 26, 23, X5 (у.е.). Учитывая, что Хср.= 22, найти выборочную дисперсию S2
Решение: Опр. среднюю
Смотри также
helpstat.ru
4.9. Свойства дисперсии и способы ее расчета
В статистике наиболее часто мерой колеблемости признака служат дисперсия и среднее квадратическое отклонение. Дисперсия обладает рядом математических свойств, позволяющих упростить ее расчет.
1. Дисперсия постоянной величины равна нулю
2. Уменьшение всех значений признака на одну и ту же величину А не меняет величины дисперсии
3. Уменьшение всех значений признака в к раз уменьшает дисперсию в к2 раз
4. Если вычислить дисперсию от любой величины А, в той или иной степени отличающейся от средней арифметической , то она всегда будет больше дисперсии, вычисленной от средней арифметической
Дисперсия от А при этом будет больше на вполне определенную величину – на квадрат разности средней и величины А
или
Из данного свойства следует важнейший вывод, что дисперсия от средней всегда меньше дисперсий от любых других величин, т.е. дисперсия от средней имеет свойство минимальности.
Если в последней формуле величину А приравнять к нулю, то получим
2 = (x2f/f) – (xf/f)2 = .
Это упрощенный способ расчета дисперсии.
Это значит, что средний квадрат отклонений вариантов от средней величины равен среднему квадрату значений признака за вычетом квадрата среднего значения признака.
Кроме того, можно использовать для расчета дисперсии способ отсчета от условного нуля или способ моментов, который заключается в нахождении вариант, уменьшенных на условно постоянную величину А и в k раз, где k – интервал, т.е. х1=(х – А)/k, и последующем расчете дисперсии по формуле
2.
Расчеты дисперсии различными способами дают одинаковые результаты, что позволяет исследователю выбрать наиболее эффективный способ.
4.10. Дисперсия альтернативного признака
В ряде случаев изучают не среднюю величину признака, а долю единиц, обладающих тем или иным признаком, например: долю прибыльных или убыточных подразделений предприятия, долю услуг, предоставленных с соблюдением или нарушением качества, и т.д.
Это примеры альтернативных вариаций, когда имеются лишь два взаимоисключающих варианта: наличие или отсутствие признака у данной единицы совокупности (1 наличие признака, 0 отсутствие). В таких случаях определяется дисперсия альтернативного признака.
Пусть доля единиц, обладающих данным признаком, равна р, а доля единиц, не обладающих этим признаком, 1–р, тогда =xf/f = [1∙p+0∙(1–p)]/(p+1–p) = p .
Естественно, средняя постоянной величины р есть сама эта величина, а дисперсия
2p = (x – )2f/f = [(1 – p)2p+(0 – p)2(1 – p)]/(p+1 – p) =
= (1 – p) p (1 – p+p)/1 = p(1 – p) ,
p = .
Максимальное значение дисперсии альтернативного признака составляет 0,25 при р=0,5.
4.11. Виды дисперсий и правило их сложения
Для сгруппированной, т.е. разделенной на j групп, статистической совокупности можно вычислить три вида дисперсий:
Общая дисперсия характеризует колеблемость признака во всей изучаемой совокупности и определяется по формуле:
где xi – значение признака i –й единицы совокупности,
— среднее значение признака в совокупности.
Для оценки колеблемости признака внутри каждой j –й группы вычисляют внутригрупповые дисперсии:
,
где — значение признака у-й единицы совокупности-й группы,- среднее значение признака в- й группе,- число единиц в- й группе.
Обобщенную характеристику внутригрупповой колеблемости вокруг групповых средних дает средняя величина из внутригрупповых дисперсий: .
Межгрупповая дисперсия показывает вариацию групповых средних вокруг средней величины признака в совокупности:
Между рассмотренными дисперсиями существует взаимосвязь, которая называется правилом сложения дисперсий: общая дисперсия равна сумме межгрупповой дисперсии и средней из внутригрупповых дисперсий.
.
Логика этого правила такова: общая вариация в совокупности складывается из вариации признака внутри отдельных групп и вариации между группами.
studfiles.net
Дисперсия, ее виды и свойства — Мегаобучалка
Вариация признака складывается под воздействием множества факторов, т.к. социально-экономические явления и процессы носят сложный характер. В исследованиях иногда возникает необходимость оценить не только общую вариацию признака, но и ту ее часть, которая обусловлена действием постоянных, стабильных, а не случайных факторов. В этих случаях рассчитывают три вида дисперсии:
— общую;
— межгрупповую;
— внутригрупповую.
Общая дисперсия характеризует общую вариацию признака под влиянием всех факторов (условий, причин). Она рассчитывается по формуле 6.13:
, (6.13)
где − средняя по всей изучаемой совокупности.
Для определения влияния постоянного фактора на вариацию признака производят аналитическую группировку, в основании которой лежит данный фактор. Вариация, обусловленная фактором, положенным в основание группировки, оценивается с помощью межгрупповой дисперсии:
, (6.14)
где гр – средняя по отдельным группам;
− численность отдельных групп.
Для определения влияния случайных факторов рассчитывают дисперсию внутри каждой группы, т.е. внутригрупповую
, (6.15)
где xгр – индивидуальные значения признака в группе,
fгр – их частоты;
а затем среднюю из внутригрупповых дисперсий
(6.16)
Доказано, что общая дисперсия равна сумме межгрупповой дисперсии и средней из внутригрупповых дисперсий:
(6.17)
Это равенство называется правилом сложения дисперсий.
Правило сложения дисперсий получило широкое распространение на практике. На его основе вычисляется эмпирическое корреляционное отношение (коэффициент корреляционного отношения или эмпирический коэффициент корреляционного отношения):
принимает значение от 0 до 1.
Оно показывает тесноту связи между признаками (раздел 10).
Возведенное в квадрат эмпирическое корреляционное отношение представляет собой коэффициент детерминации ( ), который характеризует долю общей колеблемости признака-результата, вызванную действием признака-фактора, положенного в основание группировки.
Наряду с вариацией количественного признака часто возникает необходимость измерить вариацию альтернативного признака.
Если ввести обозначения:
1 – наличие интересующего исследователя признака;
0 – отсутствие интересующего исследователя признака;
p – доля единиц, обладающих данным признаком;
q – доля единиц, не обладающих данным признаком,
то среднее значение альтернативного признака будет равно:
(6.18)
Тогда дисперсия альтернативного признака определяется по формуле
. (6.19)
Учитывая, что 1− p = q
. (6.20)
Таким образом, дисперсия альтернативного признака равна произведению доли единиц, обладающих данным признаком, на долю единиц, которые им не обладают:
либо . (6.21)
Дисперсия облает рядом математических свойств, которые значительно упрощают её вычисление. К основным из них относятся следующие:
1. Если все значения признака увеличить или уменьшить в А раз, то дисперсия соответственно увеличится или уменьшится в раз.
2. Если все значения признака увеличить или уменьшить на какое-то постоянное число x0, то дисперсия от этого не изменится.
3. Если все значения частот различить или умножить на какое-то число b, то дисперсия от этого не изменится.
Используя эти свойства одновременно, можно рассчитать дисперсию по «способу моментов». Если взять за основу исходную формулу дисперсии
, (6.22)
то формула дисперсии, исчисляемой по «способу моментов», будет иметь вид:
(6.23)
Например, рассчитаем дисперсию выработки рабочих цеха № 2 по «способу моментов» (таблица 6.3).
Таблица 6.3 – Расчет дисперсии выработки по «способу моментов»
Исходя из полученных данных:
.
Таким образом, результат не зависит от применяемой формулы. В нашем примере (цех № 2) по всем формулам (6.3, 6.6, 6.23) получено одно и то же значение дисперсии .
ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ
7.1. Понятие выборочного наблюдения.
7.2. Обобщающие характеристики генеральной и выборочной совокупности.
7.3. Виды, способы и методы отбора единиц из генеральной в выборочную совокупность.
7.4. Ошибки выборочного наблюдения.
7.5. Определение численности выборки.
7.6. Малая выборка и сфера ее применения.
megaobuchalka.ru
7.3. Виды дисперсий. Правило сложения дисперсий.
Рассчитав общую среднюю величину и дисперсию для исследуемой совокупности, нельзя определить влияние отдельных факторов (причин) на вариацию признака, определяется только совокупное влияние факторов. Для выявления влияния конкретных факторов, необходимо изучаемую совокупность подразделить на группы, однородные по признаку – фактору. Далее рассчитываются три показателя колеблемости признака: общая дисперсия, межгрупповая дисперсия и средняя из внутригрупповых дисперсий.
Например, опытные земельные участки сгруппированы по урожайности на два массива по признаку – удобряемость почвы: не удобряемая и удобряемая.
Общая дисперсия – характеризует вариацию признака, которая зависит от всех факторов.
(7.21), ,,=235.
Межгрупповая дисперсия – отражает вариацию признака, которая возникает под влиянием признака-фактора, положенного в основу группировки. Характеризует колеблемость групповых средних около общей средней.
(7.22), где — средняя отдельных групп,- численность групп.
или 43% от общей дисперсии, т.е. вариация урожайности зависит от удобряемости на 43%.
Средняя из внутригрупповых дисперсий – характеризует случайную вариацию в каждой отдельной группе, которая возникает под влиянием других факторов, не учтённых, и не зависит от признака, положенного в основу группировки.
(7.23), где — групповые дисперсии.(57% общей вариации, в пределах групп урожайность зависит от других факторов).
Правило сложения дисперсий состоит в том, что (7.24), то есть общая дисперсия признака всегда равна сумме величин межгрупповой дисперсии и средней из внутригрупповых дисперсий. Данное правило позволяет:
а) определить недостающий показатель:
б) проанализировать степень влияния фактора-признака на результат.
Для проведения факторного анализа рассчитываются :
Коэффициент детерминации: (7.25) — показывает зависимость результативного признака от группировочного; на- фактор удобряемости обуславливает вариацию урожайности, остальное – влияние других, неучтённых факторов.
Эмпирическое корреляционное отношение: (7.26) — показывает тесноту связи между результативным и группировочным признаком: слабая, умеренная, заметная, существенная, близкая к функциональной. В примере:
— связь заметная.
7.4. Характеристика закономерности рядов распределения. Кривые нормального распределения.
С помощью рядов распределения статистика решает одну из своих задач: характеризует и измеряет колеблемость варьирующего признака. В вариационных рядах существует связь между частотами и значениями варьирующего признака: с увеличением признака величина частоты сначала возрастает до определённой границы, а потом уменьшается. Такие изменения называются закономерностями распределения.
Статистические данные рядов распределения по конкретному признаку в графическом виде представляют собой определенные кривые распределения. Задачей статистики является определить форму кривой (тип), степень рассеивания (чем больше рассеяна кривая, тем больше колеблемость признака), степень её асимметрии, высоко- или низковершинность. Цель такого исследования – проверить нормальность условий отбора данных, т.е. если кривая асимметрична или имеет две и более вершины, то состав данных разнотипен, их необходимо перегруппировать и выделить другие, более однородные группы.
Для определения характера распределения оценивают степень его однородности, т.е. вычисляют показатели асимметрии и эксцесса.
Симметричным (нормальным) распределением является то, у которого частоты двух вариант, равностоящих в обе стороны от центра распределения, равны между собой. В нём ,Mo и Me равны, т.е. показатели асимметрии равны нулю. В противном случае рассчитываются показатели асимметрии:
(7.27) или (7.28).
Они могут быть положительными и отрицательными. Если показатель асимметрии положительный (As>0), значит, присутствует правосторонняя асимметрия и .
Если показатель асимметрии отрицательный (), то асимметрия левосторонняя и.
Коэффициент асимметрии может изменяться от (-3) до (+3). Принято считать, что асимметрия больше 0,5 (независимо от знака) – значительная, меньше 0,25 – незначительная.
На практике чаще применяется показатель асимметрии:
(7.29), где — центральный момент третьего порядка*Центральный – момент распределения, при вычислении которого за исходную величину принимаются отклонения вариантов от средней арифметической данного ряда.
1
*Центральный – момент распределения, при вычислении которого за исходную величину принимаются отклонения вариантов от средней арифметической данного ряда.
70
studfiles.net