Выделите признаки по которым не могут быть построены дискретные ряды распределения – Ряды распределения. Атрибутные и вариационные ряды распределения. Ранжирования ряда. Характеристики варианта, частота, непрерывность, дискретность. Интервал
Понятие рядов распределения. Дискретные и интервальные ряды распределения
1.
2. Понятие рядов распределения. Дискретные и интервальные ряды распределения
Рядами распределения называются группировки особого вида, при которых по каждому признаку, группе признаков или классу признаков известны численность единиц в группе либо удельный вес этой численности в общем итоге. Т.е. ряд распределения – упорядоченная совокупность значений признака, расположенных в порядке возрастания или убывания с соответствующими им весами. Ряды распределения могут быть построены или по количественному, или по атрибутивному признаку.
Ряды распределения, построенные по количественному признаку, называются вариационными рядами. Они бывают дискретные и интервальные . Ряд распределения может быть построен по не прерывно варьирующему признаку (когда признак может принимать любые значения в рамках какого-либо интервала) и по дискретно варьирующему признаку (принимает строго определенные целочисленные значения).
Дискретным вариационным рядом распределения называется ранжированная совокупность вариантов с соответствующими им частотами или частностями. Варианты дискретного ряда – это дискретно прерывно изменяющиеся значения признак, обычно это результат подсчета.
Дискретные
вариационные ряды строят обычно в том случае, если значения изучаемого признака могут отличаться друг от друга не менее чем на некоторую конечную величину. В дискретных рядах задаются точечные значения признака. Пример : Распределение мужских костюмов, реализованных магазинами за месяц по размерам.Интервальным
вариационным рядомназывается упорядоченная совокупность интервалов варьирования значений случайной величины с соответствующими частотами или частостями попаданий в каждый из них значений величины. Интервальные ряды предназначены для анализа распределения непрерывно изменяющегося признака, значение которого чаще всего регистрируется путем измерения или взвешивания. Варианты такого ряда – это группировка.Если в дискретных вариационных рядах частотная характеристика относится непосредственно к варианту ряда, то в интервальных к группе вариантов.
Ряды распределения удобно анализировать при помощи их графического изображения, позволяющего судить и о форме распределения, о закономерностях. Дискретный ряд изображается на графике в виде ломаной линии –
Интервальные ряды изображаются в виде гистограмм распределения (то есть столбиков диаграмм).
При построении гистограммы на оси абсцисс откладываются величины интервалов, а частоты изображаются прямоугольниками, построенными на соответствующих интервалах. Высота столбиков в случае равных интервалов должна быть пропорциональна частотам.
Любая гистограмма может быть преобразована в полигон распределений, для этого необходимо соединить между собой отрезками прямой вершины ее прямоугольников.
2. Индексный метод анализа влияния средней выработки и среднесписочной численности на изменения объема продукции
Индексный метод применяется для анализа динамики и сравнения обобщающих показателей, а так же факторов, влияющих на изменение уровней этих показателей. С помощью индексов можно выявить влияние средней выработки и среднесписочной численности на изменения объема продукции. Эта задача решается путем построения системы аналитических индексов.
Индекс объема продукции с индексом среднесписочной численности работающих и индексом средней выработки связан таким же образом, как объем производства (Q) связан с выработкой (
Можно заключить, что объем продукции будет равняться произведению средней выработки и среднесписочной численности:
Q = w·r, где Q – объем продукции,
w — средняя выработка,
r – среднесписочная численность.
Как видно, речь идет о взаимосвязи явлений в статике: произведение двух факторов дает общий объем результативного явления. Очевидно также, что эта связь функциональная, следовательно, динамика этой связи изучается с помощью индексов. Для приведенного примера это следующая система:
Jw × Jr = Jwr .
Например, индекс объема продукции Jwr, как индекс результативного явления, можно разложить на два индекса-фактора: индекс средней выработки (Jw), и индекс среднесписочной численности (Jr):
↓ ↓ ↓
Индекс Индекс Индекс
объема средней среднесписочной
продукции выработки численности
где J w — индекс производительности труда, рассчитываемый по формуле Ласпейреса;
Jr — индекс численности работающих, рассчитываемый по формуле Пааше.
Индексные системы используются для определения влияния отдельных факторов на формирование уровня результативного показателя, позволяют по 2-м известным значениям индексов определить значение неизвестного.
На базе приведенной системы индексов можно найти и абсолютный прирост объема продукции, разложенный на влияние факторов.
1. Общий прирост объема продукции:
∆wr = ∑w1 r1 — ∑w0 r0 .
2. Прирост за счет действия показателя средней выработки:
∆wr/w = ∑w1 r1 — ∑w0 r1 .
3. Прирост за счет действия показателя среднесписочной численности:
∆wr/r = ∑w0 r1 — ∑w0 r0
∆wr = ∆wr/w + ∆wr/r.
Пример. Известны следующие данные
Мы можем определить, как изменился объем продукции в относительном и абсолютном выражении и как отдельные факторы повлияли на это изменение.
Объем продукции составил:
в базисном периоде
w0 * r0 = 2000 * 90 = 180000,
а в отчетном
w1 * r1 = 2100 * 100 = 210000.
Следовательно, объем продукции увеличился на 30000 или на 1,16%.
∆wr=∑w1 r1 -∑w0 r0= (210000-180000)=30000
или (210000:180000)*100%=1,16%.
Данное изменение объема продукции было обусловлено:
1) увеличением среднесписочной численности на 10 человек или на 111,1%
r1 /r0 = 100 / 90 = 1,11 или 111,1%.
В абсолютном выражении за счет этого фактора объем продукции увеличился на 20000:
w0 r1 – w0 r0 = w0 (r1 -r0 ) = 2000 (100-90) = 20000.
2) увеличением средней выработки на 105% или на 10000:
w1 r1 /w0 r1 = 2100*100/2000*100 = 1,05 или 105%.
В абсолютном выражении прирост составляет:
w1 r1 – w0 r1 = (w1 -w0 )r1 = (2100-2000)*100 = 10000.
Отсюда, совместное влияние факторов составило:
1. В абсолютном выражении
10000 + 20000 = 30000
2. В относительном выражении
1,11 * 1,05 = 1,16 (116%)
Следовательно, прирост составляет 1,16%. Оба результата были получены ранее.
3. Индексы постоянного состава. Принципы построения
Слово «index» в переводе означает указатель, показатель. В статистике индекс трактуется как относительный показатель, характеризующий изменение явления во времени, пространстве или по сравнению с планом. Поскольку индекс относительная величина, наименования индексов созвучны с наименованием относительных величин.
В тех случаях, когда мы анализируем изменение во времени сравниваемой продукции, мы можем поставить вопрос о том, как в различных условиях (на различных участках) меняются составляющие индекса (цена, физический объем, структура производства или реализации отдельных видов продукции). В связи с этим строятся индексы постоянного состава, переменного состава, структурных сдвигов.
Индекс постоянного (фиксированного) состава – это индекс, который характеризует динамику средней величины при одной и той же фиксированной структуре совокупности.
Принцип построения индекса постоянного состава – элиминировать влияние изменений в структуре весов на индексируемую величину путем расчета средневзвешенного уровня индексируемого показателя с одними и теми же весами.
Индекс постоянного состава по своей форме тождественен агрегатному индексу. Агрегатная форма является наиболее распространенной.
Индекс постоянного состава исчисляется с весами, зафиксированными на уровне одного какого-либо периода, и показывает изменение только индексируемой величины. Индекс постоянного состава элиминирует влияние изменений в структуре весов на индексируемую величину путем расчета средневзвешенного уровня индексируемого показателя с одними и теми же весами. В индексах постоянного состава сопоставляются показатели, рассчитанные на базе неизменной структуры явлений.
mirznanii.com
Ряды распределения.
Ряд распределения или вариационный ряд – упорядоченное распределение единиц совокупности по возрастающим или по убывающим значениям признака и подсчет единиц с тем или иным значением признака. Построение рядов распределения (структурной группировки) является первым этапом изучения вариации и осуществляется с целью выделения характерных свойств и закономерностей изучаемой совокупности. В зависимости от того, какой признак (количественный или качественный) взят за основу группировки данных, различают типы рядов распределения.
Если за основу группировки взят качественный признак, то такой ряд распределения называют атрибутивным (распределение по видам труда, по полу, по профессии, по религиозному признаку, национальной принадлежности и т.д.).
Если ряд распределения построен по количественному признаку, то такой ряд называют вариационным. Построить вариационный ряд — значит упорядочить количественное распределение единиц совокупности по значениям признака, а затем подсчитать числа единиц совокупности с этими значениями (построить групповую таблицу).
Выделяют три формы вариационного ряда: ранжированный ряд, дискретный ряд и интервальный ряд.
Ранжированный ряд — это распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака.
Другие формы вариационного ряда — групповые таблицы, составленные по характеру вариации значений изучаемого признака. По характеру вариации различают дискретные (прерывные) и непрерывные признаки.
Дискретный ряд — это такой вариационный ряд, в основу построения которого положены признаки с прерывным изменением (дискретные признаки). К последним можно отнести тарифный разряд, количество детей в семье, число работников на предприятии и т.д. Эти признаки могут принимать только конечное число определенных значений.
Если признак имеет непрерывное изменение (размер дохода, стаж работы, стоимость основных фондов предприятия и т.д., которые в определенных границах могут принимать любые значения), то для этого признака нужно строить интервальный вариационный ряд.
Величина интервала определяется по формуле , где
xmax, min — максимальное и минимальное значение признака, к – число групп.
Частота (частота повторения) — число повторений отдельного варианта значений признака, обозначается fi , а сумма частот, равная объему исследуемой совокупности, обозначается , где к – число вариантов значения признака.
Частоты ряда f могут заменяться частостями w, выраженными в относительных числах (долях или процентах). Они представляют собой отношения частот каждого интервала к их общей сумме, т.е.: , при этом
Основной целью анализа вариационных рядов является выявление закономерности распределения, исключая при этом влияние случайных для данного распределения факторов. Этого можно достичь, если увеличивать объем исследуемой совокупности и одновременно уменьшать интервал ряда.
В практике статистических исследований наиболее часто используются следующие закономерности распределения: нормальное распределение и распределение Пуассона.
Нормальное распределение зависит от двух параметров: средней арифметической и среднего квадратического отклонения. Его кривая выражается уравнением
где у — ордината кривой нормального распределения; — стандартизованные отклонения; е и π — математические постоянные; x — варианты вариационного ряда; — их средняя величина; — cреднее квадратическое отклонение.
Теоретические частоты при нормальном распределении определяются по формуле: , где N = Sf – сумма всех эмпирических частот вариационного ряда; h – величина интервала в группах.
При помощи этой формулы мы получаем теоретическое (вероятностное) распределение, заменяя им эмпирическое (фактическое) распределение, по характеру они не должны отличаться друг от друга.
Если вариационный ряд представляет собой распределение по дискретному признаку, где при увеличении значений признака х частоты начинают резко уменьшаться, а средняя арифметическая, в свою очередь, равна или близка по значению к дисперсии (), такой ряд выравнивается по кривой Пуассона.
Кривую Пуассона можно выразить отношением , где Px — вероятность наступления отдельных значений х; — средняя арифметическая ряда.
Теоретические частоты при распределении Пуассона определяют по формуле: f’ = N Px , где N – общее число единиц ряда.
Для расчета обобщающих показателей и для графического изображения вариационных рядов с неравными интервалами используют плотность распределения, которая определяется по формулам:
,
где — абсолютная плотность распределения в j-м интервале, — относительная плотность распределения в j-м интервале; ij – величина интервала.
Объективная характеристика соответствия теоретических и эмпирических частот может быть получена при помощи специальных статистических показателей, которые называют критериями согласия.
Асимметрия распределения определяется на основе расчета коэффициента асимметрии, котрый является мерой несимметричности распределения. Если этот коэффициент отчетливо отличается от 0, распределение является асимметричным. Плотность нормального распределения симметрична относительно среднего.
Для оценки близости эмпирических и теоретических частот применяются критерий согласия Пирсона, критерий согласия Романовского, критерий согласия Колмогорова.
Наиболее распространенным является критерий согласия К. Пирсона, который можно представить как сумму отношений квадратов расхождений между f’ и f к теоретическим частотам:
Вычисленное значение критерия c2расч необходимо сравнить с табличным (критическим) значением c2табл. Табличное значение определяется по специальной таблице, оно зависит от принятой вероятности Р и числа степеней свободы k (при этом k = m — 3, где m — число групп в ряду распределения для нормального распределения). При расчете критерия согласия Пирсона должно соблюдаться следующее условие: достаточно большим должно быть число наблюдений (n ³ 50), при этом если в некоторых интервалах теоретические частоты меньше 5, то интервалы объединяют для условия больше 5.
Если c2расч £ c2табл, то расхождения между эмпирическими и теоретическими частотами распределения могут быть случайными и предположение о близости эмпирического распределения к нормальному не может быть отвергнуто.
В том случае, если отсутствуют таблицы для оценки случайности расхождения теоретических и эмпирических частот, можно использовать критерий согласия В.И. Романовского (КРом), который, используя величину c2, предложил оценивать близость эмпирического распределения кривой нормального распределения при помощи отношения: , где m — число групп; k = (m — 3 ) — число степеней свободы при исчислении частот нормального распределения.
Если вышеуказанное отношение < 3, то расхождения эмпирических и теоретических частот можно считать случайными, а эмпирическое распределение — соответствующим нормальному. Если отношение > 3, то расхождения могут быть достаточно существенными и гипотезу о нормальном распределении следует отвергнуть.
Критерий согласия А.Н. Колмогорова используется при определении максимального расхождения между частотами эмпирического и теоретического распределения, вычисляется по формуле: , где D — максимальное значение разности между накопленными эмпирическими и теоретическими частотами; Sf — сумма эмпирических частот.
По таблицам значений вероятностей l-критерия можно найти величину l, соответствующую вероятности Р. Если величина вероятности Р значительна по отношению к найденной величине , то можно предположить, что расхождения между теоретическим и эмпирическим распределениями несущественны.
Необходимым условием при использовании критерия согласия Колмогорова является достаточно большое число наблюдений (не меньше ста).
При анализе вариационного ряда и его свойств используют графические методы. Интервальный ряд изображаю столбиковой диаграммой или гистограммой, в которой основания столбиков, расположенные на оси – абсцисс – это интервалы значений варьирующего признака, а высоты столбиков – частоты.
Если имеется дискретный вариационный ряд или используются середины интервалов, то графическое изображение такого ряда называют полигоном.
Преобразованной формой вариационного ряда является ряд накопленных частот. Это ряд значений числа единиц совокупности с меньшими или равными нижней границе соответствующего интервала значениями признака. Такой ряд называют кумулятивным. Можно построить кумулятивное распределение «не меньше, чем» – кумулята, и «больше, чем» – огива.
www.ekonomstat.ru
3.2. Ряды распределения в статистике — КиберПедия
1. Основанием группировки может быть:
a) качественный признак;
b) количественный признак;
c) как качественный, так и количественный признаки;
d) нет правильного ответа
Интервал — это
a) разность между максимальным и минимальным значениями признака по совокупности;
b) разность между верхней и нижней границами значений признака по одной группе;
c) разность между числом единиц (частотами) соседних групп;
d) признак, по которому осуществляется группировка.
3. Величина интервала — это:
a) число единиц, попавших в группу;
b) разница между верхней и нижней границей интервала;
c) числовое значение, на основании которого единицы совокупности определяются в группы;
d) разница между максимальным и минимальным значением признака.
Ряд распределения — это
a) совокупность признаков, расположенных в определенном порядке;
b) разграничение единиц совокупности по одному из признаков;
c) единицы совокупности, расположенные в порядке возрастания или убывания значений признака;
d) количество единиц наблюдения, обладающих данным значением признака.
5. Ряд распределения, построенный по качественному признаку, называется:
a) атрибутивным;
b) дискретным;
c) вариационным;
d) непрерывным.
6. Вариационный ряд — это ряд распределения, построенный:
a) по количественному признаку;
b) качественному признаку;
c) качественному и количественному признакам одновременно;
d) нескольким признакам;
e) непрерывному признаку.
7. Выделите признаки, по которым могут быть построены дискретные ряды распределения:
a) стоимость основных фондов;
b) численность работников предприятий;
c) величина вкладов населения в учреждениях сберегательного банка;
d) размер обуви;
e) численность населения стран;
f) разряд сложности работы;
g) число членов семей.
8. Выделите признаки, по которым могут быть построены атрибутивные ряды распределения:
a) заработная плата работающих;
b) пол работников предприятий;
c) величина вкладов населения в учреждениях сберегательного банка;
d) уровень образования работников предприятий;
e) численность населения стран;
f) семейное положение работников предприятий.
9. Выделите признаки, по которым могут быть построены вариационные ряды распределения:
a) прибыль предприятия;
b) пол человека;
c) национальность;
d) возраст человека;
e) посевная площадь;
f) заработная плата;
g) уровень образования.
10. Население, проживающее на какой-либо территории, распределяют на группы по социальному положению. Полученный ряд называется:
a) вариационным;
b) атрибутивным;
c) альтернативным;
d) дискретным;
e) интервальным.
11. Частота — это:
a) отдельные значения признака;
b) повторяемость признака в ряду распределения;
c) количество единиц в совокупности;
d) характерна черта объекта.
12. При непрерывной вариации признака целесообразно построить:
a) атрибутивный ряд распределения;
b) дискретный ряд распределения;
c) интервальный ряд распределения;
d) ранжированный ряд распределения.
13. Под ранжированием понимают:
a) определение предела (интервала) изменений значений варьирующего признака;
b) количественная оценка степени вариации изучаемого признака;
c) расположение всех значений в возрастающем (или убывающем) порядке;
d) группировка по качественному признаку.
14. При изображении данных рядов распределения на графике применяются диаграммы:
a) гистограммы;
b) знаки Варзара;
c) полигоны;
d) кумуляты.
15. Графиком дискретного вариационного ряда распределения является:
a) гистограмма;
b) круговая диаграмма;
c) столбиковая диаграмма;
d) полигон.
16. Графиком интервального ряда распределения может являться:
a) полигон;
b) круговая диаграмма;
c) структурная диаграмма;
d) гистограмма.
17. Накопленные частоты используются при построении:
a) полигона;
b) гистограммы;
c) кумуляты;
d) круговой диаграммы.
Полигон — это
a) многоугольник;
b) график дискретного ряда распределения;
c) специально оборудованная площадь для проведения испытаний чего-нибудь;
d) график интервального ряда распределения.
Гистограмма — это
a) график дискретного ряда распределения;
b) график интервального ряда распределения;
c) графический рисунок процесса работы чего-нибудь;
d) график ранжированного ряда распределения.
cyberpedia.su
Тема № 7. Ряды распределения.
Ряд распределения или вариационный ряд – упорядоченное распределение единиц совокупности по возрастающим или по убывающим значениям признака и подсчет единиц с тем или иным значением признака. Построение рядов распределения (структурной группировки) является первым этапом изучения вариации и осуществляется с целью выделения характерных свойств и закономерностей изучаемой совокупности. В зависимости от того, какой признак (количественный или качественный) взят за основу группировки данных, различают типы рядов распределения.
Если за основу группировки взят качественный признак, то такой ряд распределения называют атрибутивным (распределение по видам труда, по полу, по профессии, по религиозному признаку, национальной принадлежности и т.д.).
Если ряд распределения построен по количественному признаку, то такой ряд называют вариационным. Построить вариационный ряд — значит упорядочить количественное распределение единиц совокупности по значениям признака, а затем подсчитать числа единиц совокупности с этими значениями (построить групповую таблицу).
Выделяют три формы вариационного ряда: ранжированный ряд, дискретный ряд и интервальный ряд.
Ранжированный ряд — это распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака.
Другие формы вариационного ряда — групповые таблицы, составленные по характеру вариации значений изучаемого признака. По характеру вариации различают дискретные (прерывные) и непрерывные признаки.
Дискретный ряд — это такой вариационный ряд, в основу построения которого положены признаки с прерывным изменением (дискретные признаки). К последним можно отнести тарифный разряд, количество детей в семье, число работников на предприятии и т.д. Эти признаки могут принимать только конечное число определенных значений.
Если признак имеет непрерывное изменение (размер дохода, стаж работы, стоимость основных фондов предприятия и т.д., которые в определенных границах могут принимать любые значения), то для этого признака нужно строить интервальный вариационный ряд.
Величина интервала определяется по формуле , где
xmax, min — максимальное и минимальное значение признака, к – число групп.
Частота (частота повторения) — число повторений отдельного варианта значений признака, обозначается fi , а сумма частот, равная объему исследуемой совокупности, обозначается , где к – число вариантов значения признака.
Частоты ряда f могут заменяться частостями w, выраженными в относительных числах (долях или процентах). Они представляют собой отношения частот каждого интервала к их общей сумме, т.е.: , при этом
Основной целью анализа вариационных рядов является выявление закономерности распределения, исключая при этом влияние случайных для данного распределения факторов. Этого можно достичь, если увеличивать объем исследуемой совокупности и одновременно уменьшать интервал ряда.
В практике статистических исследований наиболее часто используются следующие закономерности распределения: нормальное распределение и распределение Пуассона.
Нормальное распределение зависит от двух параметров: средней арифметической и среднего квадратического отклонения. Его кривая выражается уравнением
где у — ордината кривой нормального распределения; — стандартизованные отклонения; е и π — математические постоянные; x — варианты вариационного ряда; — их средняя величина; — cреднее квадратическое отклонение.
Теоретические частоты при нормальном распределении определяются по формуле: , где N = Sf – сумма всех эмпирических частот вариационного ряда; h – величина интервала в группах.
При помощи этой формулы мы получаем теоретическое (вероятностное) распределение, заменяя им эмпирическое (фактическое) распределение, по характеру они не должны отличаться друг от друга.
Если вариационный ряд представляет собой распределение по дискретному признаку, где при увеличении значений признака х частоты начинают резко уменьшаться, а средняя арифметическая, в свою очередь, равна или близка по значению к дисперсии ( ), такой ряд выравнивается по кривой Пуассона.
Кривую Пуассона можно выразить отношением , где Px — вероятность наступления отдельных значений х; — средняя арифметическая ряда.
Теоретические частоты при распределении Пуассона определяют по формуле: f’ = N Px, где N – общее число единиц ряда.
Для расчета обобщающих показателей и для графического изображения вариационных рядов с неравными интервалами используют плотность распределения, которая определяется по формулам:
,
где — абсолютная плотность распределения в j-м интервале, — относительная плотность распределения в j-м интервале; ij– величина интервала.
Объективная характеристика соответствия теоретических и эмпирических частот может быть получена при помощи специальных статистических показателей, которые называют критериями согласия.
Асимметрия распределения определяется на основе расчета коэффициента асимметрии, котрый является мерой несимметричности распределения. Если этот коэффициент отчетливо отличается от 0, распределение является асимметричным. Плотность нормального распределения симметрична относительно среднего.
Для оценки близости эмпирических и теоретических частот применяются критерий согласия Пирсона, критерий согласия Романовского, критерий согласия Колмогорова.
Наиболее распространенным является критерий согласия К. Пирсона, который можно представить как сумму отношений квадратов расхождений между f’ и f к теоретическим частотам:
Вычисленное значение критерия c2расч необходимо сравнить с табличным (критическим) значением c2табл. Табличное значение определяется по специальной таблице, оно зависит от принятой вероятности Р и числа степеней свободы k (при этом k = m — 3, где m — число групп в ряду распределения для нормального распределения). При расчете критерия согласия Пирсона должно соблюдаться следующее условие: достаточно большим должно быть число наблюдений (n ³ 50), при этом если в некоторых интервалах теоретические частоты меньше 5, то интервалы объединяют для условия больше 5.
Если c2расч £ c2табл, то расхождения между эмпирическими и теоретическими частотами распределения могут быть случайными и предположение о близости эмпирического распределения к нормальному не может быть отвергнуто.
В том случае, если отсутствуют таблицы для оценки случайности расхождения теоретических и эмпирических частот, можно использовать критерий согласия В.И. Романовского (КРом), который, используя величину c2, предложил оценивать близость эмпирического распределения кривой нормального распределения при помощи отношения: , где m — число групп; k = (m — 3 ) — число степеней свободы при исчислении частот нормального распределения.
Если вышеуказанное отношение < 3, то расхождения эмпирических и теоретических частот можно считать случайными, а эмпирическое распределение — соответствующим нормальному. Если отношение > 3, то расхождения могут быть достаточно существенными и гипотезу о нормальном распределении следует отвергнуть.
Критерий согласия А.Н. Колмогорова используется при определении максимального расхождения между частотами эмпирического и теоретического распределения, вычисляется по формуле: , где D — максимальное значение разности между накопленными эмпирическими и теоретическими частотами; Sf — сумма эмпирических частот.
По таблицам значений вероятностей l-критерия можно найти величину l, соответствующую вероятности Р. Если величина вероятности Р значительна по отношению к найденной величине , то можно предположить, что расхождения между теоретическим и эмпирическим распределениями несущественны.
Необходимым условием при использовании критерия согласия Колмогорова является достаточно большое число наблюдений (не меньше ста).
При анализе вариационного ряда и его свойств используют графические методы. Интервальный ряд изображаю столбиковой диаграммой или гистограммой, в которой основания столбиков, расположенные на оси – абсцисс – это интервалы значений варьирующего признака, а высоты столбиков – частоты.
Если имеется дискретный вариационный ряд или используются середины интервалов, то графическое изображение такого ряда называют полигоном.
Преобразованной формой вариационного ряда является ряд накопленных частот. Это ряд значений числа единиц совокупности с меньшими или равными нижней границе соответствующего интервала значениями признака. Такой ряд называют кумулятивным. Можно построить кумулятивное распределение «не меньше, чем» – кумулята, и «больше, чем» – огива.
Похожие статьи:
poznayka.org
Вопрос 10. Дискретные и интервальные ряды распределения и их графическое изображение
дискретные, — значения признака выражены в виде изолированных величин (чаще целых),
и интервальные (непрерывные) — в которых значения признака заданы определенным интервалом. (участники ВЭД по товарообороту: от 1000 до 10000 долл., от 10000 до 20000 долл..
Статистическое распределение дискретного вариационного ряда— это перечень вариант в возрастающем порядке и соответствующих им частот (относительных частот).
Статистическое распределение непрерывного вариационного ряда— это последовательность интервалов в возрастающем порядке и соответствующих им частот (в качестве частоты, соответствующей интервалу, принимают сумму частот вариант, попавших в этот интервал).
Способы построения и представления вариационных интервальных рядов.Интервалы подбираются так, чтобы ряд распределения дал более подробную, но обозримую структуру статистической совокупности.
Интервалы бывают равные и неравные:
· Равные применяют в случаях, когда показатель изменяется в незначительных пределах.
· Неравные — в остальных случаях.
Величина равных интервалов вычисляется по формуле:
, (5.1)
где xmax, xmin — максимальное и минимальное значения показателя, соответственно;
k — число интервалов.
Если не решен вопрос о количестве интервалов, то его рассчитывают по формуле, предложенной американским ученым Стеджерссом:
k= [1 + 3,222 lg (N)], где N — кол-во рассматриваемых показателей (объем совокупности),
Часто для расчета статистических показателей от непрерывного (интервального) ряда удобно перейти к дискретному. Для этого в качестве дискретных значений ряда берут середины частичных интервалов, а в качестве частот принимают сумму частот вариант, попавших в соответствующий интервал.
Для наглядности строят различные графические изображения статистического распределения.
Полигон частот (относительных частот) –это ломаная, вершинами которой являются точки (x1,f1),…, (xk ,fk) ((x1,fw1),…, (xk ,wk)), где x1,…, xk – варианты дискретного вариационного ряда, а f1,…,fk (w1,…,wk) – соответствующие частоты, выраженные в абсолютных единицах (относительные частоты, т.е. выраженные в %).
Для графического изображения интервального вариационного ряда используют гистограмму. При ее построении на оси абсцисс откладывают интервалы ряда, высота которых равна частотам (частостям), отложенным по оси ординат.
Вопрос 11. Статистическая таблица и ее элементы
Результаты статистических сводок и группировок чаще всего представляются в виде статистических таблиц.
Статистической таблицей называют форму наглядного изображения статистических данных о явлениях и процессах, присущих тем или иным сторонам общественной жизни.
Таблица представляет собой ряд пересекающихся горизонтальных и вертикальных линий, образующих по горизонтали строки, а по вертикали – графы (столбцы, колонки), которые в совокупности составляют скелет таблицы. Таблицу можно представить как простое предложение, где подлежащим является то, о чем идет речь в таблице, либо единица наблюдения, либо группа единиц совокупности, которые характеризуются цифровыми данными. могут быть предприятия, территории, виды продукции и т.п., а также группы или части.. Сказуемым таблицы называются числовые показатели, с помощью которых изучается объект, т.е. характеризующие подлежащее.
Таблица в зависимости от конструкции подлежащего бывают простые, групповые, комбинированные.
Простые — таблицы, содержащие перечень единиц стат. совокупности (либо хронологических дат).
Групповые — таблицы, подлежащее которых содержит группировку ед. наблюдения исходя из какого-либо одного признака.
Комбинационные (комбинированные) — таблицы, подлежащее которых содержит группировки единиц наблюдения не по одному, а по нескольким признакам.
Статистические таблицы являются не только формой наглядного и компактного изложения исходной информации, но и инструментом ее анализа, позволяют сопоставлять исходные данные, устанавливать взаимосвязь, выявлять закономерности изучаемых явлений.
Вопрос 12. Построение групповых и комбинационных таблиц
В зависимости от построения (разработки) подлежащего статистические таблицы подразделяются на три группы: простые, групповые, комбинационные.
Простые таблицы содержат перечень отдельных единиц, входящих в состав совокупности анализируемого экономического явления.
В групповых таблицах цифровая информация в разрезе отдельных составных частей исследуемой совокупности данных объединяется в определенные группы в соответствии с каким-либо признаком.
Комбинированные таблицы содержат отдельные группы и подгруппы, на которые подразделяются экономические показатели, характеризующие изучаемое экономическое явление. При этом такое подразделение осуществляется не по одному, а по нескольким признакам. в групповых таблицах осуществляется простая группировка показателей, а в комбинированных — комбинированная группировка. Простые таблицы вообще не содержат никакой группировки показателей. Последний вид таблиц содержит лишь несгруппированный набор сведений об анализируемом экономическом явлении.
Простые таблицы
Простые таблицы имеют в подлежащем перечень единиц совокупности, времени или территорий.
Групповые таблицы
Групповыми называются таблицы, имеющие в подлежащем группировку единиц совокупности по одному признаку.
Комбинационные таблицы
Комбинационные таблицы имеют в подлежащем группировку единиц совокупности по двум или более признакам.
По характеру разработки показателей сказуемого различают:
§ таблицы с простой разработкой показателей сказуемого, в которых имеет место параллельное расположение показателей сказуемого.
§ таблицы со сложной разработкой показателей сказуемого, в которых имеет место комбинирование показателей сказуемого: внутри групп, образованных по одному признаку, выделяют подгруппы по другому признаку.
Для достижения наибольшей выразительности статистической таблицы необходимо при ее оформлении придерживаться определенных правил
1 Форма статистической таблицы должна быть согласована с ранее существующими таблицами для обеспечения возможности сравнения данных за ряд отрезков времени
2 Название таблицы (общий заголовок) должна кратко и точно характеризовать основное ее содержание Это требование в равной степени касается и названий подлежащего и сказуемого таблицы Если общий заголовок недостаточно подробно сформулирован, то можно сделать примечания к нему.
3 В таблице должно быть указано, какой территории или какого периода или момента времени к приведенные данные, а также характер этих данных (фактич,норматив.,расчетные и т д.).
4 Показатели таблицы должны иметь единицы измерения
5 Все числовые значения данного показателя отмечаются с одинаковой точностью и др.
infopedia.su
Тема № 7. Ряды распределения.
Ряд распределения или вариационный ряд – упорядоченное распределение единиц совокупности по возрастающим или по убывающим значениям признака и подсчет единиц с тем или иным значением признака. Построение рядов распределения (структурной группировки) является первым этапом изучения вариации и осуществляется с целью выделения характерных свойств и закономерностей изучаемой совокупности. В зависимости от того, какой признак (количественный или качественный) взят за основу группировки данных, различают типы рядов распределения.
Если за основу группировки взят качественный признак, то такой ряд распределения называют атрибутивным (распределение по видам труда, по полу, по профессии, по религиозному признаку, национальной принадлежности и т.д.).
Если ряд распределения построен по количественному признаку, то такой ряд называют вариационным. Построить вариационный ряд — значит упорядочить количественное распределение единиц совокупности по значениям признака, а затем подсчитать числа единиц совокупности с этими значениями (построить групповую таблицу).
Выделяют три формы вариационного ряда: ранжированный ряд, дискретный ряд и интервальный ряд.
Ранжированный ряд — это распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака.
Другие формы вариационного ряда — групповые таблицы, составленные по характеру вариации значений изучаемого признака. По характеру вариации различают дискретные (прерывные) и непрерывные признаки.
Дискретный ряд — это такой вариационный ряд, в основу построения которого положены признаки с прерывным изменением (дискретные признаки). К последним можно отнести тарифный разряд, количество детей в семье, число работников на предприятии и т.д. Эти признаки могут принимать только конечное число определенных значений.
Если признак имеет непрерывное изменение (размер дохода, стаж работы, стоимость основных фондов предприятия и т.д., которые в определенных границах могут принимать любые значения), то для этого признака нужно строить интервальный вариационный ряд.
Величина
интервала определяется по формуле ,
где
xmax, min — максимальное и минимальное значение признака, к – число групп.
Частота
(частота повторения) — число повторений
отдельного варианта значений признака,
обозначается fi , а сумма частот, равная объему исследуемой
совокупности, обозначается ,
где к – число вариантов значения
признака.
Частоты
ряда f могут заменяться частостями w,
выраженными в относительных числах
(долях или процентах). Они представляют
собой отношения частот каждого интервала
к их общей сумме, т.е.: ,
при этом
Основной целью анализа вариационных рядов является выявление закономерности распределения, исключая при этом влияние случайных для данного распределения факторов. Этого можно достичь, если увеличивать объем исследуемой совокупности и одновременно уменьшать интервал ряда.
В практике статистических исследований наиболее часто используются следующие закономерности распределения: нормальное распределение и распределение Пуассона.
Нормальное
распределение зависит от двух параметров:
средней арифметической и среднего
квадратического отклонения. Его кривая
выражается уравнением
где
у — ордината кривой нормального
распределения;
—
стандартизованные отклонения; е и π —
математические постоянные; x — варианты
вариационного ряда; — их средняя величина;
—
cреднее квадратическое отклонение.
Теоретические
частоты при нормальном распределении
определяются по формуле: ,
гдеN
= f
– сумма всех эмпирических частот
вариационного ряда; h
– величина интервала в группах.
При помощи этой формулы мы получаем теоретическое (вероятностное) распределение, заменяя им эмпирическое (фактическое) распределение, по характеру они не должны отличаться друг от друга.
Если
вариационный ряд представляет собой
распределение по дискретному признаку,
где при увеличении значений признака
х частоты начинают резко уменьшаться,
а средняя арифметическая, в свою очередь,
равна или близка по значению к дисперсии
(),
такой ряд выравнивается по кривой
Пуассона.
Кривую
Пуассона можно выразить отношением ,
где Px — вероятность наступления отдельных
значений х;
— средняя арифметическая ряда.
Теоретические частоты при распределении Пуассона определяют по формуле: f’ = N Px , где N – общее число единиц ряда.
Для расчета обобщающих показателей и для графического изображения вариационных рядов с неравными интервалами используют плотность распределения, которая определяется по формулам:
,
где —
абсолютная плотность распределения вj-м
интервале,
— относительная плотность распределения
вj-м
интервале; ij – величина
интервала.
Объективная характеристика соответствия теоретических и эмпирических частот может быть получена при помощи специальных статистических показателей, которые называют критериями согласия.
Асимметрия распределения определяется на основе расчета коэффициента асимметрии, котрый является мерой несимметричности распределения. Если этот коэффициент отчетливо отличается от 0, распределение является асимметричным. Плотность нормального распределения симметрична относительно среднего.
Для оценки близости эмпирических и теоретических частот применяются критерий согласия Пирсона, критерий согласия Романовского, критерий согласия Колмогорова.
Наиболее
распространенным является критерий
согласия К. Пирсона, который можно
представить как сумму отношений квадратов
расхождений между f’ и f к теоретическим
частотам:
Вычисленное значение критерия 2расч необходимо сравнить с табличным (критическим) значением 2табл. Табличное значение определяется по специальной таблице, оно зависит от принятой вероятности Р и числа степеней свободы k (при этом k = m — 3, где m — число групп в ряду распределения для нормального распределения). При расчете критерия согласия Пирсона должно соблюдаться следующее условие: достаточно большим должно быть число наблюдений (n 50), при этом если в некоторых интервалах теоретические частоты меньше 5, то интервалы объединяют для условия больше 5.
Если 2расч 2табл, то расхождения между эмпирическими и теоретическими частотами распределения могут быть случайными и предположение о близости эмпирического распределения к нормальному не может быть отвергнуто.
В
том случае, если отсутствуют таблицы
для оценки случайности расхождения
теоретических и эмпирических частот,
можно использовать критерий согласия
В.И. Романовского (КРом),
который, используя величину 2,
предложил оценивать близость эмпирического
распределения кривой нормального
распределения при помощи отношения: ,
где m — число групп; k = (m — 3 ) — число степеней
свободы при исчислении частот нормального
распределения.
Если вышеуказанное отношение < 3, то расхождения эмпирических и теоретических частот можно считать случайными, а эмпирическое распределение — соответствующим нормальному. Если отношение > 3, то расхождения могут быть достаточно существенными и гипотезу о нормальном распределении следует отвергнуть.
Критерий
согласия А.Н. Колмогорова используется
при определении максимального расхождения
между частотами эмпирического и
теоретического распределения, вычисляется
по формуле: ,
где D — максимальное значение разности
между накопленными эмпирическими и
теоретическими частотами;f
— сумма эмпирических частот.
По таблицам значений вероятностей -критерия можно найти величину , соответствующую вероятности Р. Если величина вероятности Р значительна по отношению к найденной величине , то можно предположить, что расхождения между теоретическим и эмпирическим распределениями несущественны.
Необходимым условием при использовании критерия согласия Колмогорова является достаточно большое число наблюдений (не меньше ста).
При анализе вариационного ряда и его свойств используют графические методы. Интервальный ряд изображаю столбиковой диаграммой или гистограммой, в которой основания столбиков, расположенные на оси – абсцисс – это интервалы значений варьирующего признака, а высоты столбиков – частоты.
Если имеется дискретный вариационный ряд или используются середины интервалов, то графическое изображение такого ряда называют полигоном.
Преобразованной формой вариационного ряда является ряд накопленных частот. Это ряд значений числа единиц совокупности с меньшими или равными нижней границе соответствующего интервала значениями признака. Такой ряд называют кумулятивным. Можно построить кумулятивное распределение «не меньше, чем» – кумулята, и «больше, чем» – огива.
studfiles.net
12. Методика построения рядов распределения | Читать онлайн, без регистрации
12. Методика построения рядов распределения
Для атрибутивных и вариационных рядов применяют различные способы построения.
1. Построение атрибутивных рядов распределения. Атрибутивные ряды распределения обычно представляются в форме таблицы, причем в подлежащем такой таблицы перечисляются варианты атрибутивного признака, по которому строится ряд распределения. Как правило, число таких вариантов конечно. Если вариантов слишком много, то можно объединить некоторые из них (сущностно подобные) в классы, которые и будут новыми вариантами атрибутивного признака. В сказуемом таблицы отражаются частоты или частости каждого варианта, либо накопленные частоты или накопленные частости. Ряды распределения могут строиться по накопленным частотам, которые показывают, какое количество единиц имеет величину варианта не больше данной. Если вместо абсолютных частот взять частости, то аналогично получают и накопленные частости.
2. Построение дискретных вариационных рядов производится в следующей последовательности:
1) располагают варианты изучаемого признака в ранжированном порядке;
2) производят разноску единиц совокупности по вариантам (группировкам). Для этого строят таблицу;
3) подсчитывают количество единиц в каждой группе, т.е. определяют частоту каждого варианта. Частоты можно заменять частостями или использовать накопленные частоты (частости).
3. Построение интервального вариационного ряда производится в следующей последовательности:
1) выбирают оптимальное число групп (интервалов признака), на которые следует разбить совокупность. Число групп выбирается так, чтобы отразить многообразие значений признака в совокупности. Число групп устанавливается по формуле: к= 1 + 3,32lg N = 1,44 × lnN+ 1 (формула Стерджесса), где к– число групп; N — численность совокупности;
2) устанавливают длину интервала (шаг), которую рассчитывают по формуле:
3) определяют границы всех интервалов. Нижняя граница первого интервала принимается за хmin, верхняя граница первого интервала находится по формуле: xmin + h.
В качестве нижней границы второго интервала принимается верхняя граница первого, а верхнюю границу второго интервала получают прибавлением к верхней границе шага h. Процедуру повторяют до тех пор, пока не будут определены границы последней группы;
4) разносят единицы совокупности по интервалам;
5) подсчитывают единицы совокупности в каждом интервале.
Если полученные указанными выше способами группировки не удовлетворяют требованиям анализа, то производят перегруппировку. Ряды распределения используются в статистике как средство систематизации и упорядочивания материалов наблюдения, как метод изучения структуры явлений, анализа самих распределений и вариативности группировочного признака.
velib.com