Вариационный ряд распределения это – Ряды распределения. Атрибутные и вариационные ряды распределения. Ранжирования ряда. Характеристики варианта, частота, непрерывность, дискретность. Интервал
Ряды распределения в статистике
Построение рядов распределения
Наиболее простым способом обобщения статистического материала является построение рядов. Результатом сводки статистического исследования могут быть ряды распределения.
После определения группировочного признака, количества групп и интервалов группировки данные сводки и группировки представляются в виде рядов распределения и оформляются в виде статистических таблиц.
Ряд распределния является одним из видов группировок.
Рядом распределения в статистике называется упорядоченное распределение единиц совокупности на группы по какому-либо одному признаку: по качественному или количественному.
Виды рядов распределения
В зависимости от признака, положенного в основу образования ряда распределения различают атрибутивные и вариационные ряды распределения:
атрибутивными называют ряды распределения, построенные по качественными признакам;
вариационными называют ряды распределения, построенные в порядке возрастания или убывания значений количественного признака.
Вариационный ряд распределения состоит из двух столбцов. В первом столбце приводятся количественные значения варьирующегося признака, которые называются вариантами и обозначаются . Дискретная варианта — выражается целым числом. Интервальная варианта находится в пределах от и до. В зависимости от типа варианты можно построить дискретный или интервальный вариационный ряд. Во втором столбце содержится количество конкретных вариант, выраженное через частоты или частости:
частоты — это абсолютные числа, показывающие столько раз в совокупности встречается данное значение признака; сумма всех частот должна быть равна численности единиц всей совокупности;
частости — это частоты выраженные в процентах к итогу; сумма всех частостей выраженных в процентах должна быть равна 100% в долях единице.
Вариационный ряд характеризуется двумя элементами: вариантой (Х) и частотой (f). Варианта – это отдельное значение признака отдельной единицы или группы совокупности. Число, показывающее, сколько раз встречается то или иное значение признака, называется
Вариационный ряд может быть:
интервальным, когда определены границы «от» и «до», интервальные ряды распределения можно представить графически в виде гистограммы;
Графическое изображение рядов распределения
Наглядно ряды распределения представляются при помощи графических изображений.
Ряды распределения изображаются в виде:
полигона;
гистограммы;
кумуляты;
огивы.
При построении полигона на горизонтальной оси (ось абсцисс) откладывают значения варьирующего признака, а на вертикальной оси (ось ординат) — частоты или частости.
Для построения гистограммы по оси абсцисс указывают значения границ интервалов и на их основании строят прямоугольники, высота которых пропорциональна частотам (или частостям).
Распределение признака в вариационном ряду по накопленным частотам (частостям) изображается с помощью кумуляты.
Огива строится аналогично кумуляте с той лишь разницей, что накопленные частоты помещают на оси абсцисс, а значения признака — на оси ординат.
Разновидностью кумуляты является кривая концентрации или график Лоренца. Для построения кривой концентрации на обе оси прямоугольной системы координат наносится масштабная шкала в процентах от 0 до 100. При этом на оси абсцисс указывают накопленные частости, а на оси ординат — накопленные значения доли (в процентах) по объему признака.
studfiles.net
Ряды распределения —
Упорядоченное расположение единиц совокупности по изучаемому признаку представляет собой ряд распределения.
Любой ряд распределения позволяет получить информацию:
– о возможных вариантах значения признака, которые встречаются в данной статистической совокупности
– как часто встречаются отдельные значения данного признака.
В зависимости от признака различают:
-вариационные ряды распределения
-атрибутивные ряды распределения.
Элементы ряда распределения:
Значение признака (
варианта) -хiЧастота fi – число единиц совокупности с данным значением признака.
Сумма всех частот определяет численность всей совокупности.
Частостью называются частоты, выраженные в долях единицы или в %.
Накопленная частота – частота нарастающим итогом.
Накопленная частость – частость нарастающим итогом.
Если варианты расположены по возрастанию или убыванию, то ряды называются ранжированными.
В зависимости от характера вариации признака различают:
– дискретные вариационные ряды распределения
– интервальные ряды распределения.
Ряды распределения удобнее всего анализировать при помощи их графического изображения. Наглядное представление о характере изменения частот вариационного ряда дают полигон и гистограмма.
Полигон используется при изображении дискретных вариационных рядов. По оси абсцисс в одинаковом масштабе откладываются ранжированные значения варьирующего признака, а по оси ординат – величины частот. Точки, полученные на пересечении абсцисс и ординат, соединяются прямыми линиями, в результате получают ломаную линию, называемую полигоном частот.
Рис.3. Полигон распределения студентов по полученной оценке.
Для изображения интервального вариационного ряда применяется
Рис. 4. Гистограмма распределения студентов по заработанным баллам
При построении гистограммы распределения ряда с неравными интервалами по оси ординат наносят плотность распределения признака в соответствующих интервалах.
Для графического изображения вариационных рядов может использоваться кумулята – ряд накопленных частот. При построении кумуляты интервального ряда распределения по оси абсцисс откладываются варианты ряда, по оси ординат – накопленные частоты, которые наносят на поле графиков перпендикуляров к оси абсцисс в верхних границах интервалов. Затем перпендикуляры соединяют ломаной.
einsteins.ru
Статистические ряды распределения
Запишем исходные данные в виде ранжированного ряда:
6,3; 8,2; 9,6; 10,2; 10,2; 10,4; 10,5; 10,6; 10,7; 11,0; 11,3; 11,3; 11,6; 11,7; 11,8; 12,4; 13,1; 13,9; 15,1; 15,1.
Диапазон изменения вариант в выборке составляет 6–16. Этот диапазон разобьем на несколько интервалов. Ширину (шаг) интервала рассчитаем по формуле:
Следует иметь в виду, что чем меньше интервал, тем точнее результаты. В нашем случае принимаем размер интервала равным 2 единицам, то есть h=2. Зависимость между количеством групп (n) и численностью единиц совокупности (N) выражается формулой Стерджесса при условии, что данное распределение подчиняется закону нормального распределения (ЗНР) и применяются равные интервалы:
В практической работе можно использовать данные таблицы:
N | 15-24 | 25-44 | 45-89 | 90-179 | 180-359 | 360-719 | 720-1439 |
n | 5 | 6 | 7 | 8 | 9 | 10 | 11 |
Получаем пять интервалов: первый 6–8, второй 8–10, третий 10–12, четвертый 12–14, пятый 14–16.
Определим частоту попадания вариант выборки в каждый интервал.
В первый интервал попадает одно значение ряда: 6,3, поэтому f1=1. Во второй интервал попадают два значения: 8,2 и 9,6, поэтому f2=2. Аналогично находим f3=12, f4=3, f5=2. Определим относительные частоты попадания вариант выборки в каждый интервал:
в 1 интервал
во 2 интервал
в 3 интервал
в 4 интервал
в 5 интервал
Сумма относительных частот
Следовательно, вычисления выполнены верно.
Определим плотность относительных частот вариант как отношение относительной частоты (ωi) к ширине интервала (h):
для первого интервала
для второго интервала
для третьего интервала
для четвертого интервала
для пятого интервала
Результаты выполненных расчетов сводим в таблицу.
Интервальный ряд распределения прибыли предприятий
Интервал значений прибыли (h) | 6 — 8 | 8 – 10 | 10 — 12 | 12 — 14 | 14 — 16 |
Частоты вариант (fi) | 1 | 2 | 12 | 3 | 2 |
Относительные частоты (ωi) | 0,05 | 0,10 | 0,60 | 0,15 | 0,10 |
Плотность относительных частот (φi) | 0,025 | 0,050 | 0,300 | 0,075 | 0,050 |
helpstat.ru
Тема 10. Вариационные ряды распределения
Лекция 1 Вопросы:
1) Понятие и виды вариационных рядов распределения.
2) Графическое изображение рядов распределения и связь между ними.
1) Понятие и виды вариационных рядов распределения
В реальных социально — экономических системах нельзя проводить активные эксперименты, поэтому данные обычно представляют собой наблюдения за происходящим процессом, например: курс валюты на бирже в течение месяца, урожайность пшеницы в хозяйстве за 30 лет, производительность труда рабочих за смену и т.д. Результаты наблюдений − это, в общем случае, ряд чисел, расположенных в беспорядке, который для изучения необходимо упорядочить (проранжировать).
Операция, заключенная в расположении значений признака по возрастанию, называется ранжированием данных.
После операции ранжирования опытные данные можно сгруппировать так, чтобы в каждой группе признак принимал одно и то же значение, которое называется вариантом (Xi). Значит вариант – это значение признака у единицы совокупности, отличное от значений его у других единиц. Число элементов в каждой группе называется частотой варианта (ni).
Размахом вариации называется число W=xmax-xmin, где
xmax— наибольший вариант, xmin— наименьший вариант.
Сумма всех частот равна определенному числу n, которое называется объемом совокупности:
. (9.1)
Отношение частоты данного варианта к объему совокупности называется относительной частотой () или частостью этого варианта:
(9.2)
. (9.3)
Последовательность вариант, расположенных в возрастающем порядке, с соответствующими им частотами или частостями называется вариационным рядом (вариация — изменение).
Вариационные ряды бывают дискретными и непрерывными. Дискретным вариационным рядом называется ранжированная последовательность вариант с соответствующими частотами и (или) частостями.
2) Графическое изображение рядов распределения и связь между ними.
Графически вариационный ряд по дискретному признаку изображается с помощью полигона и кумуляты .
Построение дискретного вариационного ряда нецелесообразно, если число значений признака велико. В этом случае следует построить интервальный вариационный ряд. Для построения такого ряда промежуток изменения признака разбивается на ряд отдельных интервалов и подсчитывается количество значений величины в каждом из них. Длина каждого интервала может быть одинаковой или разной, обычно прогрессивно возрастающей или прогрессивно убывающей.
Будем считать, что отдельные (частичные) интервалы имеют одну и ту же длину. Число интервалов (k), в случае нормально распределённой совокупности, можно определить по формуле Стерджесса
Длина частичного интервала определяется по формуле
(9.5)
Графически вариационный ряд с равными интервалами изображается в виде гистограммы или кумуляты накопленных частот.
Гистограмма частот
Гистограммой частот называется фигура, состоящая из прямоугольников с основанием h и высотами ni. Для гистограммы относительных частот в качестве высоты рассматривают ni/n. Гистограмма относительных частот является аналогом дифференциальной функции случайной величины.
Лекция 2 Вопросы
studfiles.net
АНАЛИЗ РЯДОВ РАСПРЕДЕЛЕНИЯ, Понятие статистические ряды распределения
§ 51 Понятие статистические ряды распределения
Располагая данные статистического наблюдения, характеризующих то или иное явление, прежде всего необходимо их упорядочить, т.е. придать характер системности
Английский статистик. УДжРейхман по поводу неупорядоченных совокупностей образно сказал, что столкнуться с массой необобщенных данных равнозначно ситуации, когда человека бросают в лесной чаще без компаса. Что же собой представляет систематизация статистических данных в виде рядов распределениялу?
Статистический ряд распределения — это упорядоченные статистические совокупности (табл. 17). Простейшим видом статистического ряда распределения ранжированном ряд, т.е. ряд чисел, находящейся в порядке возрастания ч или падения варьируя признаки. Такой ряд не позволяет судить о закономерности, заложенные в распределенных данных: у какой величины группируется большинство показателей, какие есть отклонения от этой величины; как а общая картина распределения. С этой целью группируют данные, показывая, как часто встречаются отдельные наблюдения в общем их числе (Схема 1а 1).
. Таблица 17
. Общий вид статистических рядов распределения
. Схема 1. Схемастатистичних рядов распределения
Распределение единиц совокупности по признакам, не имеют количественного выражения, называется атрибутивным рядом (например, распределение предприятий по их производственным направлением)
Ряды распределения единиц совокупности по признакам, имеют количественное выражение, называются вариационными рядами. В таких рядах значение признака (варианты) находятся в порядке возрастания или убывания
В вариационном ряде распределения различают два элемента: варианта и частота. Варианта — это отдельное значение группировочного признаки частота — число, которое показывает, сколько раз встречается каждый варианта
В математической статистике исчисляется еще один элемент вариационного ряда — частисть. Последняя определяется как отношение частоты случаев данного интервала к общей сумме частот частисть определяется в долях единицы, процентах (%) в промилле (% о)
Таким образом, вариационный ряд распределения — это такой ряд, в котором варианты расположены в порядке возрастания или убывания, указаны их частоты или частости. Вариационные ряды бывают дискретные (переривни) и др. нтервальни (непрерывного).
. Дискретные вариационные ряды — это такие ряды распределения, в которых варианта как величина количественного признака может принимать только определенное значение. Варианты различаются между собой на одну или несколько единиц
Так, количество произведенных деталей за смену конкретным рабочим может выражаться только одним определенным числом (6, 10, 12 и тд). Примером дискретного вариационного ряда может быть распределение работников по к количеством произведенных деталей (табл 18 18).
. Таблица 18
. Дискретный ряд распределения_
Сделано деталей за смену, шт (х) | Количество рабочих чел, () |
6 | 16 |
7 | 10 |
8 | 8 |
9 | 10 |
10 | 12 |
11 | 16 |
12 | 3 |
. Интервальные (непрерывного) вариационные ряды — такие ряды распределения, в которых значение варианты даны в виде интервалов, т.е. значения признаков могут отличаться друг от друга на сколь угодно малую величину. При построении вариационного ряда нэп переривнои признаки невозможно указать каждое значение варианты, поэтому совокупность распределяется по интервалам. Последние могут быть равны и неравны. Для каждого из них указываются частоты или частости (табл. 1 9 19).
В интервальных рядах распределения с неравными интервалами вычисляют такие математические характеристики, как плотность распределения и относительная плотность распределения на данном интервале. Первая характеристика определи ся отношением частоты до величины того же интервала, вторая — отношением частости к величине того же интервала. Для приведенного выше примера плотность распределения на первом интервале составит 3: 5 = 0,6, а относительная плотность на этом интервале — 7,5:5 = 1,55%.
. Таблица 19
. Интервальный ряд распределения _
Численность работающих, чел (х) | Количество цехов («,) | % к итогу |
20-25 | 3 | 7,5 |
25-30 | 9 | 22,5 |
30-35 | 16 | 40,0 |
35-40 | 8 | 20,0 |
40-45 | 4 | 10,0 |
Всего | 40 | 100,0 |
uchebnikirus.com
Понятие вариационного ряда. Виды вариационных рядов.
Совокупность предметов или явлений, объединенных каким-либо общим признаком или свойством качественного или количественного характера, называется объектом наблюдения.
Всякий объект статистического наблюдения состоит из отдельных элементов — единиц наблюдения.
Результаты статистического наблюдения представляют собой числовую информацию — данные. Статистические данные — это сведения о том, какие значения принял интересующий исследователя признак в статистической совокупности.
Если значения признака выражаются числами, то признак называется количественным.
Если признак характеризует некоторое свойство или состояние элементов совокупности, то признак называется качественным.
Если исследованию подлежат все элементы совокупности (сплошное наблюдение), то статистическую совокупность называют генеральной.
Если исследованию подлежит часть элементов генеральной совокупности, то статистическую совокупность называют выборочной (выборкой). Выборка из генеральной совокупности извлекается случайно, так чтобы каждый из n элементов выборки имел равные шансы быть отобранным.
Значения признака при переходе от одного элемента совокупности к другому изменяются (варьируют), поэтому в статистике различные значения признака также называют вариантами. Варианты обычно обозначаются малыми латинскими буквами x, y, z.
Порядковый номер варианта (значения признака) называется рангом. x1 — 1-й вариант (1-е значение признака), x2 — 2-й вариант (2-е значение признака), xi — i-й вариант (i-е значение признака).
Упорядоченный в порядке возрастания или убывания ряд значений признака (вариантов) с соответствующими им весами называется вариационным рядом (рядом распределения).
В качестве весов выступают частоты или частости.
Частота (mi) показывает сколько раз встречается тот или иной вариант (значение признака) в статистической совокупности.
Частость или относительная частота (wi) показывает, какая часть единиц совокупности имеет тот или иной вариант. Частость рассчитывается как отношение частоты того или иного варианта к сумме всех частот ряда.
. (6.1)
Сумма всех частостей равна 1.
. (6.2)
Вариационные ряды бывают дискретными и интервальными.
Дискретные вариационные ряды строят обычно в том случае, если значения изучаемого признака могут отличаться друг от друга не менее чем на некоторую конечную величину.
В дискретных вариационных рядах задаются точечные значения признака.
Общий вид дискретного вариационного ряда указан в таблице 6.1.
Таблица 6.1
Значения признака (xi) | x1 | x2 | … | xk |
Частоты (mi) | m1 | m2 | … | mk |
где i = 1, 2, … , k.
Интервальные вариационные ряды строят обычно в том случае, если значения изучаемого признака могут отличаться друг от друга на сколь угодно малую величину.
В интервальных вариационных рядах значения признака задаются в виде интервалов.
Общий вид интервального вариационного ряда показан в таблице 6.2.
Таблица 6.2
Значения признака | а1 — а2 | а2 — а3 | … | аl-1 – аl |
Частоты (mi) | m1 | m2 | … | ml |
где i = 1, 2, … , l.
В интервальных вариационных рядах в каждом интервале выделяют верхнюю и нижнюю границы интервала.
Разность между верхней и нижней границами интервала называют интервальной разностью или длиной (величиной) интервала.
Величина первого интервала k1 определяется по формуле:
k1 = а2 — а1;
второго: k2 = а3 — а2; …
последнего: kl = al — al-1.
В общем виде интервальная разность ki рассчитывается по формуле:
ki = xi (max) — xi (min). (6.3)
Если интервал имеет обе границы, то его называют закрытым.
Первый и последний интервалы могут быть открытыми, т.е. иметь только одну границу.
Например, первый интервал может быть задан как «до 100», второй — «100-110», … , предпоследний — «190-200», последний — «200 и более». Очевидно, что первый интервал не имеет нижней границы, а последний — верхней, оба они — открытые.
Часто открытые интервалы приходится условно закрывать. Для этого обычно величину первого интервала принимают равной величине второго, а величину последнего — величине предпоследнего. В нашем примере величина второго интервала равна 110-100=10, следовательно, нижняя граница первого интервала условно составит 100-10=90; величина предпоследнего интервала равна 200-190=10, следовательно, верхняя граница последнего интервала условно составит 200+10=210.
Кроме этого, в интервальном вариационном ряде могут встречаются интервалы разной длины. Если интервалы в вариационном ряде имеют одинаковую длину (интервальную разность), их называют равновеликими, в противном случае — неравновеликими.
При построении интервального вариационного ряда часто встает проблема выбора величины интервалов (интервальной разности).
Для определения оптимальной величины интервалов (в том случае, если строится ряд с равными интервалами) применяют формулу Стэрджесса:
, (6.4)
где n — число единиц совокупности,
x(max) и x(min) — наибольшее и наименьшее значения вариантов ряда.
Для характеристики вариационного ряда наряду с частотами и частостями используются накопленные частоты и частости.
Накопленные частоты (частости) показывают сколько единиц совокупности (какая их часть) не превышают заданного значения (варианта) х.
Накопленные частоты (vi) по данным дискретного ряда можно рассчитать по следующей формуле:
. (6.5)
Для интервального вариационного ряда — это сумма частот (частостей) всех интервалов, не превышающих данный.
Дискретный вариационный ряд графически можно представить с помощьюполигона распределения частот или частостей.
При построении полигона распределения по оси абсцисс откладываются значения признака (варианты), а по оси ординат — частоты или частости. На пересечении значений признака и соответствующих им частот (частостей) откладываются точки, которые, в свою очередь, соединяются отрезками. Получающаяся таким образом ломаная называется полигоном распределения частот (частостей).
Рис. 6.1.
Интервальные вариационные ряды графически можно представить с помощью гистограммы, т.е. столбчатой диаграммы.
При построении гистограммы по оси абсцисс откладываются значения изучаемого признака (границы интервалов).
В том случае, если интервалы — одинаковой величины, по оси ординат можно откладывать частоты или частости.
Если же интервалы имеют разную величину, по оси ординат необходимо откладывать значения абсолютной или относительной плотности распределения.
Абсолютная плотность — отношение частоты интервала к величине интервала:
; (6.6)
где: f(a)i — абсолютная плотность i-го интервала;
mi — частота i-го интервала;
ki — величина i-го интервала (интервальная разность).
Абсолютная плотность показывает, сколько единиц совокупности приходится на единицу интервала.
Относительная плотность — отношение частости интервала к величине интервала:
; (6.7)
где: f(о)i — относительная плотность i-го интервала;
wi — частость i-го интервала.
Относительная плотность показывает, какая часть единиц совокупности приходится на единицу интервала.
Рис. 6.2.
И дискретные и интервальные вариационные ряды графически можно представить в виде кумуляты и огивы.
При построении кумуляты по данным дискретного ряда по оси абсцисс откладываются значения признака (варианты), а по оси ординат — накопленные частоты или частости. На пересечении значений признака (вариантов) и соответствующих им накопленных частот (частостей) строятся точки, которые, в свою очередь, соединяются отрезками или кривой. Получающаяся таким образом ломаная (кривая) называется кумулятой (кумулятивной кривой).
При построении кумуляты по данным интервального ряда по оси абсцисс откладываются границы интервалов. Абсциссами точек являются верхние границы интервалов. Ординаты образуют накопленные частоты (частости) соответствующих интервалов. Часто добавляют еще одну точку, абсциссой которой является нижняя граница первого интервала, а ордината равна нулю. Соединяя точки отрезками или кривой, получим кумуляту.
Огива строится аналогично кумуляте с той лишь разницей, что на оси абсцисс наносятся точки, соответствующие накопленным частотам (частостям), а по оси ординат — значения признака (варианты).
Похожие статьи:
poznayka.org
ВАРИАЦИОННЫЙ РЯД И СРЕДНИЕ ВЕЛИЧИНЫ.
Вариационный ряд. Построение вариационного ряда.
Характер распределения изучаемых явлений, как правило, выявляют при анализе вариационных рядов, которые в силу этого носят еще название рядов распределения.
Результаты многих клинических, лабораторных и других исследований, представленные в количественном выражений, часто многочисленны и вместе с тем малодоступны для общего их обозрения. В силу этого без соответствующей обработки они не пригодны для анализа. Необходимо получить обобщенные характеристики в виде средних величин и различных критериев разнообразия.
Методику построения вариационного ряда рассмотрим на следующем примере. При измерении времени задержки дыхания у 50 женщин в возрасте 30-45 лет, приступивших к занятиям по общефизической подготовке, получены следующие данные (табл. 1).
Таблица 1
Результаты измерения задержки дыхания после вдоха у 50 женщин в возрасте 30-45 лет (в секундах).
Материалы, приведенные в таблице 1 не могут быть проанализированы без предварительной обработки и систематизации, что позволит сделать их удобными для анализа, доступными для вычисления показателей. Следовательно из этих данных надо построить вариационный ряд.
Вариационный ряд – это ряд числовых измерений определенного признака, отличающихся друг от друга по своей величине расположенных в определенном порядке.
Вариационный ряд состоит из вариант (V) и соответствующих им частот (p). Вариантой (V)называют каждое числовое значение изучаемого признака. Частота(p) — абсолютная численность отдельных вариант в совокупности, указывающая, сколько раз встречается данная варианта в вариационном ряду.
Общее число случаев наблюдений, из которых вариационный ряд состоит, обозначают буквой (n).
Построить вариационный ряд – значит упорядочить количественное распределение единиц совокупности по значениям признака, а затем подсчитать числа единиц совокупности с этими значениями (построить групповую таблицу).
Ряд вариант одного и того же признака, расположенных в определенном порядке (по степени возрастания или убывания), с соответствующими им частотами, образуют вариационный ряд (пример: распределение новорожденных по весу, призывников по росту, и т.п.).
Формы вариационного ряда
Выделяют три формы вариационного ряда: ранжированный ряд, дискретный ряд и интервальный ряд.
Ранжированный ряд – это распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака. Ранжирование позволяет легко разделить количественные данные по группам, сразу обнаружить наименьшее и наибольшее значения признака, выделить значения, которые чаще всего повторяются.
По характеру вариации различают дискретные (прерывные) и непрерывные признаки.
Дискретный ряд – это такой вариационный ряд, в основу построения которого положены признаки с прерывным изменением (дискретные признаки). К последним можно отнести тарифный разряд, количество детей в семье, число работников на предприятии и т.д. Эти признаки могут принимать только конечное число определенных значений.
Дискретный вариационный ряд представляет таблицу, которая состоит из двух граф. В первой графе указывается конкретное значение признака, а во второй – число единиц совокупности с определенным значением признака.
Если признак имеет непрерывное изменение (размер дохода, стаж работы, стоимость основных фондов предприятия и т.д., которые в определенных границах могут принимать любые значения), то для этого признака нужно строить интервальный вариационный ряд.
Групповая таблица здесь также имеет две графы. В первой указывается значение признака в интервале «от — до» (варианты), во второй – число единиц, входящих в интервал (частота).
Вариационные ряды бывают простые или несгруппированные, которые составляют, как правило, при малом числе наблюдений (до 30 единиц наблюдения), и сгруппированные, которые составляют при большом числе наблюдений (более 30 единиц наблюдения).
Если исследователь имеет не более 30 наблюдений, то достаточно все значения признака расположить в нарастающем или в убывающем порядке (от максимальной варианты до минимальной или наоборот) и указать частоту каждой варианты. При большом числе наблюдений (более 30) вариационный ряд рекомендуется сгруппировать.
Для выбора количества групп в вариационном ряду необходимо учитывать число наблюдений, а также разность между максимальным и минимальным значениями вариант.
При числе наблюдений от 31 до 100 рекомендуется иметь 5-6 групп, от 101 до 300 — от 6 до 8 групп, от 300 до 1000 наблюдений можно использовать от 10 до 15 групп (табл. 2).
Таблица 2
Число групп в зависимости от числа наблюдений
n – число наблюдений | 31-100 101-300 | 300-1000 |
r – число групп | 5-6 6-8 | 10-15 |
Этапы построения сгруппированного вариационного ряда.
Построение сгруппированного ряда складывается из нескольких этапов (рис. 1):
Рис. 1. Этапы построения сгруппированного вариационного ряда.
I этап: определение количества групп в вариационном ряду.
При большом количестве групп ряд получается громоздким, что ведет к трудностям вычисления показателей. При малом числе групп в ряду интервал велик. Это приводит к крайне нежелательному снижению точности характеристик ряда, рассчитываемых на следующем этапе работы.
При большом колебаний признака его максимальные величины могут не соответствовать размерам последней группы и будут вне ее. В этом случае необходимо увеличить число групп с тем, чтобы можно было включить эти крайние варианты.
II этап: определение величины интервала (i) между группами. Определяя величину интервала между группами, амплитуду вариационного ряда (разность между максимальным и минимальным значениями вариант) делят на число групп (см. табл.1) n = 50 и тогда r = 10.
Величина интервала i = = = = 4,6 сек.
Полученный интервал округляется до целого числа – 5.
III этап: определение начала, середины и конца группы. Прежде всего, необходимо определить середину для первой группы. В нашем примере максимальная варианта равна 64. Поскольку середина группы должна делиться на величину интервала, то за середину первой группы следует взять варианту, равную 65, которая будет ближайшей к максимальному значению и без остатка разделится на величину интервала, равного 5. Середины для других групп находят следующим образом: от середины каждой предыдущей группы отнимают величину интервала. Так, если середина первой группы – 65, то середина второй группы равна 60 (65-5), середина третьей группы – 55 (60-5) и т. д. (табл. 3).После составления ряда из величин, принятых за середину группы – 65, 60, 55, 50 и т.д., нужно определить границы (начало и конец) этих групп. При этом следует иметь в виду, что границы не должны повторяться, иначе трудно будет распределить варианты по группам и построить вариационный ряд.
Определяя начало группы, к ее середине прибавляют величину , вычитая же ее из середины, получают конец группы. В нашем примере Прибавив 2 к середине первой группы, получим 67 (начало группы), ее концом будет: 65-2 = 63 (см. табл. 3).
Границы должны составленный так, чтобы значения вариант не оказывались между группами, нежелательны также открытые группы. Например, «свыше 60» или «менее 20» и т. д.
Таблица 3
infopedia.su