Статистический группированный ряд это – Статистическая сводка и группировка. Статистический ряд распределения. Примеры решения задач
2. Группировочный статистический ряд.
Этот ряд даёт представление о том, как распределены результаты измерений между максимальным и минимальным значением. Для того чтобы дать строгое определение группированного статистического ряда, рассмотрим его построение.
Пусть N – число элементов выборки, x0– минимальный элемент выборки, xN – максимальный элемент выборки. Разобьем отрезок [x0, xN ] на n равных частей, где
n =1+3.31 lg N (формула Старджесса)
Таким образом, получим набор непересекающихся промежутков
Δ1 = [x0, x1), Δ2 = [x1, x2), …, Δn -1 = [ xn -2, xn — 1), Δn = [ xn — 1, xN]
Длина каждого промежутка (шаг) Δk = [ xk-1, xk ), где k = 1, 2, …, n, вычисляется по формуле
Найдём число элементов выборки, попадающих в каждый из промежутков. Пусть mk – число элементов выборки, попавших в промежуток Δk. Это число также называют абсолютной частотой попадания в промежуток Δk.
Группировочный статистический ряд характеризуется также:
относительной частотой – отношение числа элементов выборки, попавших в промежуток Δk к общему числу элементов, т.е. mk / N
Совокупность промежутков и соответствующих им частот (абсолютных и относительных) называют группированным статистическим рядом. Обычно сами промежутки заменяют их серединами, которые вычисляются по формуле , а в качестве частот берут приведённые частоты.
Графическое представление группированного статистического ряда.
Существует несколько способов графического изображения рядов (гистограмма, полигон, кумулята), выбор которых зависит от цели исследования и от вида вариационного ряда.
Гистограмма служит только для представления интервальных вариационных рядов и имеет вид ступенчатой фигуры из прямоугольников с основаниями, равными длине интервалов Δ, и высотами, равными mk абсолютным частотам.
Полигон представляет собой ломаную, соединяющую точки плоскости с координатами: первая — середина промежутка, вторая – абсолютным частотам mk или относительная частота mk / N
Эмпирическая функция распределения
Полигон частот иногда называют эмпирической функцией плотности вероятностиРис.1. Эмпирическая функция плотности вероятности, а функцию плотности, которая в действительности соответствует нашему процессу и которую мы оцениваем f(x) – генеральной функцией плотности вероятности.
Смысл этой функции заключён в следующем :площадь фигуры, ограниченной графиком функции плотности вероятности f(x), снизу осью абсцисс Ох, слева – прямой x=a, справа прямой x=b равна вероятности P того, что измеряемая величина, значения которой мы получаем в ходе эксперимента, примет значения от a до b:
Функцию F(x) называется генеральной функцией распределения, а кривая, ее оценивающая и получающаяся из выборки, называется эмпирической функцией распределения. Для построения эмпирической функции распределения нужно вычислить накопленные частоты для каждого промежутка группированного статистического ряда wx:
Для первого промежутка эта частота равна 0, для для второго — относительной частоте попадания в первый промежуток, для третьего– сумме относительных частот попадания в первый и второй промежутки, для четвертый – сумме относительных частот попадания в первый, второй и третий промежутки и т.д. Кумулянта есть графическое изображение вариационного ряда, когда на вертикальной оси откладываются накопленные частоты или частности, а на горизонтальной — значения признака или середину промежутка. Отношение накопленной частоты к общему числу наблюдений N называется относительной накопленной частотой или накопленной частостью wk / N.Ломанная, соединяющая точки, первая координата которых – середина промежутка, а вторая равна относительной накопленной частоте и будет эмпирической функцией распределения.
studfiles.net
Тема 3. Сводка и группировка данных. Ряды распределения. Статистические таблицы и графики
Сводка представляет собой комплекс последовательных операций по обобщению конкретных единичных фактов, образующих совокупность, для выявления типичных черт и закономерностей, присущих изучаемому явлению в целом. В комплекс операций по статистической сводке включаются следующие:
группировка единиц наблюдения;
подсчет итогов по каждой группе и по всей совокупности в целом;
представление результатов в виде статистических таблиц.
Результатом сводки являются подробные данные, отражающие в целом всю совокупность.
По глубине обработки материала сводка бывает простая и сложная.
Простой сводкой называется операция по подсчету общих итогов по совокупности единиц наблюдения, представление результатов сводки в виде статистических таблиц.
Разработка программы сводки состоит из следующих этапов: выбор группировочных признаков; определение порядка формирования групп; разработка системы статистических показателей для характеристики групп и объекта в целом; разработка системы макетов статистических таблиц, в которых должны быть представлены результаты сводки.
По форме обработки материала сводка может быть:
децентрализованная — обработка материала производится этапами. Например, отчеты предприятий сводятся статистическими органами субъектов РФ, а итоги по региону поступают в Госкомстат России:
централизованная — весь первичный материал поступает в одну организацию, где и подвергается обработке.
Группировкой называется расчленение множества единиц изучаемой совокупности на группы по определенным существенным для них признакам.
Статистические группировки классифицируются по своему целевому назначению:
Типологическая группировка – это разделение исследуемой качественно разнородной совокупности на классы, социально-экономические типы, однородные группы единиц в соответствии с правилами научной группировки. Примером является группировка промышленных предприятий по формам собственности, разбиение студентов ВУЗа по полу и т.д.
При проведении типологической группировки основное внимание должно быть уделено идентификации типов элементов социально-экономических явлений.
Структурной называется группировка, в которой происходит разделение однородной совокупности на группы, характеризующие ее структуру по какому-либо варьирующему признаку.
Аналитическая группировка позволяет выявить взаимосвязи между группировочными признаками изучаемых явлений.
Процесс построения группировок состоит из следующих этапов.
Группировочным признаком называется признак, по которому проводится разбивка единиц совокупности на отдельные группы. Его часто называют основанием группировки.
В основание группировки могут быть положены как количественные, так и качественные признаки.
Количественные признаки имеют числовое выражение (объем выпуска продукции, размер прибыли, возраст человека и т.д.).
Качественные признаки отражают состояние единицы совокупности, обычно эти признаки выражаются текстом, однако они могут иметь и цифровое выражение (например, табельный номер, номер дома или квартиры и т.д.
Всю совокупность признаков можно разделить на две группы: факторные и результативные.
Факторными называются признаки, под воздействием которых изменяются другие признаки.
Результативными называются признаки, которые испытывают влияние факторных признаков и изменяются под их воздействием.
При выполнении группировки должны быть решены следующие вопросы:
При осуществлении любой группировки решается вопрос об определении числа выделяемых групп..При группировке по количественному признаку вопрос о числе групп решается на основе выделения однородных, близких по значению признака единиц совокупности. Число единиц в выделенных группах должно быть достаточным, чтобы характеристики, рассчитанные для отдельных групп, были статистически устойчивыми. Количество выделяемых групп зависит от вариации признака, числа наблюдений, а также от количества отдельных возможных значений признака, т.е. от числа
вариант признака.
При построении группировки по качественному признаку групп будет столько, сколько имеется градаций, видов, состояний у этого признака (например, пол – 2, регионов России – число официально зарегистрированных регионов и т.д.).
Если группировка проводится по количественному признаку, то необходимо обратить внимание на число единиц исследуемого объекта и степень колеблемости группировочного признака.
Чем больше колеблемость группировочного признака, тем больше следует образовать групп.
Если распределение признака условно равномерно, то для определения количества групп используется формула Стерджесса:
Недостаток формулы состоит в том, что ее применение дает хорошие результаты, если совокупность состоит из большого числа единиц и распределение единиц по признаку, положенному в основание группировки, близко к нормальному.
Определение интервала группировки.
Интервал – значения варьирующего признака, лежащие в определенных границах. Интервалы могут быть равными и неравными, открытыми и закрытыми. Группировку с неравными интервалами надо использовать, если размах вариации признака в совокупности велик. Неравные интервалы применяются как прогрессивно возрастающие или убывающие. В этом случае границы каждого интервала устанавливаются исследователем. Равные интервалы применяются в тех случаях, когда изменение признака внутри совокупности происходит равномерно. Величина равного интервала определяется по следующей формуле:
Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них. Нижней границей называется наименьшее значение признака в интервале, а верхней – наибольшее значение признака в нем. Величина интервала – разность между верхней и нижней границами интервала.
Открытые интервалы – те, у которых указана только одна граница.
Закрытые интервалы – те, у которых обозначены обе границы.
Величина открытого интервала принимается равной величине соседнего с ним закрытого интервала.
В результате статистической группировки данных получают ряды распределения.
Статистический ряд распределения – это упорядоченное распределение единиц совокупности на группы по определенному варьирующему признаку.
В зависимости от признака, положенного в основу группировки различают атрибутивные и вариационные ряды распределения.
Атрибутивными называют ряды, построенные по качественным признакам.
Вариационными рядами называют ряды распределения, построенные по количественному признаку. Каждый вариационный ряд состоит из двух элементов: вариант ряда и частот. Вариантами ряда считаются отдельные значения признака, которые он принимает в вариационном ряду, т.е. конкретное значение варьирующего признака. Частоты – это число отдельных вариант в каждой группе вариационного ряда, показывающие, как часто встречается та или иная варианта в ряду. Частостями называют частоты, выраженные в процентах или долях единицы.
В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды. В случае дискретной вариации величина количественного признака принимает только целые числовые значения. В случае непрерывной вариации величина признака у единиц совокупности может принимать в определенных интервалах любые значения.
Ряды распределения можно анализировать с помощью графического изображения.
Полигон используется при изображении дискретных вариационных рядов. При этом, на оси абсцисс откладываются значения признака, а на оси ординат – частоты.
Гистограмма применяется для изображения интервальных рядов. При этом, на оси абсцисс откладываются интервалы признака, на оси ординат – частоты. В случае, если интервальный ряд построен с неравными интервалами, то вместо частот на ось ординат наносится плотность распределения признака в соответствующих интервалах.
Плотность распределения – это частота, рассчитанная на единицу ширины интервала.
Для изображения вариационных рядов может также использоваться кумулятивная кривая. При помощи кумуляты изображается ряд накопленных частот, которые определяются последовательным суммированием частот по группам и показывают, сколько единиц совокупности имеют значения признака не больше, чем рассматриваемое значение. На ось абсцисс наносятся значения признака, а на оси ординат откладываются накопленные частоты. Если при графическом изображении кумуляты поменять местами оси, то в результате получится график, который называется огива.
Вторичная группировка – операция по образованию новых групп на основе ранее осуществленной группировки. Вторичная группировка применяется, когда группировки, построены в разное время или для разных объектов. Вследствие чего могут оказаться несопоставимыми из-за разного числа выделенных групп или несовпадения границ интервалов.
Применяют два способа для образования новых групп:
Способ укрупнения интервалов (объединение первоначальных интервалов) – используется в случае перехода от более мелких интервалов к более крупным, а также в случаях, когда границы новых и старых интервалов совпадают.
Способ долевой перегруппировки – создание новых интервалов на основе закрепления за каждой группой определенной доли единиц совокупности.
Результаты группировки статистической информации изображаются в таблицах.
Статистической называется таблица, которая содержит числовую характеристику исследуемой совокупности по одному или нескольким существенным признакам, взаимосвязанным логикой экономического анализа. Статистическая таблица представляет собой систему строк и столбцов, в которых в определенной последовательности и связи излагается статистическая информация.
По логическому содержанию таблица представляет собой статистическое предложение, основными элементами которого являются подлежащее и сказуемое. Подлежащим статистической таблицы называется объект, характеризующийся цифрами. Обычно подлежащее располагается в левой части таблицы, в наименовании строк. Сказуемое статистической таблицы образует система показателей, которыми характеризуется подлежащее (объект изучения). Сказуемое формирует верхние заголовки и составляет содержание граф.
По характеру подлежащего различают простые и сложные таблицы. Простые таблицы бывают монографические и перечневые. Сложные таблицы, в свою очередь, делятся на групповые и комбинационные.
Если в подлежащем представлена только одна группа или один объект, то таблица называется простой монографической. Если в подлежащем представлен несгруппированный перечень единиц, то таблица называется простой перечневой.
Если в подлежащем представлена группировка единиц совокупности по одному признаку, то таблица называется сложной групповой. Если же в подлежащем представлена группировка единиц по нескольким признакам, то таблица называется сложной комбинационной.
По разработке сказуемого различают таблицы с простой и сложной разработкой сказуемого. При простой разработке сказуемого показатель, определяющий его, не подразделяется на подгруппы, и итоговые значения получаются путем простого суммирования значений по каждому признаку отдельно, независимо друг от друга.
Сложная разработка сказуемого предполагает деление признака на формирующие его подгруппы.
studfiles.net
Статистическая сводка и группировка. Статистический ряд распределения. Примеры решения задач
Важнейшим этапом исследования социально-экономических явлений и процессов является систематизация первичных данных и получение на этой основе сводной характеристики всего объекта при помощи обобщающих показателей, что достигается путем сводки и группировки первичного статистического материала.
Сводка — это комплекс последовательных операций по обобщению конкретных единичных фактов, образующих совокупность, для выявления типичных черт и закономерностей, присущих изучаемому явлению в целом. Проведение сводки включает следующие этапы:
- выбор группировочного признака;
- определение порядка формирования групп;
- разработка системы статистических показателей для характеристики групп и объекта в целом;
- разработка макетов статистических таблиц для представления результатов сводки.
Группировкой называется расчленение единиц изучаемой совокупности на однородные группы по определенным существенным для них признакам. Группировки являются важнейшим статистическим методом обобщения статистических данных, основой для правильного исчисления статистических показателей.
Различают следующие виды группировок: типологические, структурные, аналитические. Все эти группировки объединяет то, что единицы объекта разделены на группы по какому-либо признаку.
Группировочным признаком называется признак, по которому проводится разбиение единиц совокупности на отдельные группы. От правильного выбора группировочного признака зависят выводы статистического исследования. В качестве основания группировки необходимо использовать существенные, теоретически обоснованные признаки (количественные или качественные).
Количественные признаки группировки имеют числовое выражение (объем торгов, возраст человека, доход семьи и т. д.), а качественные признаки группировки отражают состояние единицы совокупности (пол, семейное положение, отраслевая принадлежность предприятия, его форма собственности и т. д.).
После того, как определено основание группировки следует решить вопрос о количестве групп, на которые надо разбить исследуемую совокупность. Число групп зависит от задач исследования и вида показателя, положенного в основание группировки, объема совокупности, степени вариации признака.
Например, группировка предприятий по формам собственности учитывает муниципальную, федеральную и собственность субъектов федерации. Если группировка производится по количественному признаку, то тогда необходимо обратить особое внимание на число единиц исследуемого объекта и степень колеблемости группировочного признака.
Когда определено число групп, то следует определить интервалы группировки. Интервал — это значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них.
Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей — наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами.
Интервалы группировки в зависимости от их величины бывают: равные и неравные. Если вариация признака проявляется в сравнительно узких границах и распределение носит равномерный характер, то строят группировку с равными интервалами. Величина равного интервала определяется по следующей формуле:
где Хmax, Хmin — максимальное и минимальное значения признака в совокупности; n — число групп.
Простейшая группировка, в которой каждая выделенная группа характеризуется одним показателем представляет собой ряд распределения.
Статистический ряд распределения — это упорядоченное распределение единиц совокупности на группы по определенному признаку. В зависимости от признака, положенного в основу образования ряда распределения, различают атрибутивные и вариационные ряды распределения.
Атрибутивными называют ряды распределения, построенные по качественным признакам, то есть признакам, не имеющим числового выражения (распределение по видам труда, по полу, по профессии и т.д.). Атрибутивные ряды распределения характеризуют состав совокупности по тем или иным существенным признакам. Взятые за несколько периодов, эти данные позволяют исследовать изменение структуры.
Вариационными рядами называют ряды распределения, построенные по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот. Вариантами называются отдельные значения признака, которые он принимает в вариационном ряду, то есть конкретное значение варьирующего признака.
Частотами называются численности отдельных вариант или каждой группы вариационного ряда, то есть это числа, которые показывают, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность всей совокупности, ее объем. Частостями называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1 или 100%.
В зависимости от характера вариации признака различают три формы вариационного ряда: ранжированный ряд, дискретный ряд и интервальный ряд.
Ранжированный вариационный ряд — это распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака. Ранжирование позволяет легко разделить количественные данные по группам, сразу обнаружить наименьшее и наибольшее значения признака, выделить значения, которые чаще всего повторяются.
Дискретный вариационный ряд характеризует распределение единиц совокупности по дискретному признаку, принимающему только целые значения. Например, тарифный разряд, количество детей в семье, число работников на предприятии и др.
Если признак имеет непрерывное изменение, которые в определенных границах могут принимать любые значения («от — до»), то для этого признака нужно строить интервальный вариационный ряд. Например, размер дохода, стаж работы, стоимость основных фондов предприятия и др.
3-net.ru