Полигон кумулята гистограмма – Статистические распределения и их основные характеристики. Графическое представление рядов распределения: полигон, гистограмма, кумулята

15)Графическое изображение вариационных рядов (полигон, гистограмма, кумулята)

Для изображения используются линейные и плоскостные диаграммы.

Для дискретных рядов графиком служит полигон и кумулята.

Полигон — геометрическая фигура (ломаная линия), соединяющая вершины, абсциссами которых являются значения варьирующегося признака, а ординатами – соответствующие им частоты.

Кумулята — это ломаная линия, вершины которой имеют в качестве абсцисс значение признака, а ординаты нарастающее число частот (кумулятивная накопительная величина)

Пример построения полигона и кумуляты по следующим данным:

Распределение квартир жилого дома по числу проживающих в них

Число живущих в квартирах Х

Число квартир f

Кумулятивная (накопительная) величина

1

2

2

2

3

5

3

10

15

4

23

38

5

9

47

6

2

49

7

1

50

Всего

50

Строим полигон:

f число квартир

25

20

15

10

5

х число живущих

1 2 3 4 5 6 7

Строим кумуляту:

кумулятивная величина

50

40

30

20

10

1 2 3 4 5 6 7 число жив. в кв.

Графиком изображений интервальных вариационных рядов служит гистограмма

Гистограмма — геометрическое изображение интервального вариационного ряда, где по оси абсцисс откладывают границы интервалов являющиеся основанием прямоугольников площади которых равны, либо пропорциональны частотам.

Пример построения гистограммы по следующим данным:

Дано распределение активов коммерческих банков по степени риска.

Х (интервал)

F (частота)

w

Группа активов по степени риска,%

Количество банков

%

0-10%

60

60

10 — 25%

5

5

25-100%

35

35

Всего

100

100,00%

f

60

50

40

30

20

10

10 20 30 40 50 60 70 80 90 100

16) Абсолютные величины в статистике, их сущность и виды.

В статистике все абсолютные величины являются именованными и измеряются в конкретных единицах. Абсолютные величины могут быть «+» и «-». Абсолютные величины характеризуют численность совокупности и объем соц.-эк. явления в определенных границах времени и места. Различают моментные и интервальные абсолютные величины. Моментная абсолют. величина показывает фактическое наличие или уровень явления на определенный момент, дату. Интервальная абсолют. величина показывает накопительный результат за определенный период времени.

(Виды абсолютных величин можно классифицировать: а) по обхвату элементов изучаемой совокупности –индивидуальные, групповые, общие; б) по признаку характеристики самой совокупности – показатели численности совокупности, показатели объема признака совокупности; в) по признаку характеристики процесса развития абсолютной величины характеризуют: уровнем явлений на определенный момент времени, результаты процессов за определенный период времени; Абсолютные показатели всегда имеют единицы измерения. Единицы их измерения могут быть натуральные (км, м, чел), трудовыми и стоимостными. Из

инета )

studfiles.net

Гистограмма и полигон статистических распределений. Кумулята.

 

Для наглядности представления вариационного ряда большое значение имеют его графические изображения. Графически вариационный ряд может быть изображён в виде полигона, гистограммы и кумуляты.

Полигон распределения (дословно – многоугольник распределения) называют ломанную, которая строится в прямоугольной системе координат. Величина признака откладывается на оси абсцисс, соответствующие частоты (или относительные частоты ) – по оси ординат. Точки (или ) соединяют отрезками прямых и получают полигон распределения. Чаще всего полигоны применяются для изображения дискретных вариационных рядов, но их можно применять также и для интервальных рядов. В этом случае на оси абсцисс откладываются точки, соответствующие серединам данных интервалов.

Гистограммой распределения называют ступенчатую фигуру[26], состоящую из прямоугольников, основанием которых служат частичные интервалы длиною , а высоты пропорциональны частотам (или относительным частотам) и равны – плотность частоты (или – плотность относительной частоты). Для построения гистограммы на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянии (или ). Заметим, что площадь гистограммы частот (относительных частот) равна сумме всех частот (относительных частот), то есть, равна объему выборки (то есть – единице).

 

ПРИМЕР 1.Уровень рентабельности предприятий лёгкой промышленности характеризуется следующими данными:

 

Уровень Рентабельности, % (интервалы)   До 5   5 – 10   10 – 15   15 – 20   20 – 25   25 – 30   30 и более
Количество предприятий, % к итогу (частоты)                            
Центральное значение (интервала)   2,5   7,5   12,5   17,5   22,5   27,5     Условно принимают 32,5

 

По приведённым данным построить полигон распределения и гистограмму.

Решение. Воспользовавшись определениями, нетрудно построить полигон распределения и гистограмму (см. рис.)

 

 

 

 

Кумулятивная кривая (кривая сумм – кумулята) получается при изображении вариационного ряда с накопленными частотами (или относительными частотами) в прямоугольной системе координат. Накопленная частота (или относительная частота) определённой варианты получается суммированием всех частот (относительных частот) вариант, предшествующих данной, с частотой (относительной частотой) этой варианты. При построении кумуляты дискретного признака по оси абсцисс откладывают значения признака (варианты). Ординатами служат вертикальные отрезки, длина которых пропорциональна накопленной частоте (или относительной частоте) той или иной варианты. Соединением вершин ординат прямыми линиями получаем ломанную (кривую) кумуляту.

При построении кумуляты интервального вариационного ряда нижней границе первого интервала соответствует частота (относительная частота), равная нулю, а верхней – вся частота (относительная частота) интервала. Верхней границе второго интервала соответствует накопленная частота (относительная частота) первых двух интервалов (то есть сумма частот (относительных частот) этих интервалов) и т. д.

ПРИМЕР 2.По данным примера 1 построить кумуляту распределения.

Решение. Воспользовавшись определением и правилом построения кумуляты интервального вариационного ряда, нетрудно построить кумулятивную кривую данного распределения (см. рисунок).



3-net.ru

Построение полигона частот

При построении полигона частот

  1. на оси абсцисс откладываются направо в порядке возрастания значения признака (для дискретного рядов) или центральные значения интервалов – середины интервалов,

  2. по оси ординат откладываются частоты,

  3. строим точки, показывающие значение частоты для каждого значения признака,

  4. крайние точки полученной ломаной соединяются с лежащими на оси абсцисс следующими (меньшими и большими) возможными, но фактически не наблюдающимися значениями признака, частота которых, очевидно, равна 0,

  5. замкнутая с осью абсцисс ломаная линия представляет полигон распределения частот.

Построение гистрограммы

Гистограмма — столбиковая диаграмма, для построения которой на оси абсцисс откладывают отрезки, равные величине интервалов вариационного ряда.

Для построения гистограммы по оси абсцисс откладывают величины интервалов, а частоты изображаются прямоугольниками, построенными на интервалах с высотой, равной частоте в масштабе оси ординат.

В случае неравенства интервалов гистограмма строится не по частотам или частостям, а по плотности распределения.

Очевидно, что гистограмма легко может быть преобразована в полигон распределения, если середины верхних сторон прямоугольников соединить отрезками прямых, при этом середины верхних сторон двух крайних прямоугольников соединить с осью абсцисс в точках, отстоящих в принятом масштабе на величину интервалов от середины первого и последнего интервалов.

Построение кумуляты

В ряде случаев для изображения вариационных рядов используется кумулятивная кривая (кумулята), она особенно удобна для сравнения вариационных рядов. Кумулята строится на основе накопленной частоты.

Накопленные частоты наносятся в виде ординат; соединяя вершины отдельных ординат прямыми, получают ломаную линию, которая, начиная с нуля, непрерывно поднимается над осью абсцисс до тех пор, пока не достигнет высоты, соответствующей общей сумме частот.

При построении кумуляты интервального ряда (рис. 5.3) нижней границе первого интервала соответствует нулевая частота (частость), верхней — вся частота (частость) первого интервала. Верхней границе второго интервала – сумма частот (частостей) первого и второго интервалов и т.д., верхней границе последнего интервала — сумма накопленных частот (частостей) во всех интервалах, что соответствует общей численности изучаемой совокупности или 100%.

11из7

studfiles.net

Огивы

Огивы

Графики накопленных частот (огивы) представляют собой кривые накопленных частот. На таком графике по оси ординат (Y) откладывают либо общее количество, либо процент всех наблюдений, в которых значение некоторой величины не превышает данного значения из интервала возможных результатов. По оси ординат (Y) откладывают накопленные частоты.

Поскольку частоты не могут принимать отрицательных значений, кривые накопленных частот являются монотонно неубывающими. Такой кривой описывают вероятность распределения параметра.

Полигон

Полигон распределения можно построить и для  интервального вариационного ряда. Для этого по вертикальной оси  откладывают те же частоты, что и при построении гистограммы, а по горизонтальной — середины интервалов.

Полигон чаще всего используют для изображения дискретных рядов. Полигоном частот называют ломаную, отрезки которой соединяют точки с координатами (xi,mi) , где xi — варианты выборки и mi— соответствующие им частоты. Если полигон строят по данным интервального ряда, то в качестве абсцисс точек берут середины соответствующих интервалов.

Для построения полигона в прямоугольной системе координат в произвольно выбранном масштабе на оси абс­цисс откладывают значения аргумента (вари­анты), а на оси ординат – значения час­тот. Масштаб выбирают такой, чтобы была обеспечена необходимая наглядность и желательный размер рисунка. Далее строят точки с координатами (xi,mi) и последовательно соединяют их отрезками прямой.

Полигоном относительных частот (частостей) называют ломаную, отрезки которой соединяют точки с координатами (xi,wi), где xi — варианты выборки и wi — соответствующие им относительные частоты.

Преобразованной формой вариационного ряда является ряд накопленных частот (кумулятивный ряд). Кумулятивный ряд позволяет графически представить данные вариационного ряда в виде кумуляты и огивы. Накопленные частоты получаются в результате последовательного суммирования (кумуляции) всех значений частот, либо от минимального значения варианты к максимальному, либо, наоборот, от максимального к  минимальному.

Кумулята

Кумулята (кумулятивная кривая) представляет собой кривую накопленных частот (частостей). Для ее построения на оси абсцисс откладывают значения аргумента, а на оси ординат – накопленные частоты или накопленные относительные частоты. Масштаб на каждой оси выбирают произвольно.

Далее строят точки, абсциссы которых равны вариантам (в случае дискретных рядов) или верхним границам интервалов (в случае интервальных рядов), а ординаты – соответствующим накопленным частотам. Эти точки соединяют отрезками прямой. Полученная ломаная и является кумулятой.

 

в начало


yuschikev.narod.ru

Гистограмма и полигон статистических распределений. Кумулята.

Количество просмотров публикации Гистограмма и полигон статистических распределений. Кумулята. — 519

Стоит сказать, что для наглядности представления вариационного ряда большое значение имеют его графические изображения. Графически вариационный ряд должна быть изображён в виде полигона, гистограммы и кумуляты.

Полигон распределœения (дословно – многоугольник распределœения) называют ломанную, которая строится в прямоугольной системе координат. Величина признака откладывается на оси абсцисс, соответствующие частоты (или относительные частоты ) – по оси ординат. Точки (или ) соединяют отрезками прямых и получают полигон распределœения. Чаще всœего полигоны применяются для изображения дискретных вариационных рядов, но их можно применять также и для интервальных рядов. В этом случае на оси абсцисс откладываются точки, соответствующие серединам данных интервалов.

Гистограммой распределœения называют ступенчатую фигуру[26], состоящую из прямоугольников, основанием которых служат частичные интервалы длиною , а высоты пропорциональны частотам (или относительным частотам) и равны – плотность частоты (или – плотность относительной частоты). Для построения гистограммы на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянии (или ). Заметим, что площадь гистограммы частот (относительных частот) равна сумме всœех частот (относительных частот), то есть, равна объёму выборки (то есть – единице).

ПРИМЕР 1.Уровень рентабельности предприятий лёгкой промышленности характеризуется следующими данными:

Уровень Рентабельности, % (интервалы)   До 5   5 – 10   10 – 15   15 – 20   20 – 25   25 – 30   30 и более
Количество предприятий, % к итогу (частоты)                            
Центральное значение (интервала)   2,5   7,5   12,5   17,5   22,5   27,5     Условно принимают 32,5

По приведённым данным построить полигон распределœения и гистограмму.

Решение. Воспользовавшись определœениями, нетрудно построить полигон распределœения и гистограмму (см. рис.)

Кумулятивная кривая (кривая сумм – кумулята) получается при изображении вариационного ряда с накопленными частотами (или относительными частотами) в прямоугольной системе координат. Накопленная частота (или относительная частота) определённой варианты получается суммированием всœех частот (относительных частот) вариант, предшествующих данной, с частотой (относительной частотой) этой варианты. При построении кумуляты дискретного признака по оси абсцисс откладывают значения признака (варианты). Ординатами служат вертикальные отрезки, длина которых пропорциональна накопленной частоте (или относительной частоте) какой-либо варианты. Соединœением вершин ординат прямыми линиями получаем ломанную (кривую) кумуляту.

При построении кумуляты интервального вариационного ряда нижней границе первого интервала соответствует частота (относительная частота), равная нулю, а верхней – вся частота (относительная частота) интервала. Верхней границе второго интервала соответствует накопленная частота (относительная частота) первых двух интервалов (то есть сумма частот (относительных частот) этих интервалов) и т. д.

ПРИМЕР 2.По данным примера 1 построить кумуляту распределœения.

Решение. Воспользовавшись определœением и правилом построения кумуляты интервального вариационного ряда, нетрудно построить кумулятивную кривую данного распределœения (см. рисунок).

referatwork.ru

Графическое представление вариационного ряда: полигон, гистограмма, кумулята.

ТОП 10:

Графическое представление вариационного ряда: полигон, гистограмма, кумулята.

Для графич изображения вариационных рядов используются: 1.Полигон-служит для изображения дискретного вариационного ряда и представляет собой ломаную, в которой концы отрезков прямой имеют координаты (xi, ni), i=1,2,…,m. 2.Гистограмма-служит только для изображения интервальных вариационных рядов и представляет собой ступенчатую фигуру из прямоугольников с основаниями, равными интервалам значений признака ki=xi+1— xi, i=1,2,…m, и высотами,равными частотам(частостям) ni (wi) интервалов. Если соединить середины верхних оснований проямоуг-ков отрезками прямой,то можн получить полигон того же распределения. 3.Кумулятивная кривая (кумулята)-кривая накопленных частот(частостей).Для дискретного ряда кумулята представляет ломаную,соединяющую точки (xi ,niнак) или (xi ,wiнак),i=1,2,…,m. Для интервального вариационного ряда ломаная начинается с точки,абсцисса которой равна началу первого интервала, а ордината –накопленной частоте(частости),равной нулю.Другие точки этой ломаной соответствуют концам итервалов.

 

Средняя арифметическая как мера центральной тенденции и её свойства.

Средней арифметической вариационного ряда называется сумма произведений всех вариантов на соответствующие частоты, деленная на сумму частот:

,где xi-варианты дискретного ряда или середины интервалов интервального вариационного ряда; ni-соответствующие им частоты,m-число неповторяющихся вариантов или число интервалов; . Очевидно,что ,где -частости вариантов или интервалов. Основные св-ва средней арифметической(аналогичны св-вам математичского ожидания случайной величины): 1.Средняя арифметич-кая постоянной равна самой постоятнной.2.Если все варианты увеличить(уменьшить) в одно и то же число раз, то средняя арифметическая увеличится(уменьшится) во столько же раз: или 3.Если все варианты увеличить(уменьшить) на одно и то же число,то средняя арифметическая увеличится (уменьшится) на то же число: или 4.Средняя арифметическая отклонений вариантов от средней арифметической равна нулю: или . При 5.Средняя арифметическая алгебраической суммы нескольких признаков равна такой же сумме средних арифметических этих признаков: 6.Если ряд состоит из нескольких групп, общая средняя равна средней арифметической групповых средних, причем весами являются объемы групп: , где -общая средняя(средняя арифметическая всего ряда), -групповая средняя i-й группы, объем которой равен ni., l – число групп.

Мода и её свойства.

Мода— это наиболее часто встречающееся в определенной совокупности наблюдений значение переменной. При сгруппированных данных мода определяется как середина интервала группирования, содержащего наибольшее число значений наблюдаемой переменной. Модой Мо(Х) случайной величины Х называется ее наиболее вероятное значение(для которого вероятность pi или плотность вероятности достигает максимума). Если вероятность или плотность вероятности достигает максимума не в одной, а в нескольких точках,распределение называется полимодльным.

26.Статистическая совокупность. Генеральная совокупность. Выборка. Репрезентативность выборки, таблица случайных чисел.

Генеральная совокупн-ть-вся подлежащая изучению совокупность объектов(наблюдений). В математической статистике понятие генеральной совокупности трактуется как совокупность всех мыслимых наблюдений, которые могли бы быть произведены при данном реальном комплексе условий, и в этом смысле его не следует смешивать с реальными совокупностями, подлежащими статистическому изучению. Понятие генеральной совокупности аналогично понятию случайной величины(закону распределения вероятностей, вероятностному пространству), т к полностью обусловлено определенным комплексом условий. Та часть объектов,кот отобрана для для непосредственного изучения из генеральной совокуп-ти, называется выборочной совокупностью или выборкой.Сущность выборочного метода состоит в том,чтобы по некоторой части генеральной совокупности(по выборке) выносить суждение о ее св-вах в целом. Осн недостаток выборочного метода-ошибки исследования,называемые ошибками репрезентативности(представительства).Чтобы по данным выборки иметь возможность судить о генеральной совокупности, она должна быть отобрана случайно. Случайность отбора элементов в выборку достигается соблюдением принципа равной возможности всем элементам генеральной совокупности быть отобранными в выборку. На практике это достигается тем,что извлечение элементов в выборку проводится путем жеребьевки(лотереи) или с пом случайных чисел,имеющихся в специальн таблицах. Виды выборок: 1)собственно-случайная,образована случайным выбором элементов без расчленения на части или группы 2)механическая-в нее элементы из генеральной совокупности отбираются через определенный интервал.Н-р,если объем выборки должен составлять 10%,то отбирается каждый 10й ее элемент 3)типическая(стратифицированная)-в нее случайным образом отбираются элементы из типических групп,на которые по некоторому признаку разбивается генеральная совокупность 4)серийная(гнездовая)-в нее случайным образом отбираются не элементы а целые группы совокупности(серии), а сами серии подвергаются сплошному наблюдению.

 

 

Ц.П.Т. Ляпунова

Пусть выполнены базовые предположения Ц.П.Т. Линдеберга. Пусть случайные величины {Xi} имеют конечный третий момент. Тогда определена последовательность

. Если предел

(условие Ляпунова),

то

по распределению при .

 

Если

Графическое представление вариационного ряда: полигон, гистограмма, кумулята.

Для графич изображения вариационных рядов используются: 1.Полигон-служит для изображения дискретного вариационного ряда и представляет собой ломаную, в которой концы отрезков прямой имеют координаты (xi, ni), i=1,2,…,m. 2.Гистограмма-служит только для изображения интервальных вариационных рядов и представляет собой ступенчатую фигуру из прямоугольников с основаниями, равными интервалам значений признака ki=xi+1— xi, i=1,2,…m, и высотами,равными частотам(частостям) ni (wi) интервалов. Если соединить середины верхних оснований проямоуг-ков отрезками прямой,то можн получить полигон того же распределения. 3.Кумулятивная кривая (кумулята)-кривая накопленных частот(частостей).Для дискретного ряда кумулята представляет ломаную,соединяющую точки (xi ,niнак) или (xi ,wiнак),i=1,2,…,m. Для интервального вариационного ряда ломаная начинается с точки,абсцисса которой равна началу первого интервала, а ордината –накопленной частоте(частости),равной нулю.Другие точки этой ломаной соответствуют концам итервалов.

 




infopedia.su

полигон, гистограмма. Показатели центра распределения, колеблемости признака. Формы распределения.

Графики являются наглядной формой отображения рядов распределения. Для изображения рядов применяются линейные графики и плоскостные диаграммы, построенные в прямоугольной системе координат.

Для графического представления атрибутивных рядов распределения используются различные диаграммы: столбиковые, линейные, круговые, фигурные, секторные и т. д.

Для дискретных вариационных рядов графиком является полигон распределения.

Полигоном распределения называется ломаная линия, соединяющая точки с координатами или где  — дискретное значение признака, — частота,  — частость.

График строится в принятом масштабе. Вид полигона распределения приведен на рис. 5.1.

Для изображения интервальных вариационных рядов применяют гистограммы, представляющие собой ступенчатые фигуры, состоящие из прямоугольников, основания которых равны ширине интервала  , а высота — частоте  (частости ) равноинтервального ряда или плотности распределения неравноинтервального  Построение диаграммы аналогично построению столбиковой диаграммы. Общий вид гистограммы приведен на рис. 5.2.

Для графического представления вариационных рядов может использоваться также кумулята – ломаная линия, составленная по накопленным частотам (частостям). Накопленные частоты наносятся в виде ординат; соединяя вершины отдельных ординат отрезками прямой, получаем ломаную линию, имеющую неубывающий вид. Координатами точек на графике для дискретного ряда являются для интервального ряда — Начальная точка графика имеет координаты самая высокая точка — Общий вид кумуляты приведен на рис.5.3. Использование кумуляты особенно удобно при проведении сравнений вариационных рядов.

При построении графиков рядов распределения большое значение имеет соотношение масштабов по оси абсцисс и оси ординат. В этом случае и необходимо руководствоваться «правилом золотого сечения», в соответствии с которым высота графика должна быть примерно в два раза меньше его основания.

При проведении эмпирического исследования ряда распределения рассчитываются и анализируются следующие группы показателей:

• показатели положения центра распределения;

• показатели степени его однородности;

• показатели формы распределения.

Показатели положения центра распределения. К ним относятся степенная средняя в виде средней арифметической и структурные средние – мода и медиана.

Средняя арфметическая для дискретного ряда распределения рассчитывается по формуле:

В отличие от средней арифметической, рассчитываемой на основе всех вариант, мода и медиана характеризует значение признака у статистической единице, занимающей определенное положение в вариационном ряду.

Медиана (Me) значение признака у статистической единицы, стоящей в середине ранжированного ряда и делящей совокупность на две равные по численности части.

Мода (Mo) — наиболее часто встречаемое значение признак в совокупности. Мода широко используется в статистической практике при изучении покупательского спроса, регистрации цен и др.

Для дискретных вариационных рядов Mo и Me выбираются в соответствии с определениями: мода — как значение признака с наибольшей частотой : положение медианы при нечетном объеме совокупности определяется ее номером , где N – объем статистической совокупности. При четном объеме ряда медиана равна средней из двух вариантов, находящихся в середине ряда.

Медиану используют как наиболее надежный показатель типичного значения неоднородной совокупности, так как она нечувствительна к крайним значениям признака, которые могут значительно отличаться от основного массива его значений. Кроме этого, медиана находит практическое применение вследствие особого математического свойства: Рассмотрим определение моды и медианы на следующем примере: имеется ряд распределения рабочих участка по уровню квалификации.

Данные приведены в таблице 5.2.

Мода выбирается по максимальному значению частоты: при nmax = 14 Mo=4, т.е. чаще всего встречается 4-ый разряд. Для нахождения медианы Me определяются центральные единицы Это 25 и 26-ая единицы. По накопленным частотам определяется группа, в которую попадают эти единицы. Это 4-ая группа, в которой значение признака равно 4. Таким образом, Me = 4, это означает, что у половины рабочих разряд ниже 4-го, а у другой – выше четвертого. В интервальном ряду значения Mo и Me вычисляются более сложным путем.

Мода определяется следующим образом:

• По максимальному значению частоты определяется интервал, в котором находится значение моды. Он называется модальным.

• Внутри модального интервала значение моды вычисляется по формуле:

Для расчета медианы в интервальных рядах используется следующий подход:

• По накопленным частотам находится медианный интервал. Медианным называется интервал, содержащий центральную единицу.

• Внутри медианного интервала значение Me определяется по формуле:

В неравноинтервальных рядах при вычислении Mo используется другая частотная характеристика – абсолютная плотность распределения:

Расчет моды и медианы для интервального ряда распределения рассмотрим на примере ряда распределения рабочих по стажу, приведенного в таблице 5.3.

Расчет Mo:

• Максимальная частота  n max = 13, она соответствует четвертой группе, следовательно, модальным является интервал с границами 12 – 16 лет.

• Моду рассчитаем по формуле:

Чаще всего встречаются рабочие со стажем работы около 13 лет. Мода не находится в середине модального интервала, она смещена к его нижней границе, связано это со структурой данного ряда распределения (частота предмодального интервала значительно больше частоты постмодального интервала).

Расчет медианы:

• По графе накопленных частот определяется медианный интервал. Он содержит 25 и 26-у статистические единицы, которые находятся в разных группах – в 3-ей и 4-ой. Для нахождения Me можно использовать любую из них. Расчет проведем по 3-ей группе:

Такое же значение Me можно получить при её расчете по 4-ой группе:

При сдвоенном центре Me всегда находится на стыке интервалов, содержащих центральные единицы. Вычисленное значение Me показывает, что у первых 25 рабочих стаж работы – менее 12 лет, а у оставшихся 25-ти, следовательно, — более 12 лет.

Моду можно определить графически по полигону распределения в дискретных рядах, по гистограмме распределения – в интервальных, а медиану — по кумуляте.

Для нахождения моды в интервальном ряду правую вершину модального прямоугольника нужно соединить с правым верхним углом предыдущего прямоугольника, а левую вершину – с левым верхним углом последующего прямоугольника. Абсцисса точки пересечения этих прямых и будет модой распределения.

Для определение медианы высоту наибольшей ординаты кумуляты, соответствующей общей численности совокупности, делят пополам. Через полученную точку проводят прямую, параллельную оси абсцисс, до пересечения ее с кумулятой. Абсцисса точки пересечения является медианой.

Кроме Mo и Me в вариантных рядах могут быть определены и другие структурные характеристики – квантили. Квантили предназначены для более глубокого изучения структуры ряда распределения. Квантиль – это значение признака, занимающее определенное место в упорядоченной по данному признаку совокупности. Различают следующие виды квантилей:

квартили – значения признака, делящие упорядоченную совокупность на 4 равные части;

децили – значения признака, делящие совокупность на 10 равных частей;

перцентели — значения признака, делящие совокупность на 100 равных частей.

Если данные сгруппированы, то значение квартиля определяется по накопленным частотам: номер группы, которая содержит i -ый квантиль. Определяется как номер первой группы от начала ряда, в котором сумма накопленных частот равна или превышает i ·N, где I – индекс квантиля. Если ряд интервальный, то значение квантиля определяется по формуле:

Рассчитаем квартили для ряда распределения рабочих участка по стажу работы:

Следовательно, у четверти рабочих стаж менее 7 лет и у четверти – более 16 лет. Таким образом, для характеристики положения центра ряда распределения можно использовать 3 показателя: среднее значение признака, мода, медиана.

При выборе вида и формы конкретного показателя центра распределения необходимо исходить из следующих рекомендаций:

• для устойчивых социально-экономических процессов в качестве показателя центра используют среднюю арифметическую. Такие процессы характеризуются симметричными распределениями, в которых

• для неустойчивых процессов положение центра распределения характеризуется с помощью Mo или Me. Для асимметричных процессов предпочтительной характеристикой центра распределения является медиана, поскольку занимает положение между средней арифметической и модой.

Вторая важнейшая задача при определении общего характера распределения – это оценка степени его однородности. Однородность статистических совокупностей характеризуется величиной вариации (рассеяния) признака, т.е. несовпадением его значений у разных статистических единиц. Для измерения вариации в статистике используются абсолютные и относительные показатели. Выяснение общего характера распределения предполагает не только оценку степени его однородности, но и исследование формы распределения, т.е. оценку симметричности и эксцесса.

Из математической статистики известно, что при увеличении объема статистической совокупности и одновременного уменьшении интервала группировки полигон либо гистограмма распределения все более и более приближается к некоторой плавной кривой, являющейся для указанных графиков пределом. Эта кривая называется эмпирической кривой распределения и представляет собой графическое изображение в виде непрерывной линии изменения частот, функционально связанного с изменением вариант.

В статистике различают следующие виды кривых распределения:

одновершинные кривые; многовершинные кривые.

Однородные совокупности описываются одновершинными распределениями. Многовершинность распределения свидетельствует о неоднородности изучаемой совокупности или о некачественном выполнении группировки.

Одновершинные кривые распределения делятся на симметричные, умеренно асимметричные и крайне асимметричные.

Распределение называется симметричным, если частоты любых 2-х вариантов, равноотстоящих в обе стороны от центра распределения, равны между собой. В таких распределениях

Для характеристики асимметрии используют коэффициенты асимметрии.

Наиболее часто используются следующие из них:

Коэффициент асимметрии Пирсона

В одновершинных распределениях величина этого показателя изменяется от -1 до +1. в симметричных распределениях As=0. При As>0 наблюдается правосторонняя асимметрия (рис.5.4). В распределениях с правосторонней асимметрией Mo Me При As<0 – асимметрия отрицательная левосторонняя, Mo>Me>

                                   

Рис. 5.4.Правосторонняя асимметрия      Рис. 5.5. Левосторонняя асимметрия

Чем ближе по модулю As к 1, тем асимметрия существеннее:

Коэффициент асимметрии Пирсона характеризует асимметрию только в центральной части распределения, поэтому более распространенным и более точным является коэффициент асимметрии, рассчитанный на основе центрального момента 3-его порядка:

Центральным моментом в статистике называется среднее отклонение индивидуальных значений признака от его среднеарифметической величины.

Центральный момент k-ого порядка рассчитывается как:

Соответственно формулы для определения центрального момента третьего порядка имеют следующий вид:

Для оценки существенности рассчитанного вторым способом коэффициента асимметрии определяется его средняя квадратическая ошибка:

Для одновершинных распределений рассчитывается еще один показатель оценки его формы – эксцесс. Эксцесс является показателем островершинности распределения. Он рассчитывается для симметричных распределений на основе центрального момента 4-ого порядка

При симметричных распределениях Ех=0. если Ех>0, то распределение относится к островершинным, если Ех<0 – к плосковершинным.

www.ekonomstat.ru