Гистограмма частот гистограмма относительных частот – Описательная статистика. Эмпирическая функция распределения. Гистограмма, полигон частот. Статистический ряд, группировка значений выборки. Выборочные числовые характеристики. Примеры.

§15. Полигон и гистограмма

Для
наглядности строят различные графики
статистического распределения, в
частности, полигон и гистограмму.

Определение.
Полигоном
частот называют ломаную, отрезки которой
соединяют точки (x1,
n1),
(x2,
n2),
…, (xk,
nk).

Для
построения полигона частот на оси
абсцисс откладывают варианты xi,
а на оси ординат – соответствующие им
частоты ni.
Точки (xi,
ni)
соединяют отрезками прямых и получают
полигон частот.

Определение.
Полигоном
относительных частот

называют ломаную, отрезки которой
соединяют точки (x1,
w1),
(x2,
w2),
…, (xk,
wk).

Для
построения полигона частот на оси
абсцисс откладывают варианты xi,
а на оси ординат wi.
Точки (xi,
wi)
соединяют отрезками прямых и получают
полигон относительных частот.

На
рисунке изображен полигон относительных
частот следующего распределения:

x

1,5

3,5

5,5

7,5

w

0,1

0,2

0,4

0,3

Рис.
6. Полигон относительных частот.

В
случае непрерывного признака целесообразно
строить гистограмму, для чего интервал,
в котором заключены все наблюдаемые
значения признака, разбивают на несколько
частичных интервалов длинной h
и находят для каждого частичного
интервала ni
сумму частот вариант, попавших в i-ый
интервал.

Определение.
Гистограммой
частот

называют ступенчатую фигуру, состоящую
из прямоугольников, основаниями которых
служат частичные интервалы длиною h,
а высоты равны отношению
(плотность частоты).

Рис.
7. Гистограмма частот.

Для
построения гистограммы частот на оси
абсцисс откладывают частичные интервалы,
а над ними проводят отрезки, параллельные
оси абсцисс, на расстоянии
.

Площадь
i-го
частичного прямоугольника равна
=─ сумме частот вариантi-го
интервала; следовательно, площадь
гистограммы частот равна сумме всех
частот, то есть объему выборки n.

На
рисунке 2 изображена гистограмма частот
распределения объема n=100,
приведенного в таблице 1.

Частичный
интервал,

длиною
h=5

Сумма
частот вариант частичного интервала

Плотность
частоты

5
– 10

4

0,8

10
– 15

6

1,2

15
– 20

16

3,2

20
– 25

36

7,2

25
– 30

24

4,8

30
– 35

10

2,0

34
– 40

4

0,8

Определение.
Гистограммой
относительных частот

называют ступенчатую фигуру, состоящую
из прямоугольников, основаниями которых
служат частичные интервалы длинною h,
а высоты равны отношению
(плотность относительной частоты).

Для
построения гистограммы относительных
частот на оси абсцисс откладывают
частичные интервалы, а над ними проводят
отрезки, параллельные оси абсцисс на
расстоянии
.
Площадьi-го
частичного прямоугольника равна
=─ относительной частоте вариант,
попавших вi-й
интервал. Следовательно, площадь
гистограммы относительных частот равна
сумме всех относительных частот, то
есть единице.

Примеры.

  1. В
    результате выборки получена следующая
    таблица распределения частот.

2

6

12

3

10

7

Построить
полигоны частот и относительных частот
распределения.

Для
начала построим полигон частот.

Рис.
8. Полигон частот.

Чтобы
построить полигон относительных частот
найдем относительные частоты, для чего
разделим частоты на объем выборки n.

n
=
3
+
10
+
7
=
20.

.

Получаем

2

6

12

0,15

0,50

0,35

Построим
полигон относительных частот.

Рис.
9. Полигон относительных частот.

2.
Построить гистограммы частот и
относительных частот распределения.

Найдем
плотность частоты
:

Частичный
интервал,

длиною
h
= 3

Сумма
частот вариант частичного интервала

Плотность
частоты

2
– 5

9

3

5
– 8

10

3,3

8
– 11

25

8,3

11
– 14

6

2

Построим
гистограмму частот.

Рис.
10. Гистограмма частот.

Чтобы
построить гистограмму относительных
частот, нужно найти относительные
частоты. Для этого найдем объем выборки
n.

.

Теперь
найдем относительные частоты
:

Получим:

Частичный
интервал

Сумма
относительных частот

Плотность
частоты

2
– 5

0,18

0,06

5
– 8

0,2

0,07

8
– 11

0,5

0,16

11
– 14

0,12

0,04

Плотности
частот
нужно вычислить. При этомh
= 3.

Построим
гистограмму относительных частот.

Рис.11.
Гистограмма относительных частот.

studfiles.net

3.2.2 Полигон и гистограмма

Пусть
результаты выборки количественного
признака X
из генеральной совокупности представлены
вариационным рядом. Кумулята, будучи
функцией распределения выборки, служит
ее интегральной вероятностной
характеристикой. Для изучения локальных
свойств нужна функция, аналогичная ряду
распределения или плотности вероятности.
Графиками таких вариационных рядов
служат полигон
и гистограмма.

Точечный вариационный
ряд наглядно можно представить с помощью
полигона частот, а интервальный – с
помощью гистограммы.

Полигоном
частот
называется ломаная, звенья которой
соединяют отрезками точки с координатами
(x1,
n1),
(x2,
n2),

,
(xk,
nk)
для полигона абсолютных частот и точки
с координатами (x1,
),
(x2,
),

,
(xk,
)
для полигона относительных частот.

Для
их построения, исходя из условия задачи,
необходимо составить точечный (либо
интервальный) вариационный ряд абсолютных
или относительных частот. Если задан
интервальный вариационный ряд, то для
построения полигона частот необходимо
найти середины интервалов 1,
2,
… , k
– точки x1,
x
2,

,
x
k.
Затем, в декартовой системе координат
надо отложить на оси абсцисс все возможные
значения вариант x1,
x
2,

,
x
k,
а на оси ординат соответствующие им
абсолютные частоты n1,
n2,
… , nk
(или относительные частоты
,,…,).
Для построения полигона абсолютных
(относительных) частот необходимо
соединить отрезками полученные точки
с координатами (x1,n1),
(x2,n2),

,
(xn,nk)
(или, соответственно, (x1,
),
(x2,
),

,
(xk,
)).

Гистограммой
абсолютных (относительных)

частот
называется ступенчатая фигура, состоящая
из прямоугольников, основания которых
есть частичные интервалы длиною h,
высотами которых служат значения,
пропорциональные частоте интервала ni
(или
).
Отношенияназываютплотности
частоты,
а
отношения

плотности относительной частоты.

Для
построения гистограммы необходимо
найти размах выборки – ее границы, т.е.
и,
длину интервалов,
а такжеk
– число интервалов.

При
удачном подборе интервалов гистограмма
и полигон дают представление о графике
функции плотности вероятности
распределения генеральной совокупности,
что используется для формулировки
предположения о виде исследуемого
теоретического закона распределения
(п.3.6.6).

Заметим,
что, если за единицу высоты принять 1/h,
площадь каждого i-го
прямоугольника равна произведению
основания на высоту:
т.е. частотеi-го
интервала (или сумме частот вариант,
входящих в этот интервал). Тогда площадь
всей гистограммы частот равна сумме
всех частот
,
т.е. объему выборки, причем площадь
каждого столбца гистограммы пропорциональна
частоте попадания наблюдений в данный
интервал группировки. Если в качестве
высот прямоугольников выбрать отношения,
то площадь фигуры под гистограммой
относительных частот равна единице,
т.к..

Т.о.,
площадь гистограммы
частот равна сумме всехчастот, т.е..

Задача
2.
Представить
графическое распределение размеров
зарплаты сотрудников фирмы за неделю
(в долларах), если они получили следующую
зарплату:

152.74;
176.66; 162.48; 167.72; 181.09; 155.00; 196.17; 169.60; 172.88;
182.47; 181.69; 186.91; 190.10; 176.14; 192.70; 178.59; 167.27;
175.14; 160.00; 177.46; 165.18; 167.77; 178.46; 165.00; 185.20;
157.02; 172.14; 192.22; 179.40; 191.03; 188.68; 169.51; 200.15;
178.47; 176.33; 179.05; 180.95; 174.28; 175.00; 178.45; 150.10;
176.86; 187.71; 168.33; 195.00; 172.37; 179.04; 182.05; 186.19;
190.05; 196.27; 209.28; 203.16; 168.52; 200.00; 196.30.

xmax=209.28,
xmin=150.10.

Решение.

Построим
интервальный вариационный ряд с
интервалом h=10:

Интервалы
зарплаты

150-160

160-170

170-180

180-190

190-200

200-210

ni

4

11

18

10

9

4

Для построения
точечного вариационного ряда найдем
середины интервалов:

xi

155

165

175

185

195

205

ni

4

11

18

10

9

4

Составим графики
распределения зарплаты (Рис. 2а,б)

Интервальному
вариационному ряду соответствует
гистограмма (Рис. 2(а). Точечному
вариационному ряду соответствует
полигон (Рис. 2(б).

Рис.
2 (а, б)

Задача
3.
Даны
результаты изменения напряжения (в
вольтах) в электросети. Составить
вариационный ряд и начертить график
распределения напряжения, если значения
напряжения следующие:

227, 229, 215, 230, 232, 223,
220, 222, 228, 219,

222,
221, 227, 226, 226, 229, 217, 215, 218, 220,

216, 220, 220, 221, 225, 224,
212, 217, 219, 220.

Решение.

Составим вариационный
ряд, по которому построим гистограмму
(Рис.3). Имеем

xmax=232,
xmin=212.
Применим формулу Стерджесса и подсчитаем
число интервалов:

Тогда вариационный
ряд абсолютных частот примет вид:

xi

212-217

217-222

222-227

227-232

ni

7

12

7

5

Соответствующая
гистограмма абсолютных частот представлена
на рисунке 3(а), а относительных частот
— на рисунке 3(б).

Рис.3
(а) Рис. 3(б)

Задача
4.
Контролер
на рынке выявлял отклонение весов в
граммах от стандарта на основе выборки.
Закон распределения выборки задан
вариационным рядом абсолютных частот:

xi

-2

0

3

5

8

ni

5

1

7

3

4

Составить
закон распределения относительных
частот и построить их графики.

Решение:

  1. Найдем
    объем выборки:
    .

  2. Найдем
    относительные частоты по формуле
    :.

  3. Составим
    вариационный ряд относительных частот:

-2

0

3

5

8

0.25

0.05

0.35

0.15

0.20

4. Полигон для
вариационного ряда распределения
абсолютных частот представлен на рисунке
4а. Полигон вариационного ряда относительных
частот представлен на рисунке 4б:

Величина
интервала группировки значительно
влияет на вид гистограммы: чем больше
величина h,
тем менее различимы особенности
распределений.

studfiles.net

Полигон и гистограмма частот





ТОП 10:







Для наглядности в статистике часто пользуются геометрической интер-претацией статистического распределения выборки, строя, так называемые, полигон и гистограмму частот (или относительных частот).

Для построения полигона частот (или относительных частот) при дискретном распределении признака по оси абсцисс откладывают значения признака хi , а по оси ординат – частоты ni (или соответственно относительные частоты Wi). Точки с координатами (xi , ni) (или (xi , Wi)) соединяют отрезками прямых. Полигон частот дает представление о том, насколько часто встречаются те или иные значения исследуемого признака.

Пример. Для распределения

полигон относительных частот имеет вид, показанный на рисунке.

Полигон относительных частот – это статистический аналог многоугольника распределения дискретной случайной величины в теории вероят­ностей.

Если исследуемый признак – непрерывная случайная величина, то целесообразно строить гистограмму частот. Для этого интервал, в котором заклю­чены все наблюдавшиеся значения признака, делят на ряд частичных интервалов одинаковой длины ∆. Далее находят ni— сумму частот значений признака, попавших в i — ый частичный интервал, и строят ступенчатую фигуру из прямоугольников с основанием, равным ∆, и площадью, равной ni.

Если значения признака совпадают с границей интервала, то их включают в сумму частот значений признака, принадлежащих соседним интервалам с частотами, равными половине частоты этого признака.

Полученный график называется гистограммой частот.

Площадь гистограммы частот равна сумме частот всех наблюдавшихся значений признака, то есть объему выборки.

Гистограмма относительных частот строится точно также, отличаясь от гистограммы частот лишь масштабом по оси ординат, а именно, по оси ординат откладывается плотность относительной частоты . Поэтому площадь i –го прямоугольника будет равна Wi – относительной частоте значений признака, попавших в i – ый интервал, а площадь гистограммы относительных частот будет равна сумме всех Wi, то есть единице.



Число интервалов r гистограммы определяют приближенно по формуле Старджесса для выборки объема n (округляя r до ближайшего целого значения):

Пример. Произведено 100 измерений диаметров валиков, результаты которых представлены в таблице 4.

Таблица 4

15,23 15,37 15,48 15,48 15,43 15,35 15,36 15,40 15,45 15,29
15,48 15,58 15,44 15,56 15,28 15,59 15,47 15,41 15,54 15,20
15,38 15,43 15,35 15,56 15,51 15,47 15,40 15,29 15,20 15,46
15,42 15,44 15,41 15,29 15,48 15,39 15,50 15,38 15,45 15,50
15,45 15,42 15,29 15,53 15,34 15,55 15,33 15,32 15,44 15,46
15,32 15,46 15,32 15,48 15,38 15,43 15,51 15,43 15,60 15,44
15,55 15,29 15,31 15,44 15,43 15,44 15,31 15,58 15,28 15,24
15,34 15,49 15,50 15,38 15,48 15,43 15,37 15,29 15,54 15,33
15,36 15,46 15,23 15,44 15,38 15,27 15,52 15,40 15,26 15,37
15,59 15,48 15,46 15,40 15,24 15,41 15,34 15,43 15,38 15,50

 

Построить гистограммы частот и относительных частот этого распределения.

Как видно из таблицы, наименьшее значение диаметра-15,20 мм, наи-большее-15,60 мм, длина этого промежутка — 0,4 мм. Число частичных интервалов принимаем по правилу Старджесса, равным восьми. Подсчитываем число значений признака, попадавших в каждый интервал. Для построения гистограмм частот (и относительных частот) составим таблицу 5.

Таблица 5

Частичный интервал
= 0,05
Сумма частот значений признака в частичном интервале  
Плотность частоты
  Плотность
относительной частоты
15,20-15,25 0,06 1,2
15,25-15,30 0,10 2,0
15,30-15,35 0,11 2,2
15,35-15,40 0,15 3,0
15,40-15,45 22,5 0,225 4,5
15,45-15,50 18,5 0,185 3,7
15,50-15,55 0,09 1,8
15,55-15,60 0,08 1,6
  N= 100      

Соответствующие гистограммы изображены на рисунке.

 

При увеличении объема выборочной совокупности гистограмма относительных частот приближается к дифференциальному закону распределения признака в генеральной совокупности, то есть гистограмма относительных частот является статистическим аналогом плотности вероятностей f(x) непрерывной случайной величины.

СТАТИСТИЧЕСКИЕ ОЦЕНКИ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ


Точечные оценки

Любое значение неизвестного параметра, от которого зависит закон распределения случайной величины, вычисленное по опытным данным, всегда является приближенным.




Оценкой параметра и называется в статистике его приближенное случайное значение, вычисленное на основе ограниченного числа опытов. Если оценка параметра характеризуется одним числом, то она называется точечной.

Пусть из генеральной совокупности произведена выборка объема n для изучения некоторого признака Х. Обозначим неизвестный параметр теоретического распределения интересующего нас признака объектов генеральной совокупности через . Требуется по данным выборки найти “подходя­щую” оценку для параметра .

Очевидно, для некоторой другой выборки оценка будет принимать иное значение, то есть — случайная величина, зависящая от данных опытов и их числа n.

Чтобы оценка давала близкое приближение к оцениваемому параметру, она должна удовлетворять определенным требованиям.

1. При увеличении n оценка должна сходиться по вероятности к параметру , то есть должно выполняться равенство

Оценка, обладающая таким свойством, называется состоятельной.

2. Необходимо, чтобы пользуясь вместо , мы не допускали систематической (неслучайной) ошибки в сторону занижения или завышения действительного значения оцениваемого параметра, то есть, чтобы .

Оценка , математическое ожидание которой равна оцениваемому параметру, называется несмещенной.

3. Оценка должна обладать по сравнению с другими возможными оцен­ка­ми наименьшей дисперсией:

Оценка, обладающая таким свойством, называется эффективной.

Ниже рассмотрены повторные и бесповторные выборки и точечные оценки генеральной средней и генеральной дисперсии, удовлетворяющие указанным требованиям.











infopedia.su

Задание 2. Построить гистограмму частот интервального вариационного ряда


Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат ча­стичные интервалы длины h, а высоты равны отношению (плотность частоты).

Площадь частичного i-го прямоугольника равна сумме частот вариант, попавших в i-й интервал. Пло­щадь гистограммы частот равна сумме всех частот, т.е. объему выборки n.

Решение.

Длина интервала h = 6. Найдем плотность частоты

Таблица 2.

Х [150,156) [156,162) [162,168) [168,174) [174, 180) [180, 186]
(частота)
8/6 ≈ 1,4 10/6 ≈ 1,65 12/6 = 2,0 14/6 ≈ 2,3 10/6 ≈1,65 6/6 = 1

Построим на оси 0х заданные интервалы. На оси 0у отложим плотность частоты. Над каждым интервалом на оси 0х проведем соответствующие параллельные отрезки.

 

 
 

Задание 3. Записать эмпирическую функцию распределения
и построить ее график

Одним из способов обработки вариационного ряда является построение эмпирической функции распределения. Эмпирическая функция распределения , определяет для каждого значения х относительную частоту события Х < x.

относительная частота (частость)

Для построения графика эмпирической функции распределения переходят к дискретному ряду распределения, для этого в качестве вариант принимают середины частичных интервалов. Частоты при этом не изменяются.

 

Решение.

Вычислим:

— середину каждого интервала и запишем эти значения в первую строку таблицы;

— относительные частоты и запишем в третью строку таблицы;

— накопительные частоты и запишем в четвертую строку таблицы.

Таблица 3.

Значение признака (середина интервала)

(частота)

(относительная частота)
8/60 ≈
0,133
10/60 ≈
0,167
12/60 =
0.2
14/60 ≈
0,233
10/60 ≈
0,167
6/60 =
0,1
Накопительные относительные частоты 0,133 0,133+0,167=
0,3
0,133+0,167+0,2=
0,5
0,733 0,9
Запишем эмпирическую функцию:
 
На оси 0х отметим значения , на оси 0у – накопительные частоты.
        

Задание 4. Рассчитать основные числовые характеристики вариационного ряда


Значение признака

(частота)

 

4а) Мода – это варианта, имеющая наибольшую частоту.

= 171, = 171, = 14.

Медиана – это варианта, которая делит вариационный ряд на две части, равные по числу вариант.

Если число интервалов четное, то медиана определяется как среднее арифметическое серединных значений. (153+159+165+171+177+183)/6=168,

Для определения остальных числовых характеристик воспользуемся методом произведений.

Введем условные варианты. ,где С«ложный нуль».

Чаще всего в качестве ложного нуля принимается либо варианта, находящаяся в середине вариационного ряда, либо мода (варианта , имеющая наибольшую частоту), либо любое другое число, упрощающее расчеты.

Если за принять какое — либо значение , то соответствующая ему условная варианта будет равна нулю, а слева и справа от нуля будут располагаться соответственно значения 1, 2, 3, 4 и т.д.

В нашем примере С = 171, h = 6. Составим расчетную таблицу:

Таблица 4.

Проверка.

926+4*(-250)+6*158+(-34)+60= -74+948+26=798

4б) Условные начальные моменты найдем по формулам:

) Выборочная средняя Þ = 167,6

) Дисперсия (рассеивание) – характеристика рассеяния значений случайной величины Х около ее математического ожидания.

Выборочная дисперсия

= ≈ 82,4

Среднее квадратичное отклонение также служит для оценки рассеяния случайной величины Х вокруг ее среднего значения ≈ 9,1

Исправленная дисперсия генеральной совокупности

= 60/59*82,4 ≈ 83,7966

Исправленное среднее квадратичное отклонение ≈ 9,15

4д) Коэффициентом вариации V называют выраженное в процентах отношение выборочного среднего квадратичного отклонения к выборочной средней.

;

4е) Асимметрия – характеризует «скошенность» кривой распределения относительно математического ожидания. Асимметрия равна нулю, если кривая распределения симметрична относительно математического ожидания; асимметрия положительна, если «длинная часть» кривой распределения расположена справа от математического ожидания; асимметрия отрицательна, если «длинная часть» кривой распределения расположена слева от математического ожидания (рис.1а)

Для вычисления асимметрии и эксцесса найдем центральные моменты:

≈ — 34,56

≈ 13478,4

Асимметрия0,05

4и) Эксцесс – это характеристика большего или меньшего подъема кривой исследуемого распределения по сравнению с нормальной кривой распределения. Если эксцесс равен нулю, то кривая распределения является нормальной кривой; если эксцесс положителен, то кривая распределения имеет более высокую и «острую» вершину, чем нормальная кривая; если эксцесс отрицателен, то кривая распределения имеет более низкую и «плоскую» вершину, чем нормальная кривая (рис. 1б).

;

      
 
 
   

 



Рекомендуемые страницы:

Воспользуйтесь поиском по сайту:

megalektsii.ru

1.4 Гистограмма и полигон частот

Пусть
– выборка объема,
содержащаяразличных вариант, из генеральной
совокупности случайной величиныс неизвестной плотностью вероятностей.
Приближением (оценкой) неизвестной
плотности вероятностей могут служитьгистограммаилиполигон
относительных частот
. Гистограмма
и полигон относительных частот служат
для геометрического изображения
группированного вариационного ряда.

Гистограмма относительных частот
представляется в виде примыкающих друг
к другу прямоугольников с основаниями
,
равными ширине интервалов группировок,
и высотами(рис. 1). Для гистограммы относительных
частот площадь ступенчатой фигуры
соответствует сумме вероятностей и
равна.
Площадь любого прямоугольника гистограммы
равна вероятности попадания значений
рассматриваемой случайной величины в
интервал, соответствующий основанию
прямоугольника.

Рис. 1 — Гистограмма и полигон относительных
частот

Полигоном относительных частотназывается ломаная, соединяющая точки,,
…,(рис. 1), где– середины интервалов группировки;– высоты прямоугольников гистограммы.

При увеличении объема выборки и уменьшении
длин интервалов гистограмма и полигон
относительных частот приближаются к
графику неизвестной функции
– плотности вероятности генеральной
совокупности.

По виду гистограммы или полигона частот
можно выдвинуть гипотезу о виде
распределения генеральной совокупности.
Например, если гистограмма имеет вид,
представленный на рис. 2а, то можно
предположить, что генеральная совокупность
имеет нормальный закон распределения
с плотностью вероятностей
;
рис. 2б – равномерное распределения с
плотностью вероятностей; рис. 2в – показательное распределение
с плотностью вероятностей.

2а 2б

Рис. 2Виды гистограмм

ПРИМЕР 3

Требуется построить гистограмму и
полигон относительных частот для
известного группированного вариационного
ряда. На их основе выдвинуть нулевую
гипотезу
о виде распределения генеральной
совокупности. В данном случае это
нормальное распределение. На одном
чертеже с гистограммой построить график
теоретической плотности вероятностей.
Сделать вывод об их визуальном совпадении.

Для
удобства заполним таблицу. В таблицу
занесены середины интервалов
,
в четвертый – относительные частоты
интервалов,
в пятый – высоты прямоугольников
гистограммы относительных частот.

Таблица 6

Индекс

Интервал

Середина
интервала

Относит.

частота

Высота
прямоуг.

1

-5,5

0,0404

0,0404

2

-4,5

0,1212

0,1212

3

-3,5

0,1616

0,1616

4

-2,5

0,2121

0,2121

5

-1,5

0,2323

0,2323

6

-0,5

0,1212

0,1212

7

0,5

0,1010

0,1010

8

1,5

0,0101

0,0101

Сумма

1

1

По данным таблицы построим гистограмму.
Для этого в прямоугольной системе
координат на оси абсцисс откладываем
значения границ интервалов разбиения
и на каждом из интервалов с номером
строим прямоугольник с высотой.

Для такой гистограммы площадь ступенчатой
фигуры соответствует сумме вероятностей
и равна
.
Площадь каждого прямоугольника
гистограммы равна вероятности попадания
случайной величины в интервал,
соответствующий основанию прямоугольника

Рис.3. Гистограмма относительных частот
и кривая теоритической плотности
вероятностей

Полигон относительных частот – ломаная,
соединяющая точки
,

Гистограмма и полигон относительных
частот, являющиеся статистическими
оценками плотности вероятностей
генеральной совокупности, схожи с кривой
плотности вероятностей нормального
закона. На основании этого выдвигаем
нулевую гипотезу
:
Генеральная совокупность, из которой
взята выборка, распределена по нормальному
закону с параметрами,,
то есть теоретическая плотность
вероятностей имеет вид:

Рис.4 Полигон относительных частот

Вычислим значения теоретической
плотности вероятностей в точках
– середины интервалов по таблице П 2
Приложения. Результаты вычислений
занесем в таблицу. Заметим, что.

Таблица 7

1

-5,5000

-2,0083

0,0531

0,0324

2

-4,5000

-1,3980

0,1501

0,0916

3

-3,5000

-0,7878

0,2925

0,1785

4

-2,5000

-0,1776

0,3927

0,2396

5

-1,5000

0,4326

0,3633

0,2217

6

-0,5000

1,0429

0,2316

0,1413

7

0,5000

1,6531

0,1017

0,0621

8

1,5000

2,2633

0,0308

0,0188

0,0000

0,3989

0,2434

Из рисунка 3 видно, что график теоретической
плотности вероятностей и гистограмма
достаточно хорошо совпадают.

studfiles.net

4.2. ВАРИАЦИОННЫЙ РЯД. ПОЛИГОН ЧАСТОТ И ГИСТОГРАММА ЭМПИРИЧЕСКАЯ ФУНКЦ

Пусть Х — некоторый признак изучаемого объекта или явления (срок службы электролампы, вес студента, диаметр шарика для подшипника и т. п.). Генеральной совокупностью является множество всех возможных значений этого признака, а результаты N наблюдений над признаком Х дадут нам выборку объема N — первоначальные статистические данные, значения (простая выборка, не сгруппированные данные)

При этом значение получено при первом наблюдении случайной величины Х, – при втором наблюдении той же случайной величины и т. д.

Выборку преобразуют в Вариационный ряд, располагая результаты наблюдений в порядке возрастания: Каждый член Вариационного ряда называется Вариантой.

Пример 4.1.

1. Измерена масса тела 10-ти детей 6-ти лет. Полученные данные образуют простой статистический ряд: 24 22 23 28 24 23 25 27 25 25.

2. Из 10000 выпущенных на конвейере электрических лампочек отобрано 300 штук для проверки качества всей партии. Здесь а

Отдельные значения статистического ряда называются Вариантами. Если варианта ХI появилась M раз, то число M называют Частотой, а ее отношение к объему выборки M/NОтносительной частотой.

Последовательность вариант, записанная в возрастающем (убывающем) порядке, называется Ранжированным рядом.

Пример 4.2. Для ранжированного ряда: 23 23 24 24 25 25 25 27 28 в нижеприведенной таблице в первой строке записаны все значения величины (варианты), во второй – соответствующие им частоты (безынтервальный вариационный ряд), в третьей – накопленные частоты, в четвертой – относительные частоты (табл.4.1).

Таблица 4.1. Значения вариант и их частот

Х

22

23

24

25

27

28

Ni

1

2

2

3

1

1

NН

1

3

5

8

9

10

0.1

0.2

0.2

0.3

0.1

0.1

Полигоном частот называют ломаную линию, отрезки которой соединяют точки с координатами (ХI; Ni) (рис. 4.1).

Отметим, что сумма частот статистического ряда равна объему выборки. Часто статистический ряд составляют, используя относительные частоты вариант: (M — количество различных вариант). Сумма относительных частот равна единице.

Полигоном относительных частот называют ломаную линию, отрезки которой соединяют точки с координатами (ХI; Hi).

А)

Б)

Рисунок 4.1. Полигон частот а), кумулятивная кривая б)

Эмпирическим аналогом графика интегральной функции распределения является Кумулятивная кривая (Кумулята). Для ее построения на оси ОХ откладывают значения вариант, на оси ОY – накопленные частоты или относительные частоты. Полученная плавная кривая называется кумулятой.

В том случае, если выборка представлена большим количеством различных значений непрерывной случайной величины, то группировку данных проводят в виде интервального вариационного ряда (ИВР). Для этого диапазон варьирования признака разбивают на несколько (5–10) равных интервалов и указывают количество вариант, попавших в каждый интервал.

Алгоритм построения интервального вариационного ряда.

1. Исходя из объема выборки (N), определить количество интервалов (K) (см. табл. 4.2).

Таблица 4.2.Рекомендуемое соотношение Объем выборки-число интервалов

N

25–40

40–60

60–100

100–200

>200

K

5–6

6–8

7–10

8–12

10–15

2. Вычислить размах ряда: R=XmaxXmin

3. Определить ширину интервала: H=R/(K–1)

4. Найти начало первого интервала X0 = XminH/2

5. Составить интервальный вариационный ряд.

Графическим изображением ИВР является Гистограмма. Для ее построения на оси ОХ откладывают интервалы шириной H, на каждом интервале строят прямоугольник высотой M/H. Величина M/H называется Плотностью частоты. Гистограмма является эмпирическим аналогом графика дифференциальной функции распределения.

Пример 4.3. Измерена масса тела 100 женщин 30 лет, получены значения от 60 до 90 кг. Построить интервальный вариационный ряд (табл. 4.3) и гистограмму.

Таблица 4.3. Интервальный вариационный ряд

Интервал

Середина интервала

M

M/H

60–65

62.5

14

2.8

65–70

67.5

32

6.4

70–75

72.5

28

5.6

75–80

77.5

14

2.8

80–85

82.5

7

1.4

85–90

87.5

2

0.4

Рисунок 4.2. Гистограмма

Эмпирическая функция распределения находится по следующей формуле (отношение накопленных частот к объему выборки):

(4.1)

< Предыдущая   Следующая >

matica.org.ua

Гистограмма

Наглядное представление о характере изменения частот вариационного ряда дают полигон и гистограмма.

Гистограмма — это способ графического изображения интервальных
распределений вариант при непрерывном варьировании
признака. Гистограмма распределения применяется только для изображения
интервального вариационного ряда.

Гистограмма представляет собой столбчатый график, построенный по полученным за определенный период (например, за неделю или за месяц) данным, которые разбиваются на несколько интервалов; число данных, попадающих в каждый из интервалов (частота), выражается высотой столбика.

Данные для построения гистограммы собирают в течение длительного периода — недели, месяца, года и т. д.

Гистограмма
– это серия столбиков одинаковой ширины, но разной высоты, показывающая
рассеяние и распределение данных. Ширина столбика – это интервал в диапазоне
наблюдений, высота – количество данных, приходящихся на тот или иной интервал,
т.е. частость. По существу, гистограмма отображает
распределение исследуемого показателя. Гистограмма позволяет оценить характер
рассеивания показателя и разобраться в том, на чём следует сосредоточить усилия
по улучшению.

Гистограмму используют для изображения только интервальных
рядов.

Признак называется непрерывно варьирующим, если его
значения отличаются друг от друга на сколь угодно малую величину, т.е. признак
может принимать любые значения в некотором интервале. Непрерывный вариационный
ряд такого признака называется интервальным (см. табл. 3 и 4).

Таблица 3

Общий вид интервального вариационного ряда частот

Интервалы

ai-ai+1

a1-a2

a2-a3

an-an+1

Частоты

mi

m1

m2

mn

Таблица 4

Общий вид интервального вариационного ряда частостей

Интервалы

ai-ai+1

a1-a2

a2-a3

an-an+1

Частости

wi

w1

w2

wn

Просматривая результаты проведенных наблюдений,
определяют, сколько значений вариантов попало в каждый конкретный интервал.
Предполагается, что каждому интервалу принадлежит один из его концов: либо во
всех случаях левые (чаще), либо во всех случаях правые, а частоты или частости
показывают число вариантов, заключенных в указанных границах. Разности (ai-ai+1) называются частичными
интервалами
или интервальными разностями.

Для того чтобы интервальный вариационный ряд не был
громоздким и в то же время позволял выявить характерные черты изменения
значений случайной величины, обычно число частичных интервалов выбирают от 7 до
10. Длина частичного интервала (интервальная разность) зависит от размаха варьирования и выбранного числа
интервалов

Если
окажется, что h – дробное число, то за длину частичного интервала следует брать либо ближайшее
целое число, либо ближайшую простую дробь.

Для упрощения последующих расчетов интервальный
вариационный ряд можно заменить условно дискретным. В этом случае серединное
значение i-го интервала принимают за вариант xi,
а соответствующую интервальную частоту mi– за частоту этого интервала.

Гистограммой частот называют
ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат
частичные интервалы длины h, а высоты равны отношению  (плотность частоты).
Площадь частичного i-го прямоугольника равна — сумме частот вариант, попавших в i-ый интервал. Площадь гистограммы частот равна сумме всех
частот, т.е. объему выборки n

Если
соединить середины верхних оснований прямоугольников отрезками прямой, то можно
получить полигон того же распределения, который будет являться выборочным
аналогом дифференциальной функции распределения f(x).

Гистограммой относительных частотназывают
ступенчатую фигуру, со­стоящую из прямоугольников, основаниями которых служат
частичные интервалы длины h, а высоты равны отношению (плотность относительной частоты). Площадь частичного i-го прямоугольника равна — сумме относительных час­тот вариант, попавших в i — ый интервал. Площадь гистограммы относительных частот равна сумме всех относительных частот, т.е. единице.

Характерные
типы гистограмм показаны на рис. .

 

 

 

 

Рис. Характерные типы гистограмм

На рис.,а показан обычный тип гистограммы
с двусторонней симметрией, что указывает на стабильность процесса.

На рис.,б в распределении имеется два пика
(двугорбая гистограмма). Такая гистограмма получается при объединении двух
распределений, например, в случае двух видов сырья, изменения настройки
процесса или объединения в одну партию изделий, обработанных на двух разных станках.
Требуется расслоение продукции.

На рис.,в показана гистограмма с обрывом.
Такое распределение получается, когда невозможно получить значение ниже (или
выше) некоторой величины. Подобное распределение имеет место также, когда из
партии исключены все изделия с показателем ниже (и/или выше) нормы, т.е.
изначально это была партия с большим количеством дефектных изделий. Такое же
распределение получается, когда измерительные приборы были неисправны.

На рис.,г показана гистограмма с
островком. Получается при ошибках в измерениях, или когда некоторое количество
дефектных изделий перемешано с доброкачественными.

На рис.,д показана гистограмма с прогалами («гребёнка»). Получается, когда ширина интервала
не кратна единице измерения или при ошибках оператора.

На рис.,е показана гистограмма в форме
плато. Получается, когда объединяются несколько распределений при небольшой
разнице средних значений. В этом случае требуется расслоение.

Гистограмма строится в следующем порядке. Систематизируют данные, собранные, например, за 10 дней или за месяц. Число данных должно быть не менее 30-50, оптимальное число — порядка 100. Если их оказывается более 300, затраты времени на их обработку оказываются слишком большими. Следующий шаг — определение наибольшего L и наименьшего S значений данных. При большом числе значений (порядка 100) определение L и S затруднительно, поэтому вначале определяют наибольшее и наименьшее значения в каждом десятке значений, а затем среди полученных значений определяют L и S. Интервал между наибольшим и наименьшим значениями делят на соответствующие участки. Число участков должно примерно соответствовать корню квадратному из числа данных. При числе данных З0-50 число участков должно быть равно 5-7, при числе данных 50-100-6-10; при числе данных 100-2008-15. Далее определяют ширину участка h. Разность между L и S делят на число участков и полученное число округляют. Например, для анализа результатов контроля толщины пластин при L=11,8 мм,S=7,1 мм и числе участков 10 получим h=(11,8-7,1):10=0,47 мм. Округляют это число до 0,5 мм и получают ширину участка h=0,5 мм.

Значения границ участков определяют следующим образом. Вначале находят наименьшее граничное значение для первого участка из условия S — единица измерения/2.

В приведенном примере S=7,1 мм; единица измерения составляет 0,1 мм . Таким образом, наименьшее граничное значение для первого участка оказывается равным

7,1 мм — 0,1 мм/2 = 7,05 мм

Прибавляя к полученному значению ширину участка h=0,5 мм, находим что первый участок занимает интервал на оси абсцисс от 7,05 мм до 7,55 мм . Аналогично, прибавляя 0,5 мм к 7,55 мм, получим интервал второго участка (7,55 мм- 8,05 мм ), и т. д.

В интервал последнего участка (11,55-12,05) входит наибольшее значение L.

Следующий шаг — определение центральных значений для участков. Центральное значение для участка определяют по формуле

Сумма граничных значений участка/2=нижнее граничное значение участка+верхнее граничное значение участка/2

В приведенном примере центральное значение для первого участка равно

7,05+7,55/2=7,3 мм

Центральные значения последующих участков находятся прибавлением ширины участка h=0,5 мм к значению для предыдущего участка.

В размеченные описанным выше образом интервалы участков размещают данные измеренных значений толщины пластин в каждом интервале, которые составляют частоту f попадания этих данных в соответствующий интервал (табл. 9).

Таблица 9

 

Интервал участка, мм

Центральное значение, мм  

Частота

7,05-7,55  

7,3

2

7,55-8,05  

7,8

9

8,05-8,55  

8,3

14

8,55-9,05  

8,8

17

9,05-9,55  

9,3

16

9,55-10,05  

9,8

15

10,05-10,55  

10,3

14

10,55-11,05  

10,8

9

11,05-11,55  

11,3

3

11,55-12,05  

11,8

1

 

 Сумма (f)100

Последним шагом является построение графика гистограммы. По оси абсцисс откладывают значения параметров качества, по оси ординат — частоту. Для каждого участка строят прямоугольник (столбик) с основанием, равным ширине интервала участка; высота его соответствует частоте попадания данных в этот интервал (см. рис. 20). Если на гистограмме от руки провести кривую распределения данных по частоте, а также верхнее и нижнее предельные значения нормы, то легко можно понять вид распределения гистограммы и соотношение значений контрольных нормативов. Анализ гистограммы позволяет сделать заключение о состоянии процесса, однако если неясны условия контроля процесса или временные изменения, необходимо в комбинации с гистограммой использовать также контрольные карты и график, представляемый ломаной линией. Полученная в результате анализа гистограммы информация может быть легко использована для построения и исследования причинно-следственной диаграммы, что повысит обоснованность мер, намеченных для улучшения процесса.

Поскольку гистограмма выражает условия процесса за период, в течение которого были получены данные, важную информацию может дать форма распределения гистограммы в сравнении с контрольными нормативами.

Режим «Гистограмма» Пакета Анализа Excel сслужит для вычисления частот попада­ния данных в указанные границы интервалов, а также для пост­роения гистограммы интервального вариационного ряда распре­деления.

 

в начало


yuschikev.narod.ru