Середина интервала статистика формула: Формула середины интервала в статистике. Cредние величины в статистике

Содержание

как в статистике найти середину интервала

Вы искали как в статистике найти середину интервала? На нашем сайте вы можете получить ответ на любой математический вопрос здесь. Подробное решение с описанием и пояснениями поможет вам разобраться даже с самой сложной задачей и как найти середину интервала, не исключение. Мы поможем вам подготовиться к домашним работам, контрольным, олимпиадам, а так же к поступлению в вуз. И какой бы пример, какой бы запрос по математике вы не ввели — у нас уже есть решение. Например, «как в статистике найти середину интервала».

Применение различных математических задач, калькуляторов, уравнений и функций широко распространено в нашей жизни. Они используются во многих расчетах, строительстве сооружений и даже спорте. Математику человек использовал еще в древности и с тех пор их применение только возрастает. Однако сейчас наука не стоит на месте и мы можем наслаждаться плодами ее деятельности, такими, например, как онлайн-калькулятор, который может решить задачи, такие, как как в статистике найти середину интервала,как найти середину интервала,как найти середину интервала в статистике,как найти середину интервала в статистике пример,середина интервала статистика формула,середина интервала формула статистика,статистика середина интервала формула.

На этой странице вы найдёте калькулятор, который поможет решить любой вопрос, в том числе и как в статистике найти середину интервала. Просто введите задачу в окошко и нажмите «решить» здесь (например, как найти середину интервала в статистике).

Где можно решить любую задачу по математике, а так же как в статистике найти середину интервала Онлайн?

Решить задачу как в статистике найти середину интервала вы можете на нашем сайте https://pocketteacher.ru. Бесплатный онлайн решатель позволит решить онлайн задачу любой сложности за считанные секунды. Все, что вам необходимо сделать — это просто ввести свои данные в решателе. Так же вы можете посмотреть видео инструкцию и узнать, как правильно ввести вашу задачу на нашем сайте. А если у вас остались вопросы, то вы можете задать их в чате снизу слева на странице калькулятора.

Дисперсия, формула дисперсии, виды дисперсии, простая дисперсия, взвешенная дисперсия

Понятие дисперсии

Дисперсия в статистике

находится как среднее квадратическое отклонение индивидуальных значений признака в квадрате от средней арифметической. В зависимости от исходных данных она определяется по формулам простой и взвешенной дисперсий:

1. Простая дисперсия (для несгруппированных данных) вычисляется по формуле:

2. Взвешенная дисперсия (для вариационного ряда): где n — частота (повторяемость фактора Х)

Пример нахождения дисперсии

На данной странице описан стандартный пример нахождения дисперсии, также Вы можете посмотреть другие задачи на её нахождение

Пример 1. Имеются следующие данные по группе из 20 студентов заочного отделения. Нужно построить интервальный ряд распределения признака, рассчитать среднее значение признака и изучить его дисперсию

Построим интервальную группировку. Определим размах интервала по формуле: где X max– максимальное значение группировочного признака;
X min–минимальное значение группировочного признака;
n – количество интервалов: Принимаем n=5. Шаг равен: h = (192 — 159)/ 5 = 6,6

Составим интервальную группировку

Для дальнейших расчетов построим вспомогательную таблицу: X’i– середина интервала.
(например середина интервала 159 – 165,6 = 162,3)

Среднюю величину роста студентов определим по формуле средней арифметической взвешенной:

Определим дисперсию по формуле:

Пример 2. Определение групповой, средней из групповой, межгрупповой и общей дисперсии

Пример 3. Нахождение дисперсии и коэффициента вариации в группировочной таблице

Пример 4. Нахождение дисперсии в дискретном ряду

Формулу дисперсии можно преобразовать так:

Из этой формулы следует, что дисперсия равна разности средней из квадратов вариантов и квадрата и средней.

Дисперсия в вариационных рядах с равными интервалами по способу моментов может быть рассчитана следующим способом при использовании второго свойства дисперсии (разделив все варианты на величину интервала).

Определении дисперсии, вычисленной по способу моментов, по следующей формуле менее трудоемок:

где i — величина интервала;
А — условный ноль, в качестве которого удобно использовать середину интервала, обладающего наибольшей частотой;
m1 — квадрат момента первого порядка;
m2 — момент второго порядка

Дисперсия альтернативного признака (если в статистической совокупности признак изменяется так, что имеются только два взаимно исключающих друг друга варианта, то такая изменчивость называется альтернативной) может быть вычислена по формуле:

Подставляя в данную формулу дисперсии q =1- р, получаем:

Виды дисперсии

Общая дисперсия измеряет вариацию признака по всей совокупности в целом под влиянием всех факторов, обуславливающих эту вариацию. Она равняется среднему квадрату отклонений отдельных значений признака х от общего среднего значения х и может быть определена как простая дисперсия или взвешенная дисперсия.

Внутригрупповая дисперсия характеризует случайную вариацию, т.е. часть вариации, которая обусловлена влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Такая дисперсия равна среднему квадрату отклонений отдельных значений признака внутри группы X от средней арифметической группы и может быть вычислена как простая дисперсия или как взвешенная дисперсия.

Таким образом, внутригрупповая дисперсия измеряет вариацию признака внутри группы и определяется по формуле:

где хi — групповая средняя;
ni — число единиц в группе.

Например, внутригрупповые дисперсии, которые надо определить в задаче изучения влияния квалификации рабочих на уровень производительности труда в цехе показывают вариации выработки в каждой группе, вызванные всеми возможными факторами (техническое состояние оборудования, обеспеченность инструментами и материалами, возраст рабочих, интенсивность труда и т.

д.), кроме отличий в квалификационном разряде (внутри группы все рабочие имеют одну и ту же квалификацию).

Средняя из внутри групповых дисперсий отражает случайную вариацию, т. е. ту часть вариации, которая происходила под влиянием всех прочих факторов, за исключением фактора группировки. Она рассчитывается по формуле:

Межгрупповая дисперсия характеризует систематическую вариацию результативного признака, которая обусловлена влиянием признака-фактора, положенного в основание группировки. Она равняется среднему квадрату отклонений групповых средних от общей средней. Межгрупповая дисперсия рассчитывается по формуле:

Правило сложения дисперсии в статистике

Согласно правилу сложения дисперсий общая дисперсия равна сумме средней из внутригрупповых и межгрупповых дисперсий:

Смысл этого правила заключается в том, что общая дисперсия, которая возникает под влиянием всех факторов, равняется сумме дисперсий, которые возникают под влиянием всех прочих факторов, и дисперсии, возникающей за счет фактора группировки. 2 раз.

Источник: Балинова B.C. Статистика в вопросах и ответах: Учеб. пособие. — М.: ТК. Велби, Изд-во Проспект, 2004. — 344 с.

Определение числа групп при построении гистограммы

Сегодня, говоря о статистике, я буду обсуждать гистограммы. Вообще говоря, гистограмма является наглядным отображением метода группировки, то есть распределения множества результатов измерений какой-либо величины по группам, в соответствии с существенным для данной группы признаком. Методы группировки широко применяются для обработки первичных данных.

Под первичными данными в статистике мы понимаем статистические ряды, которые называют рядами динамики, если речь идет об изменении явления во времени, либо рядами распределения, если речь идет о составе или структуре исследуемого явления.

Если речь идет о рядах, построенных на основе качественных признаков (например, предприятия по формам собственности), то такие ряды называются

атрибутивными, если ряды построены по количественным признакам (например, предприятия по объему товарооборота), то они называются вариационными.

В зависимости от прерывности вариации признака различают дискретные и интервальные вариационные ряды.

Гистограмма представляет собой столбчатый график, построенный по полученным данным, которые разбиваются на несколько групп. Число данных, попавших в каждую группу (частота), выражается высотой столбика, соответствующего данной группе.

Гистограмму можно строить для любых рядов, при этом, если это атрибутивный либо дискретный вариационный ряд (например, число рабочих в каждом тарифном разряде), то число выделяемых групп равно числу вариантов значений признака. В случае же интервального вариационного ряда число групп будет зависеть от величины интервала, используемого для группировки данных.

Интервал — разница между максимальным и минимальным значениями признака в каждой группе. Понятно, что чем больше групп, тем меньше интервал и наоборот. Группы в таком случае иногда называют также классами интервалов.

Например, можно разбить полученные данные о численности рабочих на предприятиях на следующие группы:
до 25 человек,
25–50 человек,
50–100 человек,
свыше 100 человек.

Тогда гистограмма будет содержать 4 столбика, высота которых будет соответствовать числу предприятий попавших в данную группу.
Заметим, кстати, что вышеприведенное распределение является примером использования неравных интервалов, выделенных, что называется, программой исследования, т. е. нами самими.

Вопрос выбора величины интервала (числа групп), используемого для группировки элементов интервального вариационного ряда, далеко не праздный. Помимо того, что гистограмма является отличным средством визуализации данных, она также является ни чем иным, как приближением функции распределения вероятности (см. картинку). Т. е. величина столбика каждой группы показывает вероятность того, что следующее значение измеряемой величины попадет в данную группу.

Слишком большое число групп может дать слишком «скачущий» график, слишком малое – слишком «сглаженный». В идеале, очевидно, хотелось бы иметь число групп, дающее наименьшее отклонение от функции распределения вероятности, т.  е. позволяющее дать наиболее точную оценку настоящей функции распределения вероятности изучаемого явления.

В общем, математики этим занялись.

Первым, по всей видимости, был Стерджесc (Sturges, 1926). Он рассмотрел идеализированную частотную гистограмму из k классов, где i-ое значение было равно биномиальному коэффициенту . При достаточно больших k форма гистограммы приближалась к форме нормального распределения. Сумма всех значений была равна
.

Таким образом, для n результатов измерений величины, подчиняющейся нормальному распределению, число классов, используемых при построении гистограммы следует брать как и форма полученной гистограммы будет приближаться к форме нормального распределения для достаточно большого k. Это и есть формула Стерджесса. В этом виде она попала практически во все учебники по статистике.

Формула эта в настоящее время подвергается критике как раз за то, что она явным образом использует биномиальное распределение для аппроксимации нормального распределения, что не всегда применимо. Считается, что эта формула позволяет строить удовлетворительные гистограммы при числе измерений менее 200.

Существует целый ряд альтернативных формул, некоторые из которых вычисляют длину интервала, после чего определяется число требуемых классов (см. здесь).

Рассмотрим пару таких формул:

Формула Скотта (Scott, 1979)
, где h — длина интервала, s — стандартное отклонение значений ряда измерений

Формула Фридмана Диакониса (Freedman and Diaconis, 1981)
, где h — длина интервала, (IQ) — разница между верхним и нижним квартилем.

Эти формулы довольно просты и обоснованы статистической теорией, и считаются предпочтительнее формулы Стерджесса.

Калькулятор ниже использует в качестве результатов измерений результаты генератора случайных чисел, встроенного в Javascript.
Поскольку функция распределения генератора практически постоянная, случайное число, полученное от генератора, можно дополнительно модифицировать, выбрав в поле «Функция . ..» что-нибудь интересное. Собственно, это позволит наблюдать более веселые графики, вместо практически прямой линии.

Помимо построения гистограммы с использованием числа классов, полученных по формуле Стерджесса, строятся гистограммы с числом классов по Скотту и Фридману/Диаконису, а также с числом классов, произвольно заданных пользователем.

Конечно, практического применения в этом калькуляторе никакого, но зато можно посмотреть на разницу в числе классов и внешний вид гистограммы.

Формула Стерджесса и другие способы определения числа групп при построении гистограммы

Число случайно генерируемых результатов наблюдений

Модифицирующая функцияНетЛогарифмКвадратКубКвадратный корень

Функция, модифицирующая результаты генератора случайных чисел

Точность вычисления

Знаков после запятой: 2

Число классов по Стерджессу

 

Группировка с использованием формулы Стерджесса

Файл очень большой, при загрузке и создании может наблюдаться торможение браузера.

Загрузить close

Стандартное отклонение

 

Число классов по Скотту

 

Скотт

Файл очень большой, при загрузке и создании может наблюдаться торможение браузера.

Загрузить close

Первая квартиль

 

Третья квартиль

 

Число классов по Фридману/Диаконису

 

Фридман/Диаконис

Файл очень большой, при загрузке и создании может наблюдаться торможение браузера.

Загрузить close

Свое число классов

 

Группировка с использованием своего числа классов

Файл очень большой, при загрузке и создании может наблюдаться торможение браузера.

Загрузить close

content_copy Ссылка save Сохранить extension Виджет

Средняя взвешенная

Средняя арифметическая взвешенная применяется в том случае, когда отдельные значения признака (варианты) встречаются в ряду распределения не с одинаковой частотой (f≠ f≠ …fn) и число вариантов не совпадает с частотой их появления.

Пример расчета:

При расчете средней арифметической по интервальному вариационному ряду необходимо сначала найти середину интервалов. Это и будут значения xi, а количество единиц совокупности в каждой группе fi. При наличии открытого интервала, его ширина принимается равной ширине примыкающего (рядом стоящего) интервала.

Стаж работника, лет

Число работников, чел.

(fi)

Середина  интервала, лет

(xi)

1-3

3-5

5-7

7-9

9-11

10

28

48

10

4

2

4

6

8

10

Итого

100

Х

1. Средний стаж работников предприятия определяется по средней арифметической взвешенной. Он будет равен:

   

   

   

2. Размах вариации R=Хmax-Хmin зависит только от двух крайних значений признака: R=11-1=10(лет).

3. Взвешенное среднее  линейное отклонение (средний модуль)  является средней величиной из абсолютных значений отклонений индивидуальных значений признака  от общей средней арифметической величины:

   

4. Взвешенное среднее квадратическое отклонение  определяется как квадратный корень из дисперсии. На столько, в среднем, отклоняется средний стаж работников предприятия по каждой группе от общей средней (среднего стажа по предприятию).

   

или

   

   

5. Коэффициент вариации характеризует колеблемость признака около средней. Если коэффициент вариации не превышает 33%, то совокупность, по рассматриваемому признаку, можно считать однородной. Данная совокупность характеризуется сильной вариацией, т.е. разброс значений по отдельным группам относительно общего среднего стажа по предприятию значителен.

   

Техника расчета средней арифметической «способом моментов»

   

Заработная плата

Число рабочих  

f

Центр интервала

 Х-А*

 Х’=(Х-А):К**

                              Х’f         

до 250

250 – 275

275 – 300

300 – 325

325 и более

10

15

18

12

5

237,5

262,5

287,5

312,5

337,5

– 50

– 25

   0

+25

+50

– 2

– 1

  0

+1

+2

– 20

-15

   0

+12

+10

Итого

60

 

 

 

 -13

* – в качестве (А) обычно берут значение х, стоящее в середине вариационного ряда (А=287,5)

** -( K) обычно равно ширине интервала (K=25)

   

   

The Midpoint — Статистика LibreTexts

  1. Последнее обновление
  2. Сохранить как PDF
  1. Нахождение середины между двумя числами
  2. Построение середины числовой прямой

Результаты обучения

  1. Найдите середину между двумя числами.
  2. Нарисуйте середину двух чисел на числовой прямой.

Как звучит это слово, «середина» означает «точка посередине». Найти среднюю точку не так уж сложно, и она может применяться во многих областях статистики, от доверительных интервалов до схематических распределений и средних значений.

Нахождение середины между двумя числами

Если нам даны два числа, то средняя точка — это просто среднее из двух чисел. Чтобы вычислить среднюю точку, мы складываем их, а затем делим результат на 2.Формула выглядит следующим образом:

Определение: середина

Пусть \ (a \) и \ (b \) — два числа. Тогда средняя точка \ (M \) этих двух чисел равна

.

\ [M \: = \ frac {a + b} {2} \ label {midpoint} \]

Пример \ (\ PageIndex {1} \)

Найдите середину чисел \ (3.5 \) и \ (7.2 \).

Решение

Самая важная вещь в нахождении средней точки — это то, что сложение двух чисел должно произойти до деления на 2. Мы можем делать это в нашем калькуляторе по одному шагу за раз, или мы можем заключить сумму в круглые скобки. В этом примере мы сначала выполним сложение:

\ [3.5 + 7.2 \: = \: 10.7 \ nonumber \]

Теперь мы готовы разделить на 2:

\ [\ frac {10.7} {2} = 5.35 \ nonumber \]

Таким образом, средняя точка 3,5 и 7,2 равна 5,35.

Пример \ (\ PageIndex {2} \)

Основной темой в статистике является доверительный интервал, который сообщает нам наиболее вероятный интервал, в котором будет находиться среднее значение или пропорция.Часто указываются нижняя и верхняя границы доверительного интервала, но средняя точка этих двух чисел — лучшее предположение для того, что мы ищем. Предположим, что 95% доверительный интервал для разницы между двумя средними составляет -1,34 и 2,79. Найдите середину этих чисел, которая является наилучшим предположением о разнице между двумя средними.

    Решение

    Мы используем формулу для средней точки (Equation \ ref {midpoint}):

    \ [M \: = \: \ frac {a + b} {2} = \: \ frac {-1. 34 + 2.79} {2} \ nonumber \]

    Теперь воспользуемся калькулятором. Нам понадобятся круглые скобки вокруг числителя:

    \ [\ влево (-1,34 + 2,79 \ вправо) \ div2 \: = \: 0,725 \ nonumber \]

    Таким образом, середина чисел -1,34 и 2,79 равна 0,725.

      Построение середины числовой прямой

      Визуализация средней точки часто может выявить ее намного лучше, чем просто записать ее значение. Диаграммы имеют фундаментальное значение в статистике.

      Пример \ (\ PageIndex {3} \)

      Нарисуйте точки -3, 5 и середину этих двух чисел на числовой прямой.

      Решение

      Мы начинаем с нахождения средней точки, используя формулу средней точки (Equation \ ref {midpoint}):

      \ [M \: = \ frac {\: — 3 + 5} {2} = \ left (-3 + 5 \ right) \ div2 \: = \: 1 \ nonumber \]

      Теперь нарисуем эти три точки на числовой прямой:

      Пример \ (\ PageIndex {4} \): проверка гипотез

      Другое применение средней точки включает проверку гипотез. Иногда нам дают гипотетическое среднее значение, которое является средней точкой.Нам также дается выборочное среднее значение, которое является либо левой, либо правой конечной точкой. Цель — найти другую конечную точку. Предположим, что средняя точка (предполагаемое среднее) составляет 3,8, а правая конечная точка (выборочное среднее) — 5,1. Найдите значение левой конечной точки.

      Решение

      Это помогает нарисовать схему на числовой прямой, как показано ниже.

      Теперь, поскольку 3,8 — это средняя точка, расстояние от левой конечной точки до средней точки равно расстоянию от 3.8 к 5.1. Расстояние от 3.8 до 5.1 составляет:

      \ [5.1 \: — \: 3.8 \: = \: 1.3 \ nonumber \]

      Следовательно, левая конечная точка находится на 1,3 слева от 3,8. Его можно найти, вычтя два числа:

      \ [3.8 \: — \: 1.3 \: = \: 2.5 \ nonumber \]

      Следовательно, левая конечная точка находится в 2,5.

      Упражнение

      Предположим, что средняя точка (гипотетическая пропорция) находится на уровне 0,31, а левая конечная точка (доля выборки) находится на уровне 0,28. Найдите значение правильной конечной точки.

      Мощность от данных! Расчет медианы

      Архивный контент

      Информация, помеченная как архивная, предназначена для справки, исследования или ведения записей. Он не регулируется веб-стандартами правительства Канады и не изменялся и не обновлялся с момента его архивирования. Свяжитесь с нами, чтобы запросить формат, отличный от доступных.

      Если наблюдения переменной упорядочены по значению, среднее значение соответствует среднему наблюдению в этом упорядоченном списке.Среднее значение соответствует совокупному проценту в 50% (, т.е. , 50% значений ниже медианы и 50% значений выше медианы). Положение медианы —

      {(n + 1) ÷ 2} th value , где n — количество значений в наборе данных.

      Для вычисления медианы данные должны быть сначала ранжированы (отсортированы в порядке возрастания). Медиана — это число посередине.

      Медиана = среднее значение набора упорядоченных данных.

      Медиана обычно рассчитывается для числовых переменных, но может быть также рассчитана и для упорядоченных категориальных переменных, таких как категории в опросе удовлетворенности: отлично, хорошо, удовлетворительно и плохо. Эти качественные категории могут быть ранжированы по порядку и, таким образом, считаются порядковыми.


      Начало страницы

      В необработанных данных медиана — это точка, в которой ровно половина данных находится выше, а половина — ниже. Эти половинки встречаются в среднем положении.Если количество наблюдений нечетное, медиана подходит идеально, и глубина медианного положения будет целым числом. Если количество наблюдений четное, глубина среднего положения будет включать десятичную дробь. Вам нужно найти середину между числами по обе стороны от среднего положения.

      Пример 1 — Необработанные данные (дискретные переменные)

      Представьте себе, что лучший спортсмен по бегу на типичной 200-метровой тренировке пробегает следующее время:

      26. 1, 25,6, 25,7, 25,2 и 25,0 секунд.

      Как бы вы рассчитали его среднее время?

      Сначала значения располагаются в порядке возрастания: 25,0, 25,2, 25,6, 25,7, 26,1. Затем, используя следующую формулу, выясните, какое значение является средним значением. Помните, что n представляет количество значений в наборе данных.

      Медиана = {(n + 1) ÷ 2} -е значение
      = (5 + 1) ÷ 2
      = 3

      Третье значение в наборе данных будет медианным. С 25.6 — третье значение, 25,6 секунды — среднее время.

      = 25,6 секунды

      Пример 2 — Необработанные данные (дискретные переменные)

      Итак, если бегун пробежит шестой забег на 200 метров за 24,7 секунды, каково теперь среднее значение?

      Опять же, вы сначала помещаете данные в порядке возрастания: 24,7, 25,0, 25,2, 25,6, 25,7, 26,1. Затем вы используете ту же формулу для вычисления среднего времени.

      Медиана = {(n + 1) ÷ 2} -е значение
      = (6 + 1) ÷ 2
      = 7 ÷ 2
      = 3,5

      Поскольку в этом наборе данных есть четное количество наблюдений, четкого среднего значения больше нет. Медиана — это 3,5 -го значения в наборе данных, что означает, что оно находится между третьим и четвертым значениями. Таким образом, медиана рассчитывается путем усреднения двух средних значений 25,2 и 25,6. Используйте формулу ниже, чтобы получить среднее значение.

      Среднее значение = (значение ниже медианы + значение выше медианы) ÷ 2
      = (третье значение + четвертое значение) ÷ 2
      = (25,2 + 25,6) ÷ 2
      = 50,8 ÷ 2
      = 25,4

      Значение 25,4 находится прямо между третьим и четвертым значениями в этом наборе данных, поэтому 25.Среднее время — 4 секунды.


      Начало страницы

      Чтобы найти медиану с использованием кумулятивных частот (или количества наблюдений, которые лежат выше или ниже определенного значения в наборе данных), вы должны вычислить первое значение с кумулятивной частотой, большей или равной медиане. Если значение медианы точно на 0,5 больше, чем совокупная частота предыдущего значения, то медиана является средней точкой между двумя значениями.

      Пример 3 — Несгруппированная таблица частот (дискретные переменные)

      Представьте, что ваша школьная бейсбольная команда забивает следующее количество хоумранов в 10 играх:

      4, 5, 8, 5, 7, 8, 9, 8, 8, 7

      Если бы вы поместили общее количество хоум-ранов в таблицу частот, какой была бы медиана?

      Сначала расположите баллы в порядке возрастания:

      4, 5, 5, 7, 7, 8, 8, 8, 8, 9

      Затем создайте таблицу с двумя столбцами.Обозначьте первый столбец «Количество хоумранов», а затем укажите возможное количество хоумранов, которое может получить команда. Вы можете начать с 0 и перечислить до числа 10, но поскольку команда никогда не забивала менее 4 хоумранов, вы можете начать листинг с числа 4.

      Обозначьте второй столбец «Частота». В этом столбце запишите, сколько раз было забито 4 хоумрана, 5 хоумранов и так далее. В этом случае только один раз было забито 4 хоумрана, но два раза было забито 5 хоумранов.Если сложить все числа в столбце «Частота», они должны равняться 10 (для 10 сыгранных игр).

      Таблица 1. Количество хоумранов в 10 бейсбольных матчах
      4 1
      5 2
      6 0
      7 2
      8 4
      9 1

      Чтобы найти медиану, снова используйте ту же формулу:

      Медиана = {(n + 1) ÷ 2} -е значение
      = (10 + 1) ÷ 2
      = 11 ÷ 2
      = 5.5
      = медиана — это значение 5.5 th в наборе данных

      Чтобы получить медиану, сложите числа в столбце «Частота», пока не дойдете до 5 (а поскольку общее количество игр равно 10, оставшиеся числа в этом столбце также должны равняться 5). Вы достигнете 5 после добавления всех частот до 7 хоум-ранов включительно. Следующий набор из пяти начнется с частот для 8 хоумранов. Медиана (значение 5,5 -е значение ) находится между пятым и шестым значениями.Таким образом, медиана находится между 7 хоумранами и 8 хоумранами.

      Если вы вычислите среднее значение этих значений (используя ту же формулу, что и в примере 2), результат будет 7,5.

      Среднее значение = (среднее значение до + среднее значение после) ÷ 2
      = (пятое значение + шестое значение) ÷ 2
      = (7 + 8) ÷ 2
      = 15 ÷ 2
      = 7,5

      Технически медиана должна быть возможной переменной. В приведенном выше примере переменные дискретные и всегда целые числа. Следовательно, 7.5 не является возможной переменной — никто не может сделать 7 с половиной хоум-ранов. Таким образом, это число имеет смысл только статистически. Некоторые математики могут возразить, что 8 — более подходящая медиана.


      Начало страницы

      Иногда нет смысла перечислять каждую отдельную переменную, если таблица распределения частот была бы длинной и громоздкой для работы. Чтобы упростить это, разделите диапазон данных на интервалы, а затем перечислите интервалы в таблице распределения частот, включая столбец для совокупного процента.(Дополнительные сведения см. В разделе «Совокупная частота».)

      Расчет для поиска медианы немного длиннее, потому что данные были сгруппированы по интервалам, и, следовательно, вся исходная информация была потеряна. Некоторые учебники просто принимают середину интервала за медиану. Однако этот метод является чрезмерным упрощением истинной ценности. Используйте следующие вычисления, чтобы найти медианное значение для сгруппированного частотного распределения.

      1. Определите, какой интервал содержит медианное значение, используя формулу (n + 1) ÷ 2 .Возьмите любое значение, которое дает вам расчет, а затем складывайте числа в столбце частоты, пока не дойдете до этого значения (как в примере 3). Например, если ваша медиана составляет 13,5 -го значения , складывайте частоты, пока не дойдете до значений 13 -го и 14 -го . Какой бы интервал ни содержал эти значения, называется медианной группой.
      2. Найдите совокупный процент интервала, предшествующего медианной группе. Обозначьте это значение A .
      3. Используя этот совокупный процент, вычислите, сколько чисел необходимо, чтобы добавить до 50% от общего совокупного процента. Это значение будет обозначено как B . Используйте следующую формулу для вычисления B :

        В = 50 — А

      4. Определите диапазон (сколько чисел охватывает интервал). Назовите это значение C . Затем найдите процент для среднего интервала. Назовите это значение D .
      5. Рассчитайте, сколько значений данных нужно подсчитать в группе медианы, чтобы получить 50% от общего набора данных, используя следующую формулу.Назовите это значение E .

        E = (B ÷ D) x C

      6. Узнайте, что такое медианное значение, добавив значение E к нижнему значению среднего интервала:

        Медиана = нижнее значение + E

        Поскольку E = (B ÷ D) x C , эта формула может также можно записать как:

        Медиана = нижнее значение + (B ÷ D) x C

      Если совокупная частота для интервала составляет точно 50%, то медианное значение будет конечной точкой этого интервала.

      Давайте проясним это на примере!

      Пример 4 — Сгруппированные переменные — частотное распределение (непрерывное или дискретное)

      Используя ту же информацию из примера 4 в разделе «Среднее», представьте, что вы опросили 50 девочек 10-го класса, чтобы узнать, какой рост у каждой в сантиметрах. После сбора всех ваших данных вы создали таблицу распределения частот, которая выглядела так:

      Таблица 2. Рост девочек 10 класса.
      150 до <155 4 155 4 8 8
      155 до <160 7 160 11 14 22
      160 до <165 18 165 29 36 58
      165 до <170 11 170 40 22 80
      170 до <175 6 175 46 12 92
      175 до <180 4 180 50 8 100

      Используя сгруппированные данные, вы создали график совокупной частоты, который будет сопровождать вашу таблицу. Конечные точки интервалов высот, числа для совокупной частоты и числа для совокупного процента нанесены на график.


      Начало страницы

      Просто взглянув на график, вы можете попытаться найти среднее значение. Медиана — это точка, в которой ось x (высота) пересекается со средней точкой (25) оси y (совокупная частота). Вы увидите, что среднее значение составляет примерно 164 см. С помощью математических расчетов можно узнать, что на самом деле значение равно 163.9 см. Вот как:

      1. Согласно информации, представленной в Таблице 2:

        Медиана = {(n + 1) ÷ 2} -е значение
        = (50 + 1) ÷ 2
        = 51 ÷ 2
        = 25,5

        Путем добавления вверх по частотам, мы обнаруживаем, что медиана (25,5) лежит в средней группе диапазона от 160 до <165 см.

      2. Совокупный процент предыдущего интервала ( A ) равен 22.
      3. Процент, необходимый для получения 50% от общего совокупного процента ( B ), равен 28.

        B = 50 — A
        = 50 — 22
        = 28

      4. Диапазон медианного интервала ( C ) равен 5, а процент медианного интервала ( D ) равен 36.
      5. Число значений для обратного отсчета в пределах интервала, чтобы получить 50% от общего набора данных, составляет 3,9.

        E = (B ÷ D) x C
        = (28 ÷ 36) x 5
        = 3,9

      6. Поскольку нижнее значение интервала медианы составляет 160, добавив к нему значение E , вы получите медианное значение 163.9 см.

        Медиана = нижнее значение медианного интервала + (B ÷ D) x C
        = 160 + (28 ÷ 36) x 5
        = 160 + 3,9
        = 163,9 см

      Упорядоченные графики стеблей и листьев упрощают вычисление медианы, особенно если совокупные частоты уже были рассчитаны. Рассмотрим рост 50 девочек 10-го класса, используя участок стебля и листа. (См. Главу «Организация данных» для получения дополнительной информации о том, как построить эти таблицы. )

      Пример 5 — Стеблевой и листовой участок

      Таблица 3.Рост девочки 10 класса
      15 (0) 0 1 1 4 4
      15 (5) 5 6 7 7 8 8 8 11
      16 (0) 0 1 1 1 1 2 2 2 2 2 2 3 3 3 4 4 4 4 29
      16 (5) 5 5 5 5 6 6 6 7 7 8 9 40
      17 (0) 0 0 1 2 3 3 46
      17 (5) 6 6 7 8 50

      * Примечание: Стержни разделены на более мелкие участки. Стержень 15 (0) означает, что все данные попадают в интервал от 150 до 154. Стержень 15 (5) означает, что данные находятся в интервале от 155 до 159.

      Имеется 50 частей данных, поэтому медиана — это значение наблюдения 25,5 th .

      Медиана = {(n + 1) ÷ 2} -е значение
      = (50 + 1) ÷ 2
      = 51 ÷ 2
      = 25,5

      Следовательно, медиана находится между 25 значениями -го и 26 -го .Чтобы узнать, что это за значения, считайте каждое значение в столбце Leaf, пока не получите 25 значений th и 26 th . Эти значения лежат в интервале 16 (0), что означает интервал от 160 до 164. Цифры в столбце листа представляют числа в интервале (, например, , 3 представляет 163). Таким образом, медиана находится между 163 см (25 -е значение ) и 164 см (26 -е значение ). Медиана находится путем усреднения этих двух значений.

      Среднее значение = (значение до медианы + значение после медианы) ÷ 2
      = (25 -е значение + 26 -е значение ) ÷ 2
      = (163 + 164) ÷ 2
      = 327 ÷ 2
      = 163 .5

      Поскольку рост является непрерывной переменной, 163,5 см является приемлемым средним значением.

      Медиана, полученная из графика совокупной частоты (164 см), не совпадает с медианной величиной, полученной из расчета в Примере 4 (163,9 см) или из участка стебля и листа (163,5 см). Это потому, что вы можете найти только приближение для медианы, если только график не построен точно со всей используемой информацией.

      Расчеты в Примере 4 являются только приблизительными, поскольку сгруппированные данные не говорят вам, как 36% из 50 девочек, найденных в среднем интервале, распределяются в пределах интервала.В результате мы предполагаем, что они распределены равномерно, и это может привести к немного другой медиане. Однако график стебля и листа является наиболее точным средством получения медианы, поскольку он использует все фактические значения.


      Начало страницы

      Среднее значение и медиана распределения могут иметь одно и то же значение. Это всегда так, если распределение симметрично, как при нормальном распределении. Если распределение примерно симметрично, то два значения будут близки друг к другу.

      В примере роста 50 девочек из 10 класса среднее значение (164,5 см) очень близко к значению медианы (163,5 см). Это связано с тем, что распределение примерно симметрично (см. График стебля и листа в приведенном выше примере).

      Однако одно число может изменить среднее значение, не влияя на медианное значение.

      Пример 6 — Сравнение среднего и медианного

      Рассмотрим следующие наборы данных, которые представляют количество очков, набранных 3 игроками в 11 играх в лакросс.

      Эйлин: 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3
      Среднее значение = 22 ÷ 11 = 2
      Медиана = 2

      Джереми: 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 4
      Среднее значение = 23 ÷ 11 = 2,1
      Медиана = 2

      Рэнди: 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 14
      Среднее значение = 33 ÷ 11 = 3
      Медиана = 2

      Три набора данных выше идентичны, за исключением последних значений наблюдений (3, 4 и 14).

      Медиана не меняется, потому что она зависит только от среднего значения наблюдения.Однако среднее значение меняется, поскольку оно зависит от среднего значения всех наблюдений. Итак, в приведенном выше примере с увеличением последнего значения последнего наблюдения увеличивается и среднее значение.

      В третьем наборе данных значение 14 сильно отличается от любых других значений. Когда наблюдение сильно отличается от всех других наблюдений в наборе данных, оно называется выбросом. (Для получения дополнительной информации о выбросах см. Раздел «Стволовые и листовые графики».) Среднее значение — это мера центральной тенденции, на которую больше всего влияют выбросы.

      Исключения могут иногда возникать в результате ошибки или преднамеренной дезинформации. В этих случаях выбросы следует исключить из меры центральной тенденции. В других случаях выбросы просто показывают, насколько отличается одно значение, и это может быть очень полезной частью данных.

      Пример 7 — Сравнение среднего и медианного

      Когда цены на жилье упоминаются в газетах, обычно указывается средняя цена. Почему используется эта мера вместо среднего?

      Есть много домов по умеренным ценам, но есть и дорогие, и несколько очень дорогих.Средняя цифра может быть довольно высокой, поскольку включает в себя цены на более дорогие дома. Но медиана дает более точное и реалистичное значение цен, с которыми сталкивается большинство людей.

      Таким образом, медиана — это центральное число, и его удобно использовать в асимметричных (или несбалансированных) распределениях, поскольку на него не влияют выбросы.

      Пример 8 — Сравнение среднего и медианного

      Предположим, вы хотите узнать, сколько денег семья может позволить себе потратить на жилье. Это будет зависеть от общего дохода семьи.

      Для семьи из пяти человек (двое работающих родителей и трое детей без дохода) средний доход каждого члена семьи — это общий доход, деленный на пять (, например, , 60 000 ÷ 5 = 12 000). Однако средний доход будет равен нулю, потому что более половины членов семьи ничего не зарабатывают. В некоторых ситуациях среднее значение может быть более информативным, чем медиана.

      Пример 9 — Сравнение среднего и медианного

      Если вы хотите узнать, богата страна или нет, вы можете рассмотреть возможность использования медианы в качестве меры центральной тенденции вместо среднего.

      Средний доход семьи может быть довольно высоким, если доход в значительной степени сконцентрирован в нескольких очень богатых семьях (несмотря на то, что большинство семей может практически ничего не зарабатывать). Таким образом, средний доход семьи был бы более значимым показателем — по крайней мере половина семей будет зарабатывать средний доход или меньше, и по крайней мере половина будет зарабатывать не меньше среднего дохода.


      Начало страницы

      Пример 10 — Сравнение среднего и медианного

      Предположим, вы подаете заявление о приеме на работу бухгалтером в несколько крупных фирм и хотите получить представление о том, сколько денег вы можете рассчитывать заработать через пять лет, если присоединитесь к определенной фирме.Возможно, вы захотите рассмотреть заработную плату бухгалтеров в каждой фирме через пять лет после их приема на работу.

      Одна очень высокая зарплата может сделать среднюю зарплату выше; это может не отражать типичную зарплату в этих фирмах. Однако половина бухгалтеров получают среднюю зарплату или меньше, а половина — среднюю зарплату или больше. Итак, мерой центральной тенденции, которая даст вам лучшее представление о типичной зарплате, будет медиана.

      Пример 11 — Сравнение среднего и медианного

      Выбирая меру центральной тенденции, благоприятную для вашей точки зрения, вы можете ввести людей в заблуждение статистикой.На самом деле это обычно и делается.

      Представьте, что вы владелец пекарни, которая производит и продает индивидуальные праздничные торты и огромные свадебные торты.

      Возможно, в ваших интересах заявить своим клиентам, что цены были снижены, и заявить своим акционерам, что вы подняли цены. Предположим, что в прошлом году вы продали 100 000 тортов на день рождения по 10 долларов каждый и 1 000 свадебных тортов по 1000 долларов каждый. В этом году вы продали 100 000 тортов на день рождения по 8 долларов каждый и 1 000 свадебных тортов по 1 200 долларов за штуку.

      • Средняя цена 101 000 тортов, проданных в прошлом году, составляет 10 долларов, потому что более половины проданных товаров приходятся на праздничные торты. Средняя цена 101 000 тортов, проданных в этом году, составляет 8 долларов.
      • Средняя цена 101 000 тортов, проданных в прошлом году, составляет 19,80 долларов.

        (100000 x 10 долларов + 1000 x 1000 долларов) ÷ 101000 = 19,80 долларов США

      • Средняя цена 101 000 тортов, проданных в этом году, также составляет 19,80 долларов.

        (100000 x 8 долларов + 1000 x 1200 долларов) ÷ 101000 = 19 долларов.80

      Средняя цена проданного торта в оба года одинакова. Кроме того, общая выручка и количество проданных тортов остались прежними. Идея состоит в том, что вы можете создать впечатление, что данные рассказывают противоречивые истории, выбрав соответствующую меру центральной тенденции.

      Важно отметить, что вам не обязательно использовать только одну меру центральной тенденции. Можно использовать как среднее, так и медиану, что дает больше информации о данных.

      Рассчитать распределение частот в Excel

      Распределение частот
      Распределение частот — это сводка того, как часто встречается каждое значение, путем группировки значений.
      Например, у вас есть данные для разделов класса с количеством учащихся в каждом разделе.
      Excel: распределение частот
      Есть несколько способов рассчитать частотное распределение (таблица) с помощью Excel.
      1. С СЧЕТЕСЛИ Функция
      2. с ЧАСТОТА Функция

      Расчет распределения частот в Excel


      1.Введите указанные выше данные в ячейки B3: C15. Первая строка таблицы содержит заголовки.

      Те же данные, введенные в таблицу в Excel, выглядят следующим образом:


      2. Выберите желаемые интервалы классов

      3. Создайте таблицу со столбцами — Интервалы классов, Нижний предел, Верхний предел и Частота.

      Как рассчитать нижний и верхний пределы с помощью формулы Excel —

      Предположим, что столбец интервала класса начинается с ячейки E5 (без заголовка).


      Нижний предел —

      Введите следующую формулу в ячейку F5 и вставьте ее до последней строки таблицы.

      = MID (E5,1; НАЙТИ («-«; E5,1) -1)

      Верхний предел —

      Введите следующую формулу в ячейку G5 и вставьте ее до последней строки таблицы.
      = MID (E5; НАЙТИ («-«; E5,1) +1,2)

      Распределение частот с функцией СЧЁТЕСЛИМН —

      Чтобы вычислить последний столбец приведенной выше таблицы, введите следующую формулу в ячейку H5 и вставьте ее до последней строки таблицы

      = COUNTIFS ($ C $ 4: $ C $ 15, «> =» & F5, $ C $ 4: $ C $ 15, «<=" & G5)

      Распределение частот с функцией FREQUENCY

      Создайте таблицу со столбцами — Интервалы классов, верхний предел и количество секций

      Верхний предел можно рассчитать по формуле, приведенной ниже в ячейке F5 —

      MID (E5, FIND («-«, E5,1) +1,2)
      Вставьте формулу до ячейки F9.Убедитесь, что вы ввели двойной минус (-) перед функцией MID.

      На следующем шаге выберите диапазон G5: G9 и затем введите ЧАСТОТА Функция

      = ЧАСТОТА (C4: C15, F5: F9)
      F5: F9 относится к ячейкам верхнего предела.

      Нажмите CTRL SHIFT ENTER , чтобы отправить указанную выше формулу FREQUENCY как формулу массива. Если он введен правильно, вы увидите формулу, заключенную в фигурные скобки {}

      Гистограмма

      Мы можем подготовить гистограмму, используя таблицу частот.

      Шагов:

      1. Выделите значения в интервалах классов столбце (столбец E) и столбце частоты ( столбец H) таблицы распределения частот. (Удерживая нажатой клавишу Ctrl при выделении двух диапазонов)

      2. Щелкните вкладку Insert и выберите 2-D Clustered Column .

      3. Удалите Series1 — Выберите Series1 и нажмите Delete

      .

      Добавление названия оси



      1.Щелкните диаграмму.

      2. Щелкните вкладку Layout в разделе Chart Tools .

      3. Щелкните Названия осей в группе Ярлыки .

      4. Выберите Заголовок первичной горизонтальной оси , а затем выберите Заголовок под осью .

      5. Выберите Заголовок основной вертикальной оси , а затем выберите Заголовок под осью .

      Изменение масштаба оси

      1. Выберите диаграмму.

      2.Щелкните вкладку Макет в разделе Работа с диаграммами .

      3. На вкладке ленты Макет нажмите кнопку Оси .

      4. Выберите Основная вертикальная ось >> Выберите Дополнительные параметры вертикальной оси .

      5. В разделе Axis Options для Minimum выберите Fixed и введите наименьшее число, которое вы хотите на оси Y. В этой диаграмме я использовал 0.
      6.Для Максимум выберите Фиксированный и введите число, в котором должна заканчиваться ось Y. В этом графике я использовал 5 .
      7. Нажмите Закрыть

      Похожие сообщения

      Об авторе:

      Дипаншу основал ListenData с простой целью — сделать аналитику простой для понимания и отслеживания. У него более 10 лет опыта работы в области науки о данных. За время своего пребывания в должности он работал с глобальными клиентами в различных областях, таких как банковское дело, страхование, частный капитал, телекоммуникации и человеческие ресурсы.

      СЧ: определение и как найти СЧ

      Статистические определения> Средние частоты

      Что такое средние частоты?

      Среднечастотный диапазон — это тип среднего или среднего значения. Электронные гаджеты иногда классифицируются как «средние», что означает, что они относятся к средней ценовой категории.

      Формула для определения среднего диапазона = (высокий + низкий) / 2.

      Пример задачи: Текущие цены на сотовые телефоны в магазине мобильных телефонов варьируются от 40 долларов (самый дешевый) до 550 долларов (самый дорогой).Найдите средние частоты.
      Шаг 1. Добавьте наименьшее значение к наибольшему: 550 долларов США + 40 долларов США = 590 долларов США.
      Шаг 2: Разделите шаг 1 на два: 590 долларов / 2 = 295 долларов.
      Телефоны средней ценовой категории будут стоить около 295 долларов.

      Разница между средним и дальним диапазоном.

      Диапазон — это мера разброса. В примере с мобильным телефоном диапазон будет следующим: 550–40 долларов = 510 долларов. Диапазон также может означать весь диапазон чисел — например, он может быть записан как от 40 до 550 долларов. Средний диапазон делает шаг вперед и делит диапазон на два, чтобы найти тип среднего.

      Разница между средним и межквартильным диапазоном.

      Среднечастотный диапазон часто путают с межквартильным диапазоном (IQR), который иногда называют «средним пятидесятилетием». На самом деле они означают очень разные вещи. Средний диапазон — это тип среднего, в то время как межквартильный диапазон говорит о фрагменте данных в середине набора данных.

      Например, когда служба погоды сообщает, что «средняя дневная температура» составляет 77 градусов, они говорят о среднем диапазоне.Они получили это число, взяв сумму высокой дневной температуры и низкой дневной температуры и разделив на 2. Допустим, зарегистрированные дневные температуры были:
      55, 65, 67, 69, 70, 80, 81, 87, 90
      Высокий = 90
      Низкий = 55
      Средний = (90 + 55) / 2 = 154/2 = 77.

      IQR для этого набора данных — это 25-й процентиль, вычтенный из 75-го процентиля:
      25-й процентиль: 66
      75-й процентиль: 84
      Межквартильный диапазон: 84-66 = 18

      Посетите наш канал YouTube, чтобы получить дополнительную статистику, помощь и советы!

      ————————————————— —————————-

      Нужна помощь с домашним заданием или контрольным вопросом? С помощью Chegg Study вы можете получить пошаговые ответы на свои вопросы от эксперта в данной области.Ваши первые 30 минут с репетитором Chegg бесплатны!

      Комментарии? Нужно опубликовать исправление? Пожалуйста, оставьте комментарий на нашей странице в Facebook .

      Калькулятор стандартного отклонения сгруппированных данных

      Решенный пример проблемы

      Этот решенный ниже пример задачи для стандартного отклонения частотного распределения может помочь пользователям понять, как значения используются для тренировки такого расчета на основе приведенных выше математических формул.

      Пример задачи:
      В классе учеников 9 учеников получили от 50 до 60, 7 учеников получили от 61 до 70, 9 учеников получили от 71 до 85, 12 учеников получили от 86 до 95 и 8 учеников получили от 96 до 100 по предмету математика. Оценить стандартное отклонение?

      Решение:
      Ввод:

      Диапазон Частота
      50-60 9
      61-70 307 9
      86-95 12
      96-100 8

      шаг 1: найти среднюю точку M для каждой группы
      (50 + 60) / 2 = 55
      (61 + 70) / 2 = 65.5
      (71 + 85) / 2 = 78
      (86 + 95) / 2 = 90,5
      (96 + 100) / 2 = 98
      Средние баллы составляют 55, 65,5, 78, 90,5 и 98 для группы студентов От 50 до 60, от 61 до 70, от 71 до 85, от 86 до 95 и от 96 до 100 соответственно.

      шаг 2: вычислить количество выборок n
      n = 9 + 7 + 9 + 12 + 8
      n = 45

      шаг 3: найти среднее сгруппированных данных μ
      μ = (55 x 9 + 65,5 x 7 + 78 x 9 + 90,5 x 12 + 98 x 8) / n
      = 3525,5 / 45
      μ = 78.3444

      шаг 4: найти дисперсию σ 2
      = (((9 x 552) + (7 x 65,52) + (9 x 782) + (12 x 90,52) + (8 x 982)) — (45 x 78,3444 2 )) / (45 — 1)
      = (287127,75 — 276203,025) / 44
      σ 2 = 248,2820

      шаг 5: найти стандартное отклонение для сгруппированных данных
      Возьмите квадрат корень дисперсии
      σ = 15,7569

      Стандартное отклонение сгруппированного по функциям используется в различных приложениях для статистического анализа данных.Когда дело доходит до онлайн, это сгруппированный стандартного отклонения калькулятор по формуле, шаг за шагом расчетом и решаемой задачей, например, позволяет пользователям понять, тренировки, выполнять и проверять такие расчеты.

      Среднее непрерывное или дискретное распределение (сгруппированные данные) — Mathlibra

      Сгруппированные данные
      Как рассчитать приблизительное среднее значение сгруппированных данных:
      ● Шаг 1. Определите среднюю точку для каждого интервала.
      ● Шаг 2: Умножьте среднюю точку класса на частоту.
      ● Шаг 3. Сложите результаты, полученные на шаге 2.
      ● Шаг 4: Разделите сумму, полученную на шаге 3, на частоту.

      Когда информация была собрана в группах или классах, мы используем среднюю точку или среднее значение интервала для представления всех оценок в пределах этого интервала.

      Мы предполагаем, что оценки внутри каждого класса равномерно распределены в течение этого интервала. Вычисленное среднее значение является приближением к истинному значению, и мы не можем добиться большего, не зная каждого отдельного значения данных.

      Средние значения интервала
      Когда значения среднего интервала используются для представления всех оценок в пределах этого интервала, какое влияние это окажет на оценку среднего сгруппированных данных?

      Рассмотрим следующую таблицу, в которой суммированы оценки, полученные студентами Marks I Frequency за экзамен по физике из 50 возможных. Точные результаты для каждого студента были потеряны.


      Что делать :
      1. Предположим, что все ученики набрали наименьший возможный результат за время своего учебного интервала, поэтому 2 ученика получили 0 баллов, 31 ученик — 10 и так далее.
      Вычислите среднее значение этих результатов и, следовательно, завершите:
      «Средний балл студентов на экзамене по физике должен быть не менее…»

      2 Теперь предположим, что все ученики набрали наивысший возможный результат в своем классе. Вычислите среднее значение этих результатов и, следовательно, заполните:
      «Средний балл студентов на экзамене по физике должен быть не более…. …

      3 Теперь у нас есть два крайних значения, между которыми должно находиться фактическое среднее значение.
      Теперь предположим, что все учащиеся набрали среднее значение в своем классе.Мы предполагаем, что 2 студента набрали 4,5 балла, 31 студент — 14,5 балла и так далее.
      a) Вычислите среднее значение этих результатов.
      б) Как этот результат соотносится с нижним и верхним пределами, найденными в 1 и 2?
      c) Скопируйте и заполните:
      «Средний балл студентов на экзамене по физике был примерно…».

      Оценка среднего из сгруппированных данных

      (A) Дискретные данные
      Вопрос 1:
      Рассмотрите следующие сгруппированные данные и вычислите среднее значение, модальную группу и среднюю группу.

      раствор:
      Шаг 1. Расчет среднего значения
      Чтобы вычислить среднее значение, нам нужно сложить все массы и разделить на 50. Мы не знаем фактических масс, поэтому мы приближаемся, выбирая среднюю точку каждой группы. Затем мы умножаем эти средние числа на частоту. Затем мы складываем эти числа, чтобы найти приблизительную сумму масс. Это показано в таблице ниже.

      Шаг 2: ответ
      Среднее значение 2650/50 = 53.
      Модальной группой является группа 51-53, потому что она имеет самую высокую частоту.Срединной группой является группа 51-53, поскольку 25-й и 26-й члены входят в эту группу.

      Вопрос 2:
      Оцените среднее значение следующих возрастов данных водителей автобусов с точностью до ближайшего года:


      средний возраст водителей — около 38 лет.

      (B) Непрерывные данные
      Вопрос 3:
      Вычислите оценку среднего числа болельщиков, посещающих грандиозные футбольные матчи Preston North End, по следующей таблице:


      Хорошо, теперь вы видите здесь проблему? … Посмотрите на первую группу … мы знаем, что было 5 матчей, на которые пришло от 0 до 5 000 человек, но мы не знаем точно, сколько человек было на этих матчах! … Один в матче могло быть 1,309… еще 4,510.. мы просто не знаем!

      Итак… Лучшее, что мы можем сделать — это сделать оценку!
      И какова наша лучшая оценка для той первой группы?… Ну, СРЕДНЯЯ ТОЧКА… 2500!
      Вот как мы вычисляем оценку среднего из сгруппированных данных:
      1. Определите среднюю точку
      2. Определите среднюю точку × частота для каждой группы
      3. Используйте эту формулу:


      Вопрос 4:
      Пятьдесят покупателей спросили, какой процент своего дохода они тратят на продукты.
      Шесть ответили, что тратят от 10% до 19% включительно.Полный набор ответов представлен в таблице ниже.

      Подсчитайте средний процент дохода семьи, выделяемый на продукты.
      решение:

      и. Определите средние точки каждого интервала. Поскольку у нас нет точных значений в сгруппированных данных, мы используем эти приближения
      ii. Сложите частоты, чтобы получить количество элементов в наборе данных
      iii. Определите сумму всех


      Вопрос 5:
      В таблице ниже представлена ​​информация о количестве часов, проведенных 120 учащимися на своих мобильных телефонах за последнюю неделю.

      а) Определите модальный класс данных.
      б) Оцените среднее количество часов, которые эти учащиеся потратили на свои мобильные телефоны за последнюю неделю.
      Учебные заметки :
      а) Найдите класс, который имеет наибольшее количество значений.
      б) Найдите середину интервалов между занятиями и умножьте на частоту. Найдите сумму продуктов и разделите на число в наборе данных. Напомните учащимся, почему они это делают.
      раствор:
      а) 6h≤8
      б)

      Расчетное среднее значение x = 730/120 = 6.08 час

      Вопрос 6:
      Показатель коэффициента интеллекта (IQ) для класса 10 представлен в таблице ниже.


      а) Запишите модальный класс данных.
      б) Определите интервал, в котором лежит медиана.
      c) Оцените средний балл IQ этого класса учащихся.
      раствор:
      а) Модальный класс получил наибольшую частоту.
      100≤ x
      б) Общее количество частот равно 30. Медиана находится между 15-м и 16-м учениками в интервале IQ 110≤ x = 3480/30 = 116

      Вопрос 7:
      Учащийся выполнил проект по изменению климата.Каждый день в 14:00 она записывала температуру (в ° C) для определенного города. Информация представлена ​​в таблице частот ниже.


      а) За сколько дней учащийся собирал данные?
      б) Запишите модальный класс данных.
      c) Оцените среднее значение данных.
      г) Рассчитайте процент дней, в которые температура была не ниже 28 ° C.
      раствор:
      а) Количество дней = 2 + 4 + 9 + 5 + 7 + 3 = 30.
      б) Модальный — самый частый.
      28≤ T
      c) Среднее — это среднее значение данных.Среднее обозначено x .

      г) Это означает, что температура была 28≤ T
      а) Запишите модальный класс данных.
      б) Оцените среднюю полную массу автомобиля за месяц.
      c) Какой из показателей центральной тенденции, модальный класс или оценочное среднее, будет наиболее подходящим для описания набора данных? Объяснить свой выбор.
      раствор:
      а) Модальный класс получил наибольшую частоту. Модальный класс 2500≤ x
      Расчетное среднее

      в) Расчетное среднее.
      Это больше в центре набора данных. Модальный класс находится в крайней левой части набора данных.

      Среднее значение, медиана и мода от сгруппированных частот

      Объяснение на трех примерах

      Гонка и непослушный щенок

      Это начинается с необработанных данных ( еще не сгруппированная частота ) …

      Алекс засчитал 21 человека в спринтерской гонке, с точностью до секунды:

      59, 65, 61, 62, 53, 55, 60, 70, 64, 56, 58, 58, 62, 62, 68, 65, 56, 59, 68, 61, 67

      Чтобы найти среднее, Алекс складывает все числа, а затем делит их на количество:

      Среднее значение = 59 + 65 + 61 + 62 + 53 + 55 + 60 + 70 + 64 + 56 + 58 + 58 + 62 + 62 + 68 + 65 + 56 + 59 + 68 + 61 + 67 21
      Среднее = 61.38095 …

      Чтобы найти медианное значение, Алекс расставляет числа в порядке значений и находит среднее число.

      В данном случае медиана — это 11 -й номер :

      53, 55, 56, 56, 58, 58, 59, 59, 60, 61, 61, 62, 62, 62, 64, 65, 65, 67, 68, 68, 70

      Медиана = 61

      Чтобы найти режим, или модальное значение, Алекс размещает числа в порядке значений, затем подсчитывает, сколько каждого номера. Режим — это номер, который встречается чаще всего. (может быть более одного режима):

      53, 55, 56, 56, 58, 58, 59, 59, 60, 61, 61, 62, 62, 62, 64, 65, 65, 67, 68, 68, 70

      62 появляется трижды чаще, чем другие значения, поэтому Mode = 62

      Таблица сгруппированных частот

      Алекс затем составляет сгруппированную таблицу частот:

      Секунды Частота
      51 — 55 2
      56-60 7
      61–65 8
      66 — 70 4

      Итак, 2 бегунов заняли от 51 до 55 секунд, 7 — от 56 до 60 секунд и т. Д.

      О нет!

      Внезапно все исходные данные теряются (непослушный щенок!)


      Сохранилась только сгруппированная таблица частот…

      … можем ли мы помочь Алексу вычислить среднее значение, медианное значение и моду только по этой таблице?

      Ответ … нет, не можем. Во всяком случае, не совсем точно. Но мы можем сделать оценки.

      Оценка среднего из сгруппированных данных

      Итак, у нас осталось:

      Секунды Частота
      51 — 55 2
      56-60 7
      61–65 8
      66 — 70 4

      Группы (51-55, 56-60 и т. Д.), Также называемые интервалами классов, имеют ширину 5

      Средние точки находятся в середине каждого класса: 53, 58, 63 и 68

      Мы можем оценить среднее значение, используя средние точки .

      Итак, как это работает?

      Подумайте о 7 бегунах в группе 56-60 : все, что мы знаем, это то, что они пробежали где-то между 56 и 60 секундами:

      • Может быть, все семеро сделали 56 секунд,
      • Может быть, все семеро продержались 60 секунд,
      • Но более вероятно, что существует разброс цифр: некоторые по 56, некоторые по 57 и т. д.

      Итак, мы берем среднее значение и предполагаем, что все семь заняли 58 секунд.

      Давайте теперь сделаем таблицу, используя средние точки:

      Средняя точка Частота
      53 2
      58 7
      63 8
      68 4

      Мы думаем: «2 человека заняли 53 секунды, 7 человек — 58 секунд, 8 человек — 63 секунды и 4 — 68 секунд». Другими словами, мы представляем, что данные выглядят так:

      53, 53, 58, 58, 58, 58, 58, 58, 58, 63, 63, 63, 63, 63, 63, 63, 63, 68, 68, 68, 68

      Затем мы складываем их все и делим на 21.Самый быстрый способ сделать это — умножить каждую среднюю точку на каждую частоту:

      Средняя точка
      x
      Частота
      f
      Средняя точка × Частота
      FX
      53 2 106
      58 7 406
      63 8 504
      68 4 272
      Всего: 21 1288

      И тогда наша оценка среднего времени для завершения гонки составляет :

      Расчетное среднее = 1288 21 = 61.333 …

      Очень близко к точному ответу, который мы получили ранее.

      Оценка медианы на основе сгруппированных данных

      Давайте еще раз посмотрим на наши данные:

      Секунды Частота
      51 — 55 2
      56-60 7
      61–65 8
      66 — 70 4

      Медиана — это среднее значение, в нашем случае это 11 -е значение , которое находится в группе 61-65:

      Можно сказать, что «средняя группа составляет 61–65″

      Но если нам нужно приблизительное значение медианы , нам нужно более внимательно посмотреть на группу 61–65.

      Мы называем это «61 — 65», но на самом деле он включает значения от 60,5 до (но не включая) 65,5.

      Почему? Значения указаны в целых секундах, поэтому реальное время 60,5 измеряется как 61. Точно так же 65,4 измеряется как 65.

      На 60,5 у нас уже будет 9 бегунов, а к следующей границе на 65,5 у нас будет 17 бегунов. Проведя прямую линию между ними, мы можем определить, где средняя частота бегунов n / 2 составляет:

      И эта удобная формула выполняет расчет:

      Расчетная медиана = L + (n / 2) — B G × w

      где:

      • L — нижняя граница класса группы, содержащей медианное значение
      • n — общее количество значений
      • B — совокупная частота групп до медианной группы
      • G — частота медианной группы
      • w — ширина группы

      Для нашего примера:

      • L = 60.5
      • n = 21
      • В = 2 + 7 = 9
      • G = 8
      • w = 5

      Расчетная медиана = 60,5 + (21/2) — 9 9 1027 8 × 5

      = 60,5 + 0,9375

      = 61,4375

      Оценка режима на основе сгруппированных данных

      Снова посмотрим на наши данные:

      Секунды Частота
      51 — 55 2
      56-60 7
      61–65 8
      66 — 70 4

      Легко найти модальную группу (группу с наивысшим частота), что составляет 61-65

      Можно сказать «модальная группа 61–65″

      Но настоящий режим может даже не входить в эту группу! Или может быть более одного режима.Без исходных данных мы ничего не знаем.

      Но мы можем оценить режим, используя следующую формулу:

      Расчетный режим = L + f м — f m-1 (f m — f m-1 ) + (f m — f m + 1 ) × ш

      где:

      • L — нижняя граница класса модальной группы
      • f m-1 — частота группы перед модальной группой
      • f m — частота модальной группы
      • f m + 1 — частота группы после модальной группы
      • w — ширина группы

      В этом примере:

      • L = 60.5
      • ф м-1 = 7
      • f м = 8
      • f м + 1 = 4
      • Вт = 5

      Расчетный режим = 60,5 + 8-7 (8-7) + (8-4) × 5

      = 60,5 + (1/5) × 5

      = 61,5

      Наш окончательный результат:

      • Среднее расчетное: 61,333 …
      • Расчетная медиана: 61,4375
      • Расчетный режим: 61.5

      (Сравните это с истинным Средним, Медианой и Модой 61,38 …, 61 и 62 , которые мы получили в самом начале.)

      И вот как это делается.

      Теперь давайте рассмотрим еще два примера и попутно попрактикуемся!

      Молодая морковь, пример

      Пример. Вы вырастили пятьдесят молодых морковок на специальной почве. Вы откапываете их, измеряете их длину (с точностью до миллиметра) и группируете результаты:

      Длина (мм) Частота
      150–154 5
      155–159 2
      160–164 6
      165 — 169 8
      170–174 9
      175–179 11
      180–184 6
      185–189 3

      Среднее

      Длина (мм) Средняя точка
      x
      Частота
      f

      FX
      150–154 152 5 760
      155–159 157 2 314
      160–164 162 6 972
      165 — 169 167 8 1336
      170–174 172 9 1548
      175–179 177 11 1947
      180–184 182 6 1092
      185–189 187 3 561
      Всего: 50 8530

      Расчетное среднее = 8530 50 = 170.6 мм

      Медиана

      Медиана — это среднее значение длины 25 -го и 26-го -го , так же как и в группе 170–174 :

      • L = 169,5 (нижняя граница класса группы 170 — 174)
      • n = 50
      • В = 5 + 2 + 6 + 8 = 21
      • G = 9
      • w = 5

      Расчетная медиана = 169.5 + (50/2) — 21 9 × 5

      = 169,5 + 2,22 …

      = 171,7 мм (с точностью до 1 знака после запятой)

      Режим

      Модальная группа имеет самую высокую частоту, что составляет 175 — 179 :

      • L = 174,5 (нижняя граница класса группы 175 — 179)
      • ф м-1 = 9
      • f м = 11
      • f м + 1 = 6
      • Вт = 5

      Расчетный режим = 174.5 + 11 — 9 (11 — 9) + (11 — 6) × 5

      = 174,5 + 1,42 …

      = 175,9 мм (до 1 десятичный)

      Возраст Пример

      Возраст — особый случай.

      Когда мы говорим «Сара 17 лет она остается «17» до ее восемнадцатилетия.
      Ей может быть 17 лет и 364 дня, и ее все еще называют «17».

      Это изменяет средние точки и границы классов.

      Пример: 112 человек, живущих на тропическом острове, сгруппированы следующим образом:

      Возраст Число
      0–9 20
      10-19 21
      20–29 23
      30 — 39 16
      40–49 11
      50–59 10
      60–69 7
      70–79 3
      80–89 1

      Ребенок первой группы 0–9 может быть почти 10 лет.Таким образом, средняя точка для этой группы составляет 5 не 4,5

      Средние точки: 5, 15, 25, 35, 45, 55, 65, 75 и 85

      Аналогично, при расчетах Медианы и Мод, мы будем использовать границы классов 0, 10, 20 и т. д.

      Среднее

      Возраст Средняя точка
      x
      Номер
      ф

      FX
      0–9 5 20 100
      10-19 15 21 315
      20–29 25 23 575
      30 — 39 35 16 560
      40–49 45 11 495
      50–59 55 10 550
      60–69 65 7 455
      70–79 75 3 225
      80–89 85 1 85
      Всего: 112 3360

      Расчетное среднее = 3360 112 = 30

      Медиана

      Медиана — это среднее значение возраста 56 -го и 57 -го человек, то есть в группе 20-29:

      • L = 20 (нижняя граница классов интервала классов содержащая медиану)
      • n = 112
      • В = 20 + 21 = 41
      • G = 23
      • w = 10

      Расчетная медиана = 20 + (112/2) — 41 23 × 10

      = 20 + 6.52 …

      = 26,5 (с точностью до 1 после запятой)

      Режим

      Модальная группа имеет самую высокую частоту, что составляет 20–29:

      • L = 20 (нижняя граница модального класса)
      • ф м-1 = 21
      • f м = 23
      • f м + 1 = 16
      • Вт = 10

      Расчетный режим = 20 + 23-21 (23-21) + (23-16) × 10

      = 20 + 2.22 …

      = 22,2 (до 1 десятичный)

      Сводка

      • Для сгруппированных данных мы не можем найти точное Среднее, Медиану и Режим, мы можем только дать оценки.
      • Для оценки среднего значения используйте средние точки интервалов классов:

        Расчетное среднее = Сумма (средняя точка × частота) Сумма частоты

      • Для оценки медианы используйте:

        Расчетная медиана = L + (n / 2) — B G × w

        где:

        • L — нижняя граница класса группы, содержащей медианное значение
        • n — общее количество данных
        • B — совокупная частота групп до медианной группы
        • G — частота медианной группы
        • w — ширина группы
      • Для оценки Mode используйте:

        Расчетный режим = L + f м — f m-1 (f m — f m-1 ) + (f m — f m + 1 ) × ш

        где:

        • L — нижняя граница класса модальной группы
        • f m-1 — частота группы перед модальной группой
        • f m — частота модальной группы
        • f m + 1 — частота группы после модальной группы
        • w — ширина группы

      .