Как найти среднее квадратическое отклонение пример: Среднее квадратическое отклонение, Линейное отклонение

Содержание

Среднее квадратическое отклонение, Линейное отклонение

Среднее квадратическое отклонение

Среднее квадратичное отклонение определяется как обобщающая характеристика размеров вариации признака в совокупности. Оно равно квадратному корню из среднего квадрата отклонений отдельных значений признака от средней арифметической, т.е. корень из дисперсии и может быть найдена так:

1. Для первичного ряда:

2. Для вариационного ряда:

Преобразование формулы среднего квадратичного отклонени приводит ее к виду, более удобному для практических расчетов:

Среднее квадратичное отклонение определяет на сколько в среднем отклоняются конкретные варианты от их среднего значения, и к тому же является абсолютной мерой колеблемости признака и выражается в тех же единицах, что и варианты, и поэтому хорошо интерпретируется.

Примеры нахождения cреднего квадратического отклонения: Пример 1, Пример 2

Для альтернативных признаков формула среднего квадратичного отклонения выглядит так:

где р — доля единиц в совокупности, обладающих определенным признаком;

q — доля единиц, не обладающих этим признаком.

Понятие среднего линейного отклонения

Среднее линейное отклонение определяется как средняя арифметическая абсолютных значений отклонений отдельных вариантов от их средних арифметических.

1. Для первичного ряда:

2. Для вариационного ряда:

где сумма n — сумма частот вариационного ряда.

Пример нахождения cреднего линейного отклонения: Пример 1

Преимущество среднего абсолютного отклонения как меры рассеивания перед размахом вариации, очевидно, так как эта мера основана на учете всех возможных отклонений. Но этот показатель имеет существенные недостатки. Произвольные отбрасывания алгебраических знаков отклонений могут привести к тому, что математические свойства этого показателя являются далеко не элементарными.

Это сильно затрудняет использование среднего абсолютного отклонения при решении задач, связанных с вероятностными расчетами.

Поэтому среднее линейное отклонение как мера вариации признака применяется в статистической практике редко, а именно тогда, когда суммирование показателей без учета знаков имеет экономический смысл. С его помощью, например, анализируется оборот внешней торговли, состав работающих, ритмичность производства и т. д.

Среднее квадратическое

Среднее квадратическое применяется

, например, для вычисления средней величины сторон n квадратных участков, средних диаметров стволов, труб и т. д. Она подразделяется на два вида.

Средняя квадратичная простая. Если при замене индивидуальных величин признака на среднюю величину необходимо сохранить неизменной сумму квадратов исходных величин, то средняя будет являться квадратичной средней величиной.

Она является квадратным корнем из частного от деления суммы квадратов отдельных значений признака на их число:

Средняя квадратичная взвешенная вычисляется по формуле:

где f — признак веса.

Средняя кубическая

Средняя кубическая применяется, например, при определении средней длины стороны и кубов. Она подразделяется на два вида.

Средняя кубическая простая:

Средняя кубическая взвешенная:

При расчете средних величин и дисперсии в интервальных рядах распределения истинные значения признака заменяются центральными значениями интервалов, которые отличны от средней арифметической значений, включенных в интервал. Это приводит к возникновению систематической погрешности при расчете дисперсии. В.Ф. Шеппард определил, что погрешность в расчете дисперсии, вызванная применением сгруппированных данных, составляет 1/12 квадрата величины интервала как в сторону повышения, так и в сторону понижения величины дисперсии.

Поправка Шеппарда должна применяться, если распределение близко к нормальному, относится к признаку с непрерывным характером вариации, построено по значительному количеству исходных данных (n > 500). Однако исходя из того, что в ряде случаев обе погрешности, действуя в разных направлениях компенсируют друг друга, можно иногда отказаться от введения поправок.

Чем меньше значение дисперсии и среднего квадратического отклонения, тем однороднее совокупность и тем более типичной будет средняя величина.
В практике статистики часто возникает необходимость сравнения вариаций различных признаков. Например, большой интерес представляет сравнение вариаций возраста рабочих и их квалификации, стажа работы и размера заработной платы, себестоимости и прибыли, стажа работы и производительности труда и т.д. Для таких сопоставлений показатели абсолютной колеблемости признаков непригодны: нельзя сравнивать колеблемость стажа работы, выраженного в годах, с вариацией заработной платы, выраженной в рублях.

Для осуществления таких сравнений, а также сравнений колеблемости одного и того же признака в нескольких совокупностях с разными средним арифметическим используется относительный показатель вариации — коэффициент вариации.

Структурные средние

Для характеристики центральной тенденции в статистических распределениях не редко рационально вместе со средней арифметической использовать некоторое значение признака X, которое в силу определенных особенностей расположения в ряду распределения может характеризовать его уровень.

Это особенно важно тогда, когда в ряду распределения крайние значения признака имеют нечеткие границы. В связи с этим точное определение средней арифметической, как правило, невозможно, либо очень сложно. В таких случаях средний уровень можно определить, взяв, например, значение признака, которое расположено в середине ряда частот или которое чаще всего встречается в текущем ряду.

Такие значения зависят только от характера частот т. е. от структуры распределения. Они типичны по месту расположения в ряду частот, поэтому такие значения рассматриваются в качестве характеристик центра распределения и поэтому получили определение структурных средних.

Они применяются для изучения внутреннего строения и структуры рядов распределения значений признака. К таким показателям относятся мода и медиана.

Источник: Балинова B.C. Статистика в вопросах и ответах: Учеб. пособие. — М.: ТК. Велби, Изд-во Проспект, 2004. — 344 с.

Дисперсия и среднее квадратичное отклонение. Примеры вычисления

Математическое ожидание не дает достаточно полной информации о случайной величине, поскольку одному и тому же значению математического ожидания может соответствовать множество случайных величин, будут различаться не только возможными значениями, но и характером распределения и самой природой возможных значений.


Например. Законы распределения двух случайных величин и заданные таблицами:

Вычислить математическое ожидание и

Решение. Находим математическое ожидание по класической формуле

Получили, что для двух различных законов распределения математическое ожидание принимает одинаковое значения (0), при этом возможные значения случайных величин и различаются. Из приведенного примера видно, что в случае равенства математических ожиданий случайные величин и имеют тенденцию к колебаниям относительно и причем имеет больший размах рассеяния относительно сравнительно случайной величине относительно . Поэтому математическое ожидание еще называют центром рассеяния. Для определения рассеяния вводится числовая характеристика, называемая дисперсией.

Для определения дисперсии рассматривается отклонение случайной величины от своего математического ожидания

Математическое ожидание такого отклонения случайной величины всегда равна нулю. В этом легко убедиться из следующего соотношения

Таки образом, отклонение не может быть мерой рассеивания случайной величины.

Дисперсией случайной величины называют математическое ожидание квадрата отклонения случайной величины от своего математического ожидания

Для дискретной случайной величины дисперсия вычисляется по формуле

для непрерывной находят интегрированием

Если непрерывная величина заданная на интервале то дисперсия равна интегралу с постоянными пределами интегрирования

Дисперсия обладает следующими свойствами

1. Если случайная величина состоит из одной тотчки — постоянная величина, то дисперсия равна нулю

2. Дисперсия от произведения постоянной на случайную величину равна квадрату постоянной умноженной на дисперсию случайной величины

3. Если и — постоянные величины, то для дисперсии справедлива зависимость

Это следует из двух предыдущих свойств.

Дисперсию можно вычислить по упрощенной формуле:

которая в случае дискретной случайной величины имеет вид

для непрерывной определяется зависимостью

и для непрерывной на промежутке соотношением

Приведенные формулы очень удобны в вычислениях, и их, в отличие от предыдущих, используют в обучении

Также следует помнить, что дисперсия всегда принимает неотрицательные значения . Она характеризует рассеяние случайной величины относительно своего математического ожидания. Если случайная величина измерена в некоторых единицах, то дисперсия будет измеряться в этих же единицах, но в квадрате.

Для сравнения удобно пользоваться числовыми характеристиками одинаковой размерности случайной величиной. Для этого вводят в рассмотрение среднее квадратичное отклонение – корень квадратный из дисперсии. Ее обозначают греческой буквой «сигма»

—————————————-

Рассмотрим примеры для ознакомления с практической стороной определения этих величин.

Пример 1. Закон распределения дискретной случайной величины заданы таблицей:

Вычислить дисперсию и среднее квадратическое отклонение .

Решение. Согласно свойствами дисперсии получим:

—————————————-

Пример2. Есть четыре электрические лампочки, каждая из которых имеет дефект с вероятностью ( — вероятность того, что лампочка без дефекта). Последовательно берут по одной лампочке, вкручивают в патрон и включают электрический ток. При включении тока лампочка может перегореть, и ее заменяют на другую. Построить закон распределения дискретной случайной величины — число лампочек, которые будут опробованы. Вычислить среднее квадратическое отклонение

Решение. Дискретная случайная величина — число лампочек, которые будут опробованы — приобретает такие возможных значений:

Вычислим соответствующие вероятности:

Последнюю вероятность можно трактовать следующим образом: четвертая лампочка будет испытана, когда третья перегорит, а четвертая — нет, или если и четвертая перегорит.

В табличной форме закон распределения иметь следующий вид:

Для нахождения среднего квадратического отклонения найдем сначала значение дисперсии. Для дискретной случайной величины она примет значение:

Среднее квадратичное отклонение находим добычей корня квадратного из дисперсии.

—————————————-

Пример 3. Закон распределения вероятностей дискретной случайной величины заданы в виде функции

Вычислить среднее квадратическое отклонение и дисперсию

Решение. С помощью функции распределения вероятностей формируем закон распределения в виде таблицы

На основе таблицы распределения вычисляем дисперсию

————————

Подобных примеров можно привести множество, основная их суть в правильном применении приведенных в начале статьи формул для вычисления дисперсии и математического ожидания. Применяйте их там где это необходимо и не допускайте ошибок при определении дисперсии.

Одной из основных оценок рассеяния возможных значе­ний случайной величины служит Среднее квадратическое от­клонение.

Определение 4.

Средним квадратическим отклонением слу­чайной величины Х (стандартом) называется квадратный ко­рень из ее дисперсии:

Согласно этому определению, из свойства 3 и формулы (18.13) следует, что в случае суммы взаимно независимых слу­чайных величин справедлива формула

Пример 9. Найти дисперсию и среднее квадратическое отклонение случайной величины X, заданной следующим распределением:

Решение. Имеем М(Х) = 2,6. Составим таблицу распре­деления случайной величины X2:

Отсюда получаем, что

М(Х2) = 14,4. По формулам (18.11) и (18.15) окончательно получаем искомые значения D(X) И. σ(Х):

Пример 10. Законы распределения независимых случайных величин Х и Y приведены соответственно в таблицах:

Найти дисперсию и среднее квадратическое отклонение слу­чайной величины Z = 2Х + 3Y.

Решение. Согласно свойствам 2 и 3 дисперсии (формулы (18.12) и (18.13)), имеем

Для вычисления дисперсий D(X) и D(Y) составляем соответ­ствующие таблицы — законы распределения случайных вели­чин Х2 и Y2:

Отсюда получаем

Искомые дисперсия и среднее квадратичное отклонение слу­чайной величины Z равны:

Пример 11. В условиях примера 8 найти математическое ожи­дание и среднее квадратическое отклонение прибыли при П = 1000, Р = 0,8, S = 100 тыс. р. и R = 30%.

Решение. Ставка ссудного процента удовлетворяет усло­вию, чтобы математическое ожидание прибыли было положи­тельным: 30 > 100 (1 — 0,8) / 0,8. Математическое ожидание при­были:

Среднее квадратическое отклонение прибыли:

< Предыдущая   Следующая >

Среднее квадратическое отклонение случайной величины

Пример 2.3. Вычислить дисперсию и среднее квадратическое отклонение случайной величины Хпо данным примера 2. 2.  [c.28]

Среднее квадратическое отклонение случайной величины  [c.134]

Математическое ожидание, дисперсия и среднее квадратическое отклонение случайной величины Т соответственно равны  [c.157]

Среднее квадратическое отклонение случайной величины T(ta) [c.97]

Нестационарный поток нестационарный пуассоновский поток интенсивность нестационарного пуассоновского потока дискретная случайная величина X(t r) распределение Пуассона математическое ожидание случайной величины X(t0 т) дисперсия случайной величины X(t0 r) среднее квадратическое отклонение случайной величины X(ty г) элемент вероятности появления события в нестационарном пуассоновском потоке непрерывная случайная величина T(t0) интегральный закон распределения случайной величины T(t0) дифференциальный закон распределения случайной величины T(t0) математическое ожидание случайной величины Г( 0) дисперсия случайной величины Г( 0) среднее квадратическое отклонение случайной величины Г(г0).  [c.102]

Формулы (7.1) — (7.4) выражают соответственно плотность распределения, математическое ожидание, дисперсию и среднее квадратическое отклонение случайной величины Т ., через интенсивность Я исходного простейшего потока. Но можно указанные величины выразить через интенсивность Я. самого потока Э… Для этого надо в указанные формулы вместо Я подставить его выражение через Яда по формуле (7.7) в результате получим  [c.110]

Все более признанным становится оценка рискованности всей операции посредством среднего квадратического отклонения случайной величины дохода Q, т.е. посредством OQ. В данной книге это основная количественная оценка.  [c.85]

Положительный квадратный корень из дисперсии называется средним квадратическим отклонением случайной величины ax =  [c.296]

Стандартное отключение случайной величины о — мера разброса случайной величины вокруг среднего значения, имеющая размерность данной случайной величины Если случайная величина измеряется в , то величина а измеряет ее разброс вокруг среднего также в Стандартное отклонение — это среднее квадратическое разброса случайной величины, или квадратный корень из ее дисперсии  [c. 264]

Разброс значений выходных сигналов 1т и погрешность определения среднего / зависят от величины случайной погрешности аналитического прибора и однородности СО. Характеристикой этой погрешности может служить среднее квадратическое отклонение сг ,  [c.45]

Закон распределения случайной величины, обладающей следующим свойством промежутки времени между любыми двумя соседними событиями и его среднее квадратическое отклонение равны 1/Х, где — интенсивность потока, являющегося экспоненциальным, или показательным.  [c.177]

Поэтому для описания случайных величин часто используются их числовые характеристики — числа, в сжатой форме выражающие наиболее существенные черты распределения случайной величины. Наиболее важными из них являются математическое ожидание, дисперсия, среднее квадратическое отклонение и др. Обращаем внимание на то, что в силу определения, числовые характеристики случайных величин являются числами неслучайными, определенными.  [c.26]

Средним квадратическим отклонением (стандартным отклонением или стандартом) ах случайной величины X называется арифметическое значение корня квадратного из ее дисперсии  [c.28]

Размерность среднего квадратического отклонения есть размерность случайной величины.  [c.134]

В условиях примера 3.27 найти математическое ожидание МО(дг), дисперсию D(x) и среднее квадратическое отклонение о(х) случайной величины х.  [c.134]

Дисперсия характеризует степень разброса значений случайной величины. Тот же смысл имеет другая характеристика — средне-квадратическое отклонение  [c.302]

Анализ результатов позволяет сделать заключение о том, что выборочная оценка энтропии случайной величины X, распределенной по нормальному закону с параметрами (0,1), имеет в свою очередь нормальное распределение. Данное утверждение можно отнести к исходному нормальному распределению с любыми параметрами X и S, так как смещение центра распределения не меняет значение выборочной оценки энтропии, а произвольное изменение значения среднего квадратического отклонения S при изменении значения величины интервала группирования выборки (т. е. изменении систем отсчета) и том же количестве интервалов разбиения также не влияет на значение выборочной энтропии.  [c.22]

Рассмотрим случай нормально распределенной случайной величины. Из формул (2.5) и (2.6) вытекает, что оценка S(x) среднего квадратического отклонения ст(х) может быть получена так  [c.41]

Этот метод можно использовать для определения вероятности того, что случайная величина, например цена актива, примет значение выше или ниже определенной величины. Предположим, например, мы знаем, что ежедневная доходность некой ценной бумаги нормально распределена с математическим ожиданием, равным 0,5%, и средним квадратическим отклонением 0,1%, и мы хотим узнать вероятность того, что ежедневная доходность будет больше 0,525%. Сначала мы найдем значение нормированной величины Z -  [c.197]

Следовательно, по сути мы имеем переменную S, которая изменяется случайным образом на величину AS, которая зависит от другой случайной переменной Е ТдТ (эффект случайного получения новой информации на рынке), имеющей среднюю, равную нулю, дисперсию Аг и среднее квадратическое отклонение л/д .  [c.464]

Средняя арифметическая х.-а определяет центр распределения и ее размерность та же, что и размерность случайной величины X. Среднее квадратическое отклонение а определяет разброс центра распределения и размерность о совпадает с размерностью случайной величины X. На рис. 3.8 показано, как разница в значениях  [c.138]

Здесь X (г,) — нормальная случайная величина с математическим ожиданием E(rt) и средним квадратическим отклонением а, at — некоторый параметр. При / = 3 вероятность попадания случайной величины X(rf) в интервал (4.66) практически равна единице.  [c.268]

Эта случайная величина, как и случайная величина X, распределена нормально, причем при справедливости нулевой гипотезы математическое ожидание этой случайной величины ( )—0, а среднее квадратическое отклонение а(и) = 1. Следовательно, для нахождения критической точки мы можем использовать таблицу функции нормированного нормального распределения Ф( «).  [c.28]

Выборочная медиана как оценка математического ожидания нормальной случайной величины при больших объемах выборки распределена нормально с математическим ожиданием, равным математическому ожиданию ц контролируемой величины X, и средним квадратическим отклонением аУя/2/г. При небольших объемах выборки (праспределение выборочной медианы отличается от нормального, но математическое ожидание остается равным (х. Учитывая требуемую для практики точность, распределение медианы можно приближенно принять нормальным с параметрами ц. аУя/2л. Поэтому границы регулирования и объемы выборок для контрольных карт медиан рассчитывают так же, как для контрольных карт средних арифметических значений с заменой  [c.30]

Правила построения простой контрольной карты средних квадратических отклонений. По выборочному среднему квадра-тическому отклонению S при заданном уровне значимости а требуется проверить гипотезу Я0 а=0о о равенстве генерального среднего квадратического отклонения 0 заданному значению GQ при альтернативной гипотезе Hi а=а в предположении, что случайная величина X распределена нормально.  [c.31]

Показатели однородности представляют собой количественную характеристику рассеивания параметров или показателей качества продукции данного вида. Эти показатели характеризуют стабильность значений основных параметров. Поскольку эти параметры являются измеряемыми, очевидно влияние погрешности измерений на получаемые результаты. Например, для большинства практических случаев оценки качества нестабильность значений случайных величин, характеризующих параметры качества, оценивается средним квадратическим. отклонением. Поскольку случайная составляющая погрешности также характеризуется средним квадратическим отклонением, происходит их объединение и полученные результаты оценки качества будут искажены.  [c.61]

Размерность дисперсии и ее выборочной оценки соответствует квадрату размерности случайной величины, дисперсию которой мы определяем. Поэтому для удобства практических расчетов в качестве характеристики рассеяния погрешности принимают ее среднее квадратическое отклонение а [Д], равное положительному значению квадратного корня из дисперсии, т. е.  [c.62]

Оценку среднего квадратического отклонения величины z или точечную характеристику случайной погрешности определения вычисляют по формуле  [c.88]

Большинство величин в производственных процессах и отношениях случайно, т.е. их значение невозможно предсказать абсолютно точно, но подчинено определенным законам. В связи с этим приходится иметь дело с понятиями случайной величины и ее законом распределения вероятностей, основными числовыми характеристиками распределения (математическое ожидание или среднее значение случайной величины, дисперсия случайной величины или среднее квадратическое отклонение, коэффициент вариации).  [c.249]

Метод статистических испытаний позволяет воспроизвести любой процесс, на протекание которого влияют случайные факторы, при помощи моделирования случайных величин. Чтобы получить случайную величину, необходимо знать закон ее распределения. При наличии числовых характеристик случайной величины определить закон распределения можно по коэффициенту вариации (отношению среднего квадратического отклонения к среднему значению). В первом приближении выбор закона распределения может быть произведен по табл. 6.3.  [c.130]

Для расчета среднего квадратического отклонения функции случайной величины  [c.295]

Как правило, доходность бумаг колеблется во времени, так что будем считать ее случайной величиной. Пусть е а, — средняя ожидаемая доходность и среднее квадратическое отклонение (СКО) этой случайной доходности, т.е. е,- = М[Е,] — математичес  [c.420]

Моделирование случайных величин, распределенных с известными параметрами, по расчетным формулам табл. 6.4 производится с генерированием равномерно распределенных случайных чисел в интервале (0 1) или нормально распределенных случайных чисел , с параметрами среднее — 0, среднее квадратическое отклонение — 1. Если объем моделируемых величин невелик, то для получения случайных чисел и можно воспользоваться специальными таблицами. Получить и Ц можно также с помощью входящей в современное программное обеспечение стандартной процедуры формирования случайных чисел. В частности, производя расчеты в электронных таблицах MS Ex el, необходимо подключить надстройку Пакет анализа , после чего в падающем окне меню Сервис появится команда Анализ данных . В одноименном диалоговом окне необходимо выбрать такой инструмент анализа, как Генерация случайных чисел .  [c.132]

Среднее квадратическое отклонение в Excel — Показатели вариации. Дисперсия простая и взвешенная

Основная цель работы — научиться вычислять характеристики центра распределения и вариативности.

Среднее арифметическое, мода и медиана

Для вычислений будем использовать 20 наблюдений курсов доллара и евро за 2007 год.

На первом шаге вычисляются среднеарифметические значения курсов валют. Для этого устанавливаем курсор на свободную ячейку столбца В и инициируем команду суммирование. Далее растягиваем формулу вправо. Полученный результат делится на число наблюдений (20). Получаем средние значения для курса доллара и евро. Они выделены на рисунке желтым цветом.

Ниже представлены вычисленные по специальным формулам среднее значение, моду и медиану. Заметим, что среднее значение, вычисленное по заложенной в Excel формулы совпало со значением, рассчитанным первым способом.

Мода — это наиболее часто встречающийся вариант ряда.

Мода вычислена по формуле =МОДА(B3:B22), где B3:B22 — ряд данных.

Медиана — это значение признака, которое лежит в основе ранжированного ряда и делит этот ряд на две равные по численности части.

Медиана вычислена по формуле =МЕДИАНА(B3:B22), где B3:B22 — ряд данных.

Дисперсия и среднеквадратичное отклонение

Дисперсия в статистике — это мера разброса данной случайной величины, то есть её отклонения от математического ожидания. Она в статистике находится как среднее квадратическое отклонение индивидуальных значений признака в квадрате от средней арифметической.

Среднее квардратическое отклонение равно корню из дисперсии.

Вычисления представлены на рисунке ниже.

Формула для дисперсии в данном случае =ДИСП(Лист1!B3:B22) Среднее квадратическое отклонение вычислили следующим образом: =КОРЕНЬ(B24), где B24 — ячейка со значением дисперсии.

Как рассчитать среднее квадратическое отклонение в excel. Как работает стандартное отклонение в Excel

В данной статье я расскажу о том, как найти среднеквадратическое отклонение . Этот материал крайне важен для полноценного понимания математики, поэтому репетитор по математике должен посвятить его изучению отдельный урок или даже несколько. В этой статье вы найдёте ссылку на подробный и понятный видеоурок, в котором рассказано о том, что такое среднеквадратическое отклонение и как его найти.

Среднеквадратическое отклонение дает возможность оценить разброс значений, полученных в результате измерения какого-то параметра. Обозначается символом (греческая буква «сигма»).

Формула для расчета довольно проста. Чтобы найти среднеквадратическое отклонение, нужно взять квадратный корень из дисперсии. Так что теперь вы должны спросить: “А что же такое дисперсия?”

Что такое дисперсия

Определение дисперсии звучит так. Дисперсия — это среднее арифметическое от квадратов отклонений значений от среднего.

Чтобы найти дисперсию последовательно проведите следующие вычисления:

  • Определите среднее (простое среднее арифметическое ряда значений).
  • Затем от каждого из значений отнимите среднее и возведите полученную разность в квадрат (получили квадрат разности ).
  • Следующим шагом будет вычисление среднего арифметического полученных квадратов разностей (Почему именно квадратов вы сможете узнать ниже).

Рассмотрим на примере. Допустим, вы с друзьями решили измерить рост ваших собак (в миллиметрах). В результате измерений вы получили следующие данные измерений роста (в холке): 600 мм, 470 мм, 170 мм, 430 мм и 300 мм.

Вычислим среднее значение, дисперсию и среднеквадратическое отклонение.

Сперва найдём среднее значение . Как вы уже знаете, для этого нужно сложить все измеренные значения и поделить на количество измерений. Ход вычислений:

Среднее мм.

Итак, среднее (среднеарифметическое) составляет 394 мм.

Теперь нужно определить отклонение роста каждой из собак от среднего :

Наконец, чтобы вычислить дисперсию , каждую из полученных разностей возводим в квадрат, а затем находим среднее арифметическое от полученных результатов:

Дисперсия мм 2 .

Таким образом, дисперсия составляет 21704 мм 2 .

Как найти среднеквадратическое отклонение

Так как же теперь вычислить среднеквадратическое отклонение, зная дисперсию? Как мы помним, взять из нее квадратный корень. То есть среднеквадратическое отклонение равно:

Мм (округлено до ближайшего целого значения в мм).

Применив данный метод, мы выяснили, что некоторые собаки (например, ротвейлеры) – очень большие собаки. Но есть и очень маленькие собаки (например, таксы, только говорить им этого не стоит).

Самое интересное, что среднеквадратическое отклонение несет в себе полезную информацию. Теперь мы можем показать, какие из полученных результатов измерения роста находятся в пределах интервала, который мы получим, если отложим от среднего (в обе стороны от него) среднеквадратическое отклонение.

То есть с помощью среднеквадратического отклонения мы получаем “стандартный” метод, который позволяет узнать, какое из значений является нормальным (среднестатистическим), а какое экстраординарно большим или, наоборот, малым.

Что такое стандартное отклонение

Но… все будет немного иначе, если мы будем анализировать выборку данных. В нашем примере мы рассматривали генеральную совокупность. То есть наши 5 собак были единственными в мире собаками, которые нас интересовали.

Но если данные являются выборкой (значениями, которые выбрали из большой генеральной совокупности), тогда вычисления нужно вести иначе.

Если есть значений, то:

Все остальные расчеты производятся аналогично, в том числе и определение среднего.

Например, если наших пять собак – только выборка из генеральной совокупности собак (всех собак на планете), мы должны делить на 4, а не на 5, а именно:

Дисперсия выборки = мм 2 .

При этом стандартное отклонение по выборке равно мм (округлено до ближайшего целого значения).

Можно сказать, что мы произвели некоторую “коррекцию” в случае, когда наши значения являются всего лишь небольшой выборкой.

Примечание. Почему именно квадраты разностей?

Но почему при вычислении дисперсии мы берём именно квадраты разностей? Допустим при измерении какого-то параметра, вы получили следующий набор значений: 4; 4; -4; -4. Если мы просто сложим абсолютные отклонения от среднего (разности) между собой … отрицательные значения взаимно уничтожатся с положительными:

.

Получается, этот вариант бесполезен. Тогда, может, стоит попробовать абсолютные значения отклонений (то есть модули этих значений)?

На первый взгляд получается неплохо (полученная величина, кстати, называется средним абсолютным отклонением), но не во всех случаях. Попробуем другой пример. Пусть в результате измерения получился следующий набор значений: 7; 1; -6; -2. Тогда среднее абсолютное отклонение равно:

Вот это да! Снова получили результат 4, хотя разности имеют гораздо больший разброс.

А теперь посмотрим, что получится, если возвести разности в квадрат (и взять потом квадратный корень из их суммы).

Для первого примера получится:

.

Для второго примера получится:

Теперь – совсем другое дело! Среднеквадратическое отклонение получается тем большим, чем больший разброс имеют разности … к чему мы и стремились.

Фактически в данном методе использована та же идея, что и при вычислении расстояния между точками, только примененная иным способом.

И с математической точки зрения использование квадратов и квадратных корней дает больше пользы, чем мы могли бы получить на основании абсолютных значений отклонений, благодаря чему среднеквадратическое отклонение применимо и для других математических задач.

О том, как найти среднеквадратическое отклонение, вам рассказал , Сергей Валерьевич

Коэффициент вариации – это сравнение рассеивания двух случайно взятых величин. Величины имеют единицы измерения, что приводит к получению сопоставимого результата. Этот коэффициент нужен для подготовки статистического анализа.

С помощью него инвесторы могут рассчитать показатели риска перед тем, как сделать вклады в выбранные активы. Он полезен, когда у выбранных активов различная доходность и степень риска. К примеру, у одного актива может быть высокий доход и степень риска тоже высокая, а у другого, наоборот, малый доход и степень риска соответственно меньшая.

Расчет стандартного отклонения

Стандартное отклонение является статистической величиной. С помощью расчета этой величины пользователь получит информацию о том, насколько отклоняются данные в ту или иную сторону относительно среднего значения. Стандартное отклонение в Excel рассчитывается в несколько шагов.

Подготавливаете данные : открываете страницу, где будут происходить расчеты. В нашем случае это картинка, но может быть любой другой файл. Главное собрать ту информацию, которую будете использовать в таблице для рассчета.

Вводите данные в любой табличный редактор (в нашем случае Excel), заполняя ячейки слева направо. Начинать следует с колонки «А». Заголовки вводите в строке сверху, а названия в тех же столбцах, которые относятся к заголовкам, только ниже. Затем дату и данные, которые подлежат расчету, справа от даты.

Этот документ сохраняете.

Теперь переходим к самому вычислению. Выделяете курсором ячейку после последнего введенного значения снизу.

Вписываете знак «=» и прописываете далее формулу. Знак равенства обязателен. Иначе программа не посчитает предложенные данные. Формула вводится без пробелов.

Утилита выдаст названия нескольких формул. Выбираете «СТАНДОТКЛОН ». Это формула вычисления стандартного отклонения. Существует два вида расчета:

  • с вычислением по выборке;
  • с вычислением по генеральной совокупности.

Выбрав одну из них, указываете диапазон данных. Вся введенная формула будет выглядеть так: «=СТАНДОТКЛОН (В2: В5)».

Затем кликаете по кнопке «Enter ». Полученные данные появятся в отмеченном пункте.

Расчет среднего арифметического

Вычисляется, когда пользователю необходимо создать отчет, например, по заработной плате в его компании. Делается это следующим образом:


  • останется только выделить диапазон и кликнуть по кнопке «Ввод». А в ячейке теперь отобразится результат из взятых данных выше.

Расчет коэффициента вариации

Формула расчета коэффициента вариации:

V= S/X, где S – это стандартное отклонение, а X – среднее значение.

Для того, чтобы посчитать коэффициент вариации в Excel, необходимо найти стандартное отклонение и среднее арифметическое. То есть проделав первые два расчета, которые были показаны выше, можно перейти к работе над коэффициентом вариации.

Для этого открываете Excel, заполняем два поля, куда следует вписать полученные числа стандартного отклонения и среднего значения.

Теперь выделяете ячейку, которую отвели под число для вычисления вариации. Открываете вкладку «Главная », если она не открыта. Кликаете по инструменту «Число ». Выбираете процентный формат.

Переходите к отмеченной ячейке и кликаете по ней дважды. Затем вводите знак равенства и выделяете пункт, куда вписан итог стандартного отклонения. Затем кликаете на клавиатуре по кнопке «слэш» или «разделить» (выглядит так: «/»). Выделяете пункт , куда вписано среднее арифметическое, и кликаете по кнопке «Enter». Должно получиться так:

А вот и результат после нажатия «Enter»:

Также для расчета коэффициента вариации можно использовать онлайн калькуляторы, например planetcalc.ru и allcalc.ru . Достаточно внести необходимые цифры и запустить расчет, после чего получить необходимые сведения.

Среднеквадратическое отклонение

Среднеквадратичное отклонение в Excel решается с помощью двух формул:

Простыми словами, извлекается корень из дисперсии. Как вычислить дисперсию рассмотрено ниже.

Среднее квадратичное отклонение является синонимом стандартного и вычисляется точное также. Выделяется ячейка для результата под числами, которые нужно рассчитать. Вставляется одна из функций, указанных на рисунке выше. Кликается кнопка «Enter ». Результат получен.

Коэффициент осциляции

Соотношением размаха вариации к среднему – называется коэффициентом осциляции. Готовых формул в Экселе нет, поэтому нужно компоновать несколько функций в одну.

Функциями, которые необходимо скомпоновать, являются формулы среднего значения, максимума и минимума. Этот коэффициент используют для сравнения набора данных.

Дисперсия

Дисперсия – это функция, с помощью которой характеризуют разброс данных вокруг математического ожидания. Вычисляется по следующему уравнению:

Переменные принимают такие значения:

В Excel есть две функции, которые определяют дисперсию:


Чтобы произвести расчет, под числами, которые необходимо посчитать, выделяется ячейка. Заходите во вкладку вставки функции. Выбираете категорию «Статистические ». В выпавшем списке выбираете одну из функций и кликаете по кнопке «Enter».

Максимум и минимум

Максимум и минимум нужны для того, чтобы не искать вручную среди большого количества чисел минимальное или максимальное число.

Чтобы вычислить максимум, выделяете весь диапазон необходимых чисел в таблице и отдельную ячейку, затем кликаете по значку «Σ» или «Автосумма ». В выпавшем окне выбираете «Максимум» и, нажав кнопку «Enter» получаете нужное значение.

Тоже самое делаете, чтобы получить минимум. Только выбираете функцию «Минимум».

Для того чтобы найти среднее значение в Excel (при том неважно числовое, текстовое, процентное или другое значение) существует много функций. И каждая из них обладает своими особенностями и преимуществами. Ведь в данной задаче могут быть поставлены определенные условия.

Например, средние значения ряда чисел в Excel считают с помощью статистических функций. Можно также вручную ввести собственную формулу. Рассмотрим различные варианты.

Как найти среднее арифметическое чисел?

Чтобы найти среднее арифметическое, необходимо сложить все числа в наборе и разделить сумму на количество. Например, оценки школьника по информатике: 3, 4, 3, 5, 5. Что выходит за четверть: 4. Мы нашли среднее арифметическое по формуле: =(3+4+3+5+5)/5.

Как это быстро сделать с помощью функций Excel? Возьмем для примера ряд случайных чисел в строке:

Или: сделаем активной ячейку и просто вручную впишем формулу: =СРЗНАЧ(A1:A8).

Теперь посмотрим, что еще умеет функция СРЗНАЧ.


Найдем среднее арифметическое двух первых и трех последних чисел. Формула: =СРЗНАЧ(A1:B1;F1:h2). Результат:



Среднее значение по условию

Условием для нахождения среднего арифметического может быть числовой критерий или текстовый. Будем использовать функцию: =СРЗНАЧЕСЛИ().

Найти среднее арифметическое чисел, которые больше или равны 10.

Функция: =СРЗНАЧЕСЛИ(A1:A8;»>=10″)


Результат использования функции СРЗНАЧЕСЛИ по условию «>=10»:

Третий аргумент – «Диапазон усреднения» — опущен. Во-первых, он не обязателен. Во-вторых, анализируемый программой диапазон содержит ТОЛЬКО числовые значения. В ячейках, указанных в первом аргументе, и будет производиться поиск по прописанному во втором аргументе условию.

Внимание! Критерий поиска можно указать в ячейке. А в формуле сделать на нее ссылку.

Найдем среднее значение чисел по текстовому критерию. Например, средние продажи товара «столы».

Функция будет выглядеть так: =СРЗНАЧЕСЛИ($A$2:$A$12;A7;$B$2:$B$12). Диапазон – столбец с наименованиями товаров. Критерий поиска – ссылка на ячейку со словом «столы» (можно вместо ссылки A7 вставить само слово «столы»). Диапазон усреднения – те ячейки, из которых будут браться данные для расчета среднего значения.

В результате вычисления функции получаем следующее значение:

Внимание! Для текстового критерия (условия) диапазон усреднения указывать обязательно.

Как посчитать средневзвешенную цену в Excel?

Как мы узнали средневзвешенную цену?

Формула: =СУММПРОИЗВ(C2:C12;B2:B12)/СУММ(C2:C12).


С помощью формулы СУММПРОИЗВ мы узнаем общую выручку после реализации всего количества товара. А функция СУММ — сумирует количесвто товара. Поделив общую выручку от реализации товара на общее количество единиц товара, мы нашли средневзвешенную цену. Этот показатель учитывает «вес» каждой цены. Ее долю в общей массе значений.

Среднее квадратическое отклонение: формула в Excel

Различают среднеквадратическое отклонение по генеральной совокупности и по выборке. В первом случае это корень из генеральной дисперсии. Во втором – из выборочной дисперсии.

Для расчета этого статистического показателя составляется формула дисперсии. Из нее извлекается корень. Но в Excel существует готовая функция для нахождения среднеквадратического отклонения.


Среднеквадратическое отклонение имеет привязку к масштабу исходных данных. Для образного представления о вариации анализируемого диапазона этого недостаточно. Чтобы получить относительный уровень разброса данных, рассчитывается коэффициент вариации:

среднеквадратическое отклонение / среднее арифметическое значение

Формула в Excel выглядит следующим образом:

СТАНДОТКЛОНП (диапазон значений) / СРЗНАЧ (диапазон значений).

Коэффициент вариации считается в процентах. Поэтому в ячейке устанавливаем процентный формат.

Необходимо вмешательство менеджмента для выявления причин отклонений.

Для построения контрольной карты я использую исходные данные, среднее значение (μ) и стандартное отклонение (σ). В Excel: μ = СРЗНАЧ($F$3:$F$15), σ = СТАНДОТКЛОН($F$3:$F$15)

Сама контрольная карта включает: исходные данные, среднее значение (μ), нижнюю контрольную границу (μ – 2σ) и верхнюю контрольную границу (μ + 2σ):

Скачать заметку в формате , примеры в формате

Посмотрев на представленную карту, я заметил, что исходные данные демонстрируют вполне различимую линейную тенденцию к снижению доли накладных расходов:

Чтобы добавить линию тренду выделите на графике ряд с данными (в нашем примере – зеленые точки), кликните правой кнопкой мыши и выберите опцию «Добавить линию тренда». В открывшемся окне «Формат линии тренда», поэкспериментируйте с опциями. Я остановился на линейном тренде.

Если исходные данные не разбросаны в соответствии с вокруг среднего значения, то описывать их параметрами μ и σ не вполне корректно. Для описания вместо среднего значения лучше подойдет прямая линейного тренда и контрольные границы, равноудаленные от этой линии тренда.

Линию тренда Excel позволяет построить с помощью функции ПРЕДСКАЗ. Нам потребуется дополнительный ряд А3:А15, чтобы известные значения Х были непрерывным рядом (номера кварталов такой непрерывный ряд не образуют). Вместо среднего значения в столбце Н вводим функцию ПРЕДСКАЗ:

Стандартное отклонение σ (функция СТАНДОТКЛОН в Excel) вычисляется по формуле:

К сожалению, я не нашел в Excel функции для такого определения стандартного отклонения (по отношению к тренду). Задачу можно решить с помощью формулы массива. Кто не знаком с формулами массива, предлагаю сначала почитать .

Формула массива может возвращать одно значение или массив. В нашем случае формула массива вернет одно значение:

Давайте подробнее изучим, как работает формула массива в ячейке G3

СУММ(($F$3:$F$15-$H$3:$H$15)^2) определяет сумму квадратов разностей; фактически формула считает следующую сумму = (F3 – h4) 2 + (F4 – h5) 2 + … + (F15 – h25) 2

СЧЁТЗ($F$3:$F$15) – число значений в диапазоне F3:F15

КОРЕНЬ(СУММ(($F$3:$F$15-$H$3:$H$15)^2)/(СЧЁТЗ($F$3:$F$15)-1)) = σ

Значение 6,2% есть точка нижней контрольной границы = 8,3% – 2 σ

Фигурные кавычки с обеих сторон формулы означают, что это формула массива.2)/(СЧЁТЗ($F$3:$F$15)-1))

необходимо нажать не Enter, а Ctrl + Shift + Enter. Не пытайтесь ввести фигурные скобки с клавиатуры – формула массива не заработает. Если требуется отредактировать формулу массива, сделайте это так же, как и с обычной формулой, но опять же по окончании редактирования нажмите не Enter, а Ctrl + Shift + Enter.

Формулу массива, возвращающую одно значение, можно «протаскивать», как и обычную формулу.

В результате получили контрольную карту, построенную для данных, имеющих тенденцию к понижению

P.S. После того, как заметка была написана, я смог усовершенствовать формулы, используемые для вычисления стандартного отклонения для данных с тенденцией. Ознакомиться с ними вы можете в Excel-файле

Дисперсия — это мера рассеяния, описывающая сравнительное отклонение между значениями данных и средней величиной. Является наиболее используемой мерой рассеяния в статистике, вычисляемая путем суммирования, возведенного в квадрат, отклонения каждого значения данных от средней величины. Формула для вычисления дисперсии представлена ниже:

s 2 – дисперсия выборки;

x ср — среднее значение выборки;

n размер выборки (количество значений данных),

(x i – x ср) — отклонение от средней величины для каждого значения набора данных.

Для лучшего понимания формулы, разберем пример. Я не очень люблю готовку, поэтому занятием этим занимаюсь крайне редко. Тем не менее, чтобы не умереть с голоду, время от времени мне приходится подходить к плите для реализации замысла по насыщению моего организма белками, жирами и углеводами. Набор данных, редставленный ниже, показывает, сколько раз Ренат готовит пищу каждый месяц:

Первым шагом при вычислении дисперсии является определение среднего значения выборки, которое в нашем примере равняется 7,8 раза в месяц. Остальные вычисления можно облегчить с помощью следующей таблицы.

Финальная фаза вычисления дисперсии выглядит так:

Для тех, кто любит производить все вычисления за один раз, уравнение будет выглядеть следующим образом:

Использование метода «сырого счета» (пример с готовкой)

Существует более эффективный способ вычисления дисперсии, известный как метод «сырого счета». Хотя с первого взгляда уравнение может показаться весьма громоздким, на самом деле оно не такое уж страшное. Можете в этом удостовериться, а потом и решите, какой метод вам больше нравится.

— сумма каждого значения данных после возведения в квадрат,

— квадрат суммы всех значений данных.

Не теряйте рассудок прямо сейчас. Позвольте представить все это в виде таблицы, и тогда вы увидите, что вычислений здесь меньше, чем в предыдущем примере.

Как видите, результат получился тот же, что и при использовании предыдущего метода. Достоинства данного метода становятся очевидными по мере роста размера выборки (n).

Расчет дисперсии в Excel

Как вы уже, наверное, догадались, в Excel присутствует формула, позволяющая рассчитать дисперсию. Причем, начиная с Excel 2010 можно найти 4 разновидности формулы дисперсии:

1) ДИСП.В – Возвращает дисперсию по выборке. Логические значения и текст игнорируются.

2) ДИСП.Г — Возвращает дисперсию по генеральной совокупности. Логические значения и текст игнорируются.

3) ДИСПА — Возвращает дисперсию по выборке с учетом логических и текстовых значений.

4) ДИСПРА — Возвращает дисперсию по генеральной совокупности с учетом логических и текстовых значений.

Для начала разберемся в разнице между выборкой и генеральной совокупностью. Назначение описательной статистики состоит в том, чтобы суммировать или отображать данные так, чтобы оперативно получать общую картину, так сказать, обзор. Статистический вывод позволяет делать умозаключения о какой-либо совокупности на основе выборки данных из этой совокупности. Совокупность представляет собой все возможные исходы или измерения, представляющие для нас интерес. Выборка — это подмножество совокупности.

Например, нас интересует совокупность группы студентов одного из Российских ВУЗов и нам необходимо определить средний бал группы. Мы можем посчитать среднюю успеваемость студентов, и тогда полученная цифра будет параметром, поскольку в наших расчетах будет задействована целая совокупность. Однако, если мы хотим рассчитать средний бал всех студентов нашей страны, тогда эта группа будет нашей выборкой.

Разница в формуле расчета дисперсии между выборкой и совокупностью заключается в знаменателе. Где для выборки он будет равняться (n-1), а для генеральной совокупности только n.

Теперь разберемся с функциями расчета дисперсии с окончаниями А, в описании которых сказано, что при расчете учитываются текстовые и логические значения. В данном случае при расчете дисперсии определенного массива данных, где встречаются не числовые значения, Excel будет интерпретировать текстовые и ложные логические значения как равными 0, а истинные логические значения как равными 1.

Итак, если у вас есть массив данных, рассчитать его дисперсию ни составит никакого труда, воспользовавшись одной из перечисленных выше функций Excel.

формула в Excel. Пример использования функции стандотклона в excel

Для того чтобы найти среднее значение в Excel (при том неважно числовое, текстовое, процентное или другое значение) существует много функций. И каждая из них обладает своими особенностями и преимуществами. Ведь в данной задаче могут быть поставлены определенные условия.

Например, средние значения ряда чисел в Excel считают с помощью статистических функций. Можно также вручную ввести собственную формулу. Рассмотрим различные варианты.

Как найти среднее арифметическое чисел?

Чтобы найти среднее арифметическое, необходимо сложить все числа в наборе и разделить сумму на количество. Например, оценки школьника по информатике: 3, 4, 3, 5, 5. Что выходит за четверть: 4. Мы нашли среднее арифметическое по формуле: =(3+4+3+5+5)/5.

Как это быстро сделать с помощью функций Excel? Возьмем для примера ряд случайных чисел в строке:

Или: сделаем активной ячейку и просто вручную впишем формулу: =СРЗНАЧ(A1:A8).

Теперь посмотрим, что еще умеет функция СРЗНАЧ.


Найдем среднее арифметическое двух первых и трех последних чисел. Формула: =СРЗНАЧ(A1:B1;F1:h2). Результат:



Среднее значение по условию

Условием для нахождения среднего арифметического может быть числовой критерий или текстовый. Будем использовать функцию: =СРЗНАЧЕСЛИ().

Найти среднее арифметическое чисел, которые больше или равны 10.

Функция: =СРЗНАЧЕСЛИ(A1:A8;»>=10″)


Результат использования функции СРЗНАЧЕСЛИ по условию «>=10»:

Третий аргумент – «Диапазон усреднения» — опущен. Во-первых, он не обязателен. Во-вторых, анализируемый программой диапазон содержит ТОЛЬКО числовые значения. В ячейках, указанных в первом аргументе, и будет производиться поиск по прописанному во втором аргументе условию.

Внимание! Критерий поиска можно указать в ячейке. А в формуле сделать на нее ссылку.

Найдем среднее значение чисел по текстовому критерию. Например, средние продажи товара «столы».

Функция будет выглядеть так: =СРЗНАЧЕСЛИ($A$2:$A$12;A7;$B$2:$B$12). Диапазон – столбец с наименованиями товаров. Критерий поиска – ссылка на ячейку со словом «столы» (можно вместо ссылки A7 вставить само слово «столы»). Диапазон усреднения – те ячейки, из которых будут браться данные для расчета среднего значения.

В результате вычисления функции получаем следующее значение:

Внимание! Для текстового критерия (условия) диапазон усреднения указывать обязательно.

Как посчитать средневзвешенную цену в Excel?

Как мы узнали средневзвешенную цену?

Формула: =СУММПРОИЗВ(C2:C12;B2:B12)/СУММ(C2:C12).


С помощью формулы СУММПРОИЗВ мы узнаем общую выручку после реализации всего количества товара. А функция СУММ — сумирует количесвто товара. Поделив общую выручку от реализации товара на общее количество единиц товара, мы нашли средневзвешенную цену. Этот показатель учитывает «вес» каждой цены. Ее долю в общей массе значений.

Среднее квадратическое отклонение: формула в Excel

Различают среднеквадратическое отклонение по генеральной совокупности и по выборке. В первом случае это корень из генеральной дисперсии. Во втором – из выборочной дисперсии.

Для расчета этого статистического показателя составляется формула дисперсии. Из нее извлекается корень. Но в Excel существует готовая функция для нахождения среднеквадратического отклонения.


Среднеквадратическое отклонение имеет привязку к масштабу исходных данных. Для образного представления о вариации анализируемого диапазона этого недостаточно. Чтобы получить относительный уровень разброса данных, рассчитывается коэффициент вариации:

среднеквадратическое отклонение / среднее арифметическое значение

Формула в Excel выглядит следующим образом:

СТАНДОТКЛОНП (диапазон значений) / СРЗНАЧ (диапазон значений).

Коэффициент вариации считается в процентах. Поэтому в ячейке устанавливаем процентный формат.

Проведение любого статистического анализа немыслимо без расчетов. В это статье рассмотрим, как рассчитать дисперсию, среднеквадратичное отклонение, коэффиент вариации и другие статистические показатели в Excel.

Максимальное и минимальное значение

Среднее линейное отклонение

Среднее линейное отклонение представляет собой среднее из абсолютных (по модулю) отклонений от в анализируемой совокупности данных. Математическая формула имеет вид:

a – среднее линейное отклонение,

X – анализируемый показатель,

– среднее значение показателя,

n

В Эксель эта функция называется СРОТКЛ .

После выбора функции СРОТКЛ указываем диапазон данных, по которому должен произойти расчет. Нажимаем «ОК».

Дисперсия

{module 111}

Возможно, не все знают, что такое , поэтому поясню, — это мера, характеризующая разброс данных вокруг математического ожидания. Однако в распоряжении обычно есть только выборка, поэтому используют следующую формулу дисперсии:

s 2 – выборочная дисперсия, рассчитанная по данным наблюдений,

X – отдельные значения,

– среднее арифметическое по выборке,

n – количество значений в анализируемой совокупности данных.

Соответствующая функция Excel — ДИСП.Г . При анализе относительно небольших выборок (примерно до 30-ти наблюдений) следует использовать , которая рассчитывается по следующей формуле.

Отличие, как видно, только в знаменателе. В Excel для расчета выборочной несмещенной дисперсии есть функция ДИСП.В .

Выбираем нужный вариант (генеральную или выборочную), указываем диапазон, жмем кнопку «ОК». Полученное значение может оказаться очень большим из-за предварительного возведения отклонений в квадрат. Дисперсия в статистике очень важный показатель, но ее обычно используют не в чистом виде, а для дальнейших расчетов.

Среднеквадратичное отклонение

Среднеквадратичное отклонение (СКО) – это корень из дисперсии. Этот показатель также называют стандартным отклонением и рассчитывают по формуле:

по генеральной совокупности

по выборке

Можно просто извлечь корень из дисперсии, но в Excel для среднеквадратичного отклонения есть готовые функции: СТАНДОТКЛОН.Г и СТАНДОТКЛОН.В (по генеральной и выборочной совокупности соответственно).

Стандартное и среднеквадратичное отклонение, повторюсь, — синонимы.

Далее, как обычно, указываем нужный диапазон и нажимаем на «ОК». Среднеквадратическое отклонение имеет те же единицы измерения, что и анализируемый показатель, поэтому является сопоставимым с исходными данными. Об этом ниже.

Коэффициент вариации

Все показатели, рассмотренные выше, имеют привязку к масштабу исходных данных и не позволяют получить образное представление о вариации анализируемой совокупности. Для получения относительной меры разброса данных используют коэффициент вариации , который рассчитывается путем деления среднеквадратичного отклонения на среднее арифметическое . Формула коэффициента вариации проста:

Для расчета коэффициента вариации в Excel нет готовой функции, что не есть большая проблема. Расчет можно произвести простым делением стандартного отклонения на среднее значение. Для этого в строке формул пишем:

СТАНДОТКЛОН.Г()/СРЗНАЧ()

В скобках указывается диапазон данных. При необходимости используют среднее квадратичное отклонение по выборке (СТАНДОТКЛОН.В).

Коэффициент вариации обычно выражается в процентах, поэтому ячейку с формулой можно обрамить процентным форматом. Нужная кнопка находится на ленте на вкладке «Главная»:

Изменить формат также можно, выбрав из контекстного меню после выделения нужной ячейки и нажатия правой кнопкой мышки.

Коэффициент вариации, в отличие от других показателей разброса значений, используется как самостоятельный и весьма информативный индикатор вариации данных. В статистике принято считать, что если коэффициент вариации менее 33%, то совокупность данных является однородной, если более 33%, то – неоднородной. Эта информация может быть полезна для предварительного описания данных и определения возможностей проведения дальнейшего анализа. Кроме того, коэффициент вариации, измеряемый в процентах, позволяет сравнивать степень разброса различных данных независимо от их масштаба и единиц измерений. Полезное свойство.

Коэффициент осцилляции

Еще один показатель разброса данных на сегодня — коэффициент осцилляции. Это соотношение размаха вариации (разницы между максимальным и минимальным значением) к средней. Готовой формулы Excel нет, поэтому придется скомпоновать три функции: МАКС, МИН, СРЗНАЧ.

Коэффициент осцилляции показывает степень размаха вариации относительно средней, что также можно использовать для сравнения различных наборов данных.

В целом, с помощью Excel многие статистические показатели рассчитываются очень просто. Если что-то непонятно, всегда можно воспользоваться окошком для поиска во вставке функций. Ну, и Гугл в помощь.

А сейчас предлагаю посмотреть видеоурок.

Дисперсия — это мера рассеяния, описывающая сравнительное отклонение между значениями данных и средней величиной. Является наиболее используемой мерой рассеяния в статистике, вычисляемая путем суммирования, возведенного в квадрат, отклонения каждого значения данных от средней величины. Формула для вычисления дисперсии представлена ниже:

s 2 – дисперсия выборки;

x ср — среднее значение выборки;

n размер выборки (количество значений данных),

(x i – x ср) — отклонение от средней величины для каждого значения набора данных.

Для лучшего понимания формулы, разберем пример. Я не очень люблю готовку, поэтому занятием этим занимаюсь крайне редко. Тем не менее, чтобы не умереть с голоду, время от времени мне приходится подходить к плите для реализации замысла по насыщению моего организма белками, жирами и углеводами. Набор данных, редставленный ниже, показывает, сколько раз Ренат готовит пищу каждый месяц:

Первым шагом при вычислении дисперсии является определение среднего значения выборки, которое в нашем примере равняется 7,8 раза в месяц. Остальные вычисления можно облегчить с помощью следующей таблицы.

Финальная фаза вычисления дисперсии выглядит так:

Для тех, кто любит производить все вычисления за один раз, уравнение будет выглядеть следующим образом:

Использование метода «сырого счета» (пример с готовкой)

Существует более эффективный способ вычисления дисперсии, известный как метод «сырого счета». Хотя с первого взгляда уравнение может показаться весьма громоздким, на самом деле оно не такое уж страшное. Можете в этом удостовериться, а потом и решите, какой метод вам больше нравится.

— сумма каждого значения данных после возведения в квадрат,

— квадрат суммы всех значений данных.

Не теряйте рассудок прямо сейчас. Позвольте представить все это в виде таблицы, и тогда вы увидите, что вычислений здесь меньше, чем в предыдущем примере.

Как видите, результат получился тот же, что и при использовании предыдущего метода. Достоинства данного метода становятся очевидными по мере роста размера выборки (n).

Расчет дисперсии в Excel

Как вы уже, наверное, догадались, в Excel присутствует формула, позволяющая рассчитать дисперсию. Причем, начиная с Excel 2010 можно найти 4 разновидности формулы дисперсии:

1) ДИСП.В – Возвращает дисперсию по выборке. Логические значения и текст игнорируются.

2) ДИСП.Г — Возвращает дисперсию по генеральной совокупности. Логические значения и текст игнорируются.

3) ДИСПА — Возвращает дисперсию по выборке с учетом логических и текстовых значений.

4) ДИСПРА — Возвращает дисперсию по генеральной совокупности с учетом логических и текстовых значений.

Для начала разберемся в разнице между выборкой и генеральной совокупностью. Назначение описательной статистики состоит в том, чтобы суммировать или отображать данные так, чтобы оперативно получать общую картину, так сказать, обзор. Статистический вывод позволяет делать умозаключения о какой-либо совокупности на основе выборки данных из этой совокупности. Совокупность представляет собой все возможные исходы или измерения, представляющие для нас интерес. Выборка — это подмножество совокупности.

Например, нас интересует совокупность группы студентов одного из Российских ВУЗов и нам необходимо определить средний бал группы. Мы можем посчитать среднюю успеваемость студентов, и тогда полученная цифра будет параметром, поскольку в наших расчетах будет задействована целая совокупность. Однако, если мы хотим рассчитать средний бал всех студентов нашей страны, тогда эта группа будет нашей выборкой.

Разница в формуле расчета дисперсии между выборкой и совокупностью заключается в знаменателе. Где для выборки он будет равняться (n-1), а для генеральной совокупности только n.

Теперь разберемся с функциями расчета дисперсии с окончаниями А, в описании которых сказано, что при расчете учитываются текстовые и логические значения. В данном случае при расчете дисперсии определенного массива данных, где встречаются не числовые значения, Excel будет интерпретировать текстовые и ложные логические значения как равными 0, а истинные логические значения как равными 1.

Итак, если у вас есть массив данных, рассчитать его дисперсию ни составит никакого труда, воспользовавшись одной из перечисленных выше функций Excel.

В данной статье я расскажу о том, как найти среднеквадратическое отклонение . Этот материал крайне важен для полноценного понимания математики, поэтому репетитор по математике должен посвятить его изучению отдельный урок или даже несколько. В этой статье вы найдёте ссылку на подробный и понятный видеоурок, в котором рассказано о том, что такое среднеквадратическое отклонение и как его найти.

Среднеквадратическое отклонение дает возможность оценить разброс значений, полученных в результате измерения какого-то параметра. Обозначается символом (греческая буква «сигма»).

Формула для расчета довольно проста. Чтобы найти среднеквадратическое отклонение, нужно взять квадратный корень из дисперсии. Так что теперь вы должны спросить: “А что же такое дисперсия?”

Что такое дисперсия

Определение дисперсии звучит так. Дисперсия — это среднее арифметическое от квадратов отклонений значений от среднего.

Чтобы найти дисперсию последовательно проведите следующие вычисления:

  • Определите среднее (простое среднее арифметическое ряда значений).
  • Затем от каждого из значений отнимите среднее и возведите полученную разность в квадрат (получили квадрат разности ).
  • Следующим шагом будет вычисление среднего арифметического полученных квадратов разностей (Почему именно квадратов вы сможете узнать ниже).

Рассмотрим на примере. Допустим, вы с друзьями решили измерить рост ваших собак (в миллиметрах). В результате измерений вы получили следующие данные измерений роста (в холке): 600 мм, 470 мм, 170 мм, 430 мм и 300 мм.

Вычислим среднее значение, дисперсию и среднеквадратическое отклонение.

Сперва найдём среднее значение . Как вы уже знаете, для этого нужно сложить все измеренные значения и поделить на количество измерений. Ход вычислений:

Среднее мм.

Итак, среднее (среднеарифметическое) составляет 394 мм.

Теперь нужно определить отклонение роста каждой из собак от среднего :

Наконец, чтобы вычислить дисперсию , каждую из полученных разностей возводим в квадрат, а затем находим среднее арифметическое от полученных результатов:

Дисперсия мм 2 .

Таким образом, дисперсия составляет 21704 мм 2 .

Как найти среднеквадратическое отклонение

Так как же теперь вычислить среднеквадратическое отклонение, зная дисперсию? Как мы помним, взять из нее квадратный корень. То есть среднеквадратическое отклонение равно:

Мм (округлено до ближайшего целого значения в мм).

Применив данный метод, мы выяснили, что некоторые собаки (например, ротвейлеры) – очень большие собаки. Но есть и очень маленькие собаки (например, таксы, только говорить им этого не стоит).

Самое интересное, что среднеквадратическое отклонение несет в себе полезную информацию. Теперь мы можем показать, какие из полученных результатов измерения роста находятся в пределах интервала, который мы получим, если отложим от среднего (в обе стороны от него) среднеквадратическое отклонение.

То есть с помощью среднеквадратического отклонения мы получаем “стандартный” метод, который позволяет узнать, какое из значений является нормальным (среднестатистическим), а какое экстраординарно большим или, наоборот, малым.

Что такое стандартное отклонение

Но… все будет немного иначе, если мы будем анализировать выборку данных. В нашем примере мы рассматривали генеральную совокупность. То есть наши 5 собак были единственными в мире собаками, которые нас интересовали.

Но если данные являются выборкой (значениями, которые выбрали из большой генеральной совокупности), тогда вычисления нужно вести иначе.

Если есть значений, то:

Все остальные расчеты производятся аналогично, в том числе и определение среднего.

Например, если наших пять собак – только выборка из генеральной совокупности собак (всех собак на планете), мы должны делить на 4, а не на 5, а именно:

Дисперсия выборки = мм 2 .

При этом стандартное отклонение по выборке равно мм (округлено до ближайшего целого значения).

Можно сказать, что мы произвели некоторую “коррекцию” в случае, когда наши значения являются всего лишь небольшой выборкой.

Примечание. Почему именно квадраты разностей?

Но почему при вычислении дисперсии мы берём именно квадраты разностей? Допустим при измерении какого-то параметра, вы получили следующий набор значений: 4; 4; -4; -4. Если мы просто сложим абсолютные отклонения от среднего (разности) между собой … отрицательные значения взаимно уничтожатся с положительными:

.

Получается, этот вариант бесполезен. Тогда, может, стоит попробовать абсолютные значения отклонений (то есть модули этих значений)?

На первый взгляд получается неплохо (полученная величина, кстати, называется средним абсолютным отклонением), но не во всех случаях. Попробуем другой пример. Пусть в результате измерения получился следующий набор значений: 7; 1; -6; -2. Тогда среднее абсолютное отклонение равно:

Вот это да! Снова получили результат 4, хотя разности имеют гораздо больший разброс.

А теперь посмотрим, что получится, если возвести разности в квадрат (и взять потом квадратный корень из их суммы).

Для первого примера получится:

.

Для второго примера получится:

Теперь – совсем другое дело! Среднеквадратическое отклонение получается тем большим, чем больший разброс имеют разности … к чему мы и стремились.

Фактически в данном методе использована та же идея, что и при вычислении расстояния между точками, только примененная иным способом.

И с математической точки зрения использование квадратов и квадратных корней дает больше пользы, чем мы могли бы получить на основании абсолютных значений отклонений, благодаря чему среднеквадратическое отклонение применимо и для других математических задач.

О том, как найти среднеквадратическое отклонение, вам рассказал , Сергей Валерьевич

Добрый день!

В статье я решил рассмотреть, как работает стандартное отклонение в Excel с помощью функции СТАНДОТКЛОН. Я просто очень давно не описывал и не комментировал , а еще просто потому что это очень полезная функция для тех, кто изучает высшую математику. А оказать помощь студентам – это святое, по себе знаю, как трудно она осваивается. В реальности функции стандартных отклонений можно использовать для определения стабильности продаваемой продукции, создания цены, корректировки или формирования ассортимента, ну и других не менее полезных анализов ваших продаж.

В Excel используются несколько вариантов этой функции отклонения:


Математическая теория

Для начала немножко о теории, как математическим языком можно описать функцию стандартного отклонения для применения ее в Excel, для анализа, к примеру, данных статистики продаж, но об этом дальше. Предупреждаю сразу, буду писать очень много непонятных слов…)))), если что ниже по тексту смотрите сразу практическое применение в программе.

Что же собственно делает стандартное отклонение? Оно производит оценку среднеквадратического отклонения случайной величины Х относительно её математического ожидания на основе несмещённой оценки её дисперсии. Согласитесь, звучит запутанно, но я думаю учащиеся поймут о чём собственно идет речь!

Для начала нам нужно определить «среднеквадратическое отклонение», что бы в дальнейшем произвести расчёт «стандартного отклонения», в этом нам поможет формула: Описать формулу возможно так: будет измеряться в тех же единицах что и измерения случайной величины и применяется при вычислении стандартной среднеарифметической ошибки, когда производятся построения доверительных интервалов, при проверке гипотез на статистику или же при анализе линейной взаимосвязи между независимыми величинами. Функцию определяют, как квадратный корень из дисперсии независимых величин.

Теперь можно дать определение и стандартному отклонению – это анализ среднеквадратического отклонения случайной величины Х сравнительно её математической перспективы на основе несмещённой оценки её дисперсии. Формула записывается так:
Отмечу, что все две оценки предоставляются смещёнными. При общих случаях построить несмещённую оценку не является возможным. Но оценка на основе оценки несмещённой дисперсии будет состоятельной.

Практическое воплощение в Excel

Ну а теперь отойдём от скучной теории и на практике посмотрим, как работает функция СТАНДОТКЛОН. Я не буду рассматривать все вариации функции стандартного отклонения в Excel, достаточно и одной, но в примерах. А для примера рассмотрим, как определяется статистика стабильности продаж.

Для начала посмотрите на орфографию функции, а она как вы видите, очень проста:

СТАНДОТКЛОН.Г(_число1_;_число2_; ….), где:


Теперь создадим файл примера и на его основе рассмотрим работу этой функции. Так как для проведения аналитических вычислений необходимо использовать не меньше трёх значений, как в принципе в любом статистическом анализе, то и я взял условно 3 периода, это может быть год, квартал, месяц или неделя. В моем случае – месяц. Для наибольшей достоверности рекомендую брать как можно большое количество периодов, но никак не менее трёх. Все данные в таблице очень простые для наглядности работы и функциональности формулы.

Для начала нам необходимо посчитать среднее значение по месяцам. Будем использовать для этого функцию СРЗНАЧ и получится формула: =СРЗНАЧ(C4:E4).
Теперь собственно мы и можем найти стандартное отклонение с помощью функции СТАНДОТКЛОН.Г в значении которой нужно проставить продажи товара каждого периода. Получится формула следующего вида: =СТАНДОТКЛОН.Г(C4;D4;E4).
Ну вот и сделана половина дел. Следующим шагом мы формируем «Вариацию», это получается делением на среднее значение, стандартного отклонения и результат переводим в проценты. Получаем такую таблицу:
Ну вот основные расчёты окончены, осталось разобраться как идут продажи стабильно или нет. Возьмем как условие что отклонения в 10% это считается стабильно, от 10 до 25% это небольшие отклонения, а вот всё что выше 25% это уже не стабильно. Для получения результата по условиям воспользуемся логической и для получения результата напишем формулу:

ЕСЛИ(h5

Все диапазоны взяты условно для наглядности, у ваших задач могут быть совсем другие условия. 2 «вычисляем сумму квадратов разницы элементов массива и среднего значения Next x MyStDevP = Sqr(tmp / aCnt) «вычисляем СТАНДОТКЛОН.Г() End Function

Function MyStDevP (Arr )

Dim x , aCnt & , aSum #, aAver#, tmp#

For Each x In Arr

aSum = aSum + x «вычисляем сумму элементов массива

Формулы стандартного отклонения

Отклонение просто означает, насколько далеко от нормы

Стандартное отклонение

Стандартное отклонение — это показатель того, насколько разброс наши номера .

Возможно, вам сначала захочется прочитать эту более простую страницу о стандартном отклонении.

Но здесь мы объясняем формулы .

Символ стандартного отклонения — σ (греческая буква сигма).

Это формула для стандартного отклонения:

Сказать что? Объясните, пожалуйста!

ОК. Давайте объясним это шаг за шагом.

Допустим, у нас есть набор чисел вроде 9, 2, 5, 4, 12, 7, 8, 11.

Чтобы вычислить стандартное отклонение этих чисел:

  • 1. Вычислите среднее (простое среднее номеров)
  • 2. Затем для каждого числа: вычтите Среднее и возведите результат в квадрат
  • 3.Затем вычислите среднее значение из этих квадратов разностей.
  • 4. Извлеките из этого квадратный корень, и все готово!

Формула действительно говорит обо всем этом, и я покажу вам, как это сделать.

Объяснение формулы

Во-первых, у нас есть несколько примеров значений для работы:

Пример: У Сэма 20 кустов роз.

Количество цветков на каждом кусте

9, 2, 5, 4, 12, 7, 8, 11, 9, 3, 7, 4, 12, 5, 4, 10, 9, 6, 9, 4

Определите стандартное отклонение.

Шаг 1. Определите среднее значение

В приведенной выше формуле μ (греческая буква «mu») — это среднее всех наших значений …

Пример: 9, 2, 5, 4, 12, 7, 8, 11, 9, 3, 7, 4, 12, 5, 4, 10, 9, 6, 9, 4

Среднее значение:

9 + 2 + 5 + 4 + 12 + 7 + 8 + 11 + 9 + 3 + 7 + 4 + 12 + 5 + 4 + 10 + 9 + 6 + 9 + 4 20

= 140 20 = 7

Итак:

мк = 7

Шаг 2.Затем для каждого числа: вычтите Среднее и возведите результат в квадрат

Это часть формулы, которая гласит:

Итак, что такое x и ? Это отдельные значения x 9, 2, 5, 4, 12, 7 и т. Д.

Другими словами x 1 = 9, x 2 = 2, x 3 = 5 и т. Д.

Итак, он говорит: «для каждого значения вычтите среднее и возведите результат в квадрат», например,

Пример (продолжение):

(9-7) 2 = (2) 2 = 4

(2-7) 2 = (-5) 2 = 25

(5-7) 2 = (-2) 2 = 4

(4-7) 2 = (-3) 2 = 9

(12-7) 2 = (5) 2 = 25

(7-7) 2 = (0) 2 = 0

(8-7) 2 = (1) 2 = 1

… и т.д …

И получаем такие результаты:

4, 25, 4, 9, 25, 0, 1, 16, 4, 16, 0, 9, 25, 4, 9, 9, 4, 1, 4, 9

Шаг 3. Затем вычислите среднее значение квадратов разностей.

Чтобы вычислить среднее значение, сложите все значения , затем разделите на сколько .

Сначала сложите все значения из предыдущего шага.

Но как сказать в математике «сложить все»? Используем «Сигма»: Σ

Удобная сигма-нотация позволяет суммировать столько терминов, сколько мы хотим:


Сигма-нотация

Мы хотим сложить все значения от 1 до N, где в нашем случае N = 20, потому что имеется 20 значений:

Пример (продолжение):

Это означает: суммировать все значения от (x 1 -7) 2 до (x N -7) 2

Мы уже вычислили (x 1 -7) 2 = 4 и т. Д.на предыдущем шаге, так что просто суммируйте их:

= 4 + 25 + 4 + 9 + 25 + 0 + 1 + 16 + 4 + 16 + 0 + 9 + 25 + 4 + 9 + 9 + 4 + 1 + 4 + 9 = 178

Но это еще не среднее, нам нужно разделить на сколько , что делается на умножение на 1 / N (то же самое, что деление на N):

Пример (продолжение):

Среднее значение квадратов разностей = (1/20) × 178 = 8,9

(Примечание: это значение называется «Дисперсия»)

Шаг 4.Извлеките квадратный корень из этого:

Пример (заключение):

σ = √ (8,9) = 2,983 …

СДЕЛАНО!

Стандартное отклонение выборки

Но подождите, это еще не все …

… иногда наши данные — это всего лишь выборка всего населения.

Пример: У Сэма

20 кустов роз , но посчитал цветов только на 6 из них !

«Население» — всего 20 кустов роз,

, а «образец» — это 6 кустов, цветы которых Сэм считал.

Допустим, у Сэма количество цветов:

9, 2, 5, 4, 12, 7

Мы все еще можем оценить стандартное отклонение.

Но когда мы используем выборку в качестве оценки для всей совокупности , формула стандартного отклонения изменяется на:

Формула для Стандартное отклонение выборки :

Важным изменением является «N-1» вместо «N» (что называется «поправкой Бесселя»).

Символы также меняются, чтобы отразить, что мы работаем над выборкой, а не со всей генеральной совокупностью:

  • Среднее значение теперь x (для выборочного среднего) вместо μ (среднее значение генеральной совокупности),
  • И ответ: с (для стандартного отклонения выборки) вместо σ .

Но на расчеты это не влияет. Только N-1 вместо N меняет вычисления.

Хорошо, давайте теперь вычислим стандартное отклонение выборки :

Шаг 1.Найдите среднее значение

Пример 2: Использование значений выборки 9, 2, 5, 4, 12, 7

Среднее значение: (9 + 2 + 5 + 4 + 12 + 7) / 6 = 39/6 = 6,5

Итак:

х = 6,5

Шаг 2. Затем для каждого числа: вычтите Среднее и возведите результат в квадрат.

Пример 2 (продолжение):

(9 — 6,5) 2 = (2,5) 2 = 6,25

(2 — 6,5) 2 = (-4,5) 2 = 20,25

(5 — 6,5) 2 = (-1.5) 2 = 2,25

(4 — 6,5) 2 = (-2,5) 2 = 6,25

(12 — 6,5) 2 = (5,5) 2 = 30,25

(7 — 6,5) 2 = (0,5) 2 = 0,25

Шаг 3. Затем вычислите среднее значение квадратов разностей.

Чтобы вычислить среднее значение, сложите все значения , затем разделите на сколько .

Но подождите … мы вычисляем стандартное отклонение Sample , поэтому вместо деления на количество (N) мы разделим на N-1

Пример 2 (продолжение):

Сумма = 6.25 + 20,25 + 2,25 + 6,25 + 30,25 + 0,25 = 65,5

Разделить на N-1 : (1/5) × 65,5 = 13,1

(Это значение называется «Выборочная дисперсия»)

Шаг 4. Извлеките квадратный корень из этого:

Пример 2 (завершение):

с = √ (13,1) = 3,619 …

СДЕЛАНО!

Сравнение

Когда мы использовали всю популяцию , мы получили: Среднее = 7 , Стандартное отклонение = 2.983 …

Когда мы использовали образец , мы получили: Среднее значение выборки = 6,5 , стандартное отклонение выборки = 3,619 …

Наше среднее значение по выборке было неверным на 7%, а стандартное отклонение по выборке было неверным на 21%.

Зачем нужно брать образец?


В основном потому, что так проще и дешевле.

Представьте, что вы хотите знать, что думает вся страна … вы не можете спрашивать миллионы людей, поэтому вместо этого вы спрашиваете, может быть, 1000 человек.

Есть хорошая цитата (возможно, Самуэль Джонсон):

«Не обязательно есть животное целиком, чтобы знать, что мясо жесткое.»

Это основная идея отбора проб. Чтобы получить информацию о совокупности (такую ​​как среднее значение и стандартное отклонение), нам не нужно смотреть на всех членов совокупности; нам нужен только образец.

Но когда мы берем образец, мы теряем некоторую точность.

Сводка

Население Стандартное отклонение:

Образец Стандартное отклонение:

Стандартное отклонение и дисперсия

Отклонение просто означает, насколько далеко от нормы

Стандартное отклонение

Стандартное отклонение — это мера того, насколько разброс наши числа есть.

Его символ — σ (греческая буква сигма)

Формула проста: это квадратный корень из дисперсии. Итак, теперь вы спрашиваете: «Что такое дисперсия?»

Разница

Разница определяется как:

Среднее из в квадрате отклонений от среднего.

Чтобы вычислить дисперсию, выполните следующие действия:

  • Вычислите среднее (простое среднее номеров)
  • Затем для каждого числа: вычтите Среднее и возведите результат в квадрат. (разница в квадрате ).
  • Затем вычислите среднее значение квадратов разностей. (Почему Квадрат?)

Пример

Вы и ваши друзья только что измерили рост ваших собак (в миллиметрах):

Высота (в плечах): 600мм, 470мм, 170мм, 430мм и 300 мм.

Найдите среднее значение, дисперсию и стандартное отклонение.

Ваш первый шаг — найти среднее значение:

Ответ:

Среднее значение = 600 + 470 + 170 + 430 + 300 5
= 1970 5
= 394

, поэтому средняя (средняя) высота составляет 394 мм.Нарисуем это на графике:

Теперь посчитаем разницу для каждой собаки со Средним значением:

Чтобы вычислить дисперсию, возьмите каждую разницу, возведите ее в квадрат и затем усредните результат:

Разница
σ 2 = 206 2 + 76 2 + (−224) 2 + 36 2 + (−94) 2 5
= 42436 + 5776 + 50176 + 1296 + 8836 5
= 108520 5
= 21704

Таким образом, отклонение составляет 21,704

А стандартное отклонение — это просто квадратный корень из дисперсии, итак:

Стандартное отклонение
σ = √21704
= 147.32 …
= 147 (с точностью до мм)

И стандартное отклонение хорошо то, что оно полезно. Теперь мы можем показать, какие высоты находятся в пределах одного стандартного отклонения. (147 мм) среднего:

Итак, используя стандартное отклонение, мы имеем «стандарт» способ узнать, что является нормальным, а что очень большим или дополнительным небольшой.

Ротвейлеры — это высоких собак. А таксы стоят немного короче, правда?

Использование

Можно ожидать, что около 68% значений будут в пределах плюс-минус. 1 стандартное отклонение.

Прочтите Стандартное нормальное распределение, чтобы узнать больше.

Также попробуйте калькулятор стандартного отклонения.

Но … есть небольшое изменение с

Sample Data

Наш пример был для популяции (5 собак — единственные собаки, которые нас интересуют).

Но если данные представляют собой образец (выборка, взятая из более крупной совокупности), то расчет меняется!

При наличии «N» значений данных:

  • Население : разделите на N при вычислении дисперсии (как мы это делали)
  • Образец : разделите на N-1 при вычислении дисперсии

Все остальные вычисления остаются такими же, включая то, как мы вычислили среднее значение.

Пример: если наши 5 собак — это всего лишь выборка из большей популяции собак, мы делим на 4 вместо 5 следующим образом:

Выборочная дисперсия = 108,520 / 4 = 27,130

Стандартное отклонение выборки = √27,130 = 165 (с точностью до мм)

Думайте об этом как о «исправлении», когда ваши данные являются всего лишь образцом.

Формулы

Вот две формулы, объясненные в разделе Формулы стандартного отклонения, если вы хотите узнать больше:


«Стандартное отклонение для населения , »:

« Sample Standard Deviation »:

Выглядит сложно, но важное изменение состоит в том, что
делится на N-1 (вместо N ) при вычислении дисперсии выборки.

* Сноска: Почему квадрат различия?

Если просто сложить отличия от среднего … отрицательные значения отменяют положительные:

4 + 4-4-4 4 = 0

Так что это не сработает. Как насчет того, чтобы использовать абсолютные значения?

| 4 | + | 4 | + | −4 | + | −4 | 4 = 4 + 4 + 4 + 4 4 = 4

Выглядит хорошо (и является средним отклонением), но как насчет этого случая:

| 7 | + | 1 | + | −6 | + | −2 | 4 = 7 + 1 + 6 + 2 4 = 4

О нет! Это также дает значение 4, Хотя различия более разрозненные.

Итак, давайте попробуем возвести в квадрат каждую разницу (и в конце извлечь квадратный корень):

√ ( 4 2 + 4 2 + (-4) 2 + (-4) 2 4 ) = √ ( 64 4 ) = 4
√ ( 7 2 + 1 2 + (-6) 2 + (-2) 2 4 ) = √ ( 90 4 ) = 4.74 …

Это хорошо! Стандартное отклонение больше, чем больше различий … как раз то, что мы хотим.

Фактически, этот метод аналогичен расстоянию между точками, но применяется по-другому.

И проще использовать алгебру для вычисления квадратов и квадратных корней, чем абсолютные значения, что позволяет легко использовать стандартное отклонение в других областях математики.

Вернуться к началу

Стандартное отклонение | Пошаговое руководство с формулами

Стандартное отклонение — это средняя величина изменчивости в вашем наборе данных.Он сообщает вам, в среднем, насколько далеко каждое значение от среднего.

Высокое стандартное отклонение означает, что значения обычно далеки от среднего, в то время как низкое стандартное отклонение указывает, что значения сгруппированы близко к среднему.

Что вам говорит стандартное отклонение?

Стандартное отклонение — полезная мера разброса для нормального распределения .

В нормальном распределении данные распределяются симметрично без перекоса. Большинство значений группируются вокруг центральной области, причем значения сужаются по мере удаления от центра.Стандартное отклонение показывает, насколько в среднем разбросаны ваши данные от центра распределения.

Многие научные переменные подчиняются нормальному распределению, включая рост, результаты стандартизированных тестов или оценки удовлетворенности работой. Когда у вас есть стандартные отклонения различных выборок, вы можете сравнить их распределения с помощью статистических тестов, чтобы сделать выводы о более крупных популяциях, из которых они произошли.

Пример: сравнение различных стандартных отклонений. Вы собираете данные об оценках удовлетворенности работой трех групп сотрудников, используя простую случайную выборку.

Средние ( M ) оценки одинаковы для каждой группы — это значение на оси x, когда кривая находится на пике. Однако их стандартные отклонения ( SD ) отличаются друг от друга.

Стандартное отклонение отражает дисперсию распределения. Кривая с наименьшим стандартным отклонением имеет высокий пик и небольшой разброс, тогда как кривая с наибольшим стандартным отклонением более пологая и широко распространенная.

Эмпирическое правило

Стандартное отклонение и среднее значение вместе могут сказать вам, где находится большинство значений в вашем распределении, если они соответствуют нормальному распределению.

Эмпирическое правило , или правило 68-95-99.7, говорит вам, где находятся ваши ценности:

  • Около 68% оценок находятся в пределах 2 стандартных отклонений от среднего значения,
  • Около 95% оценок находятся в пределах 4 стандартных отклонений от среднего значения,
  • Около 99,7% оценок находятся в пределах 6 стандартных отклонений от среднего.
Пример: стандартное отклонение в нормальном распределении Вы проводите тест на вспоминание памяти для группы студентов. Данные соответствуют нормальному распределению со средним баллом 50 и стандартным отклонением 10.

Следуя эмпирическому правилу:

  • Около 68% оценок находятся в диапазоне от 40 до 60.
  • Около 95% оценок находятся в диапазоне от 30 до 70.
  • Около 99,7% оценок находятся в диапазоне от 20 до 80.

Эмпирическое правило — это быстрый способ получить обзор ваших данных и проверить любые выбросы или экстремальные значения, которые не соответствуют этому шаблону.

Для ненормальных распределений стандартное отклонение является менее надежным показателем изменчивости и должно использоваться в сочетании с другими показателями, такими как размах или межквартильный размах.

Формулы стандартного отклонения для популяций и выборок

Для расчета стандартных отклонений используются разные формулы в зависимости от того, есть ли у вас данные от всей генеральной совокупности или от выборки.

Стандартное отклонение совокупности

Когда вы собрали данные от каждого члена населения, который вас интересует, вы можете получить точное значение стандартного отклонения населения.

Формула стандартного отклонения совокупности выглядит так:

Формула Пояснение
  • σ = стандартное отклонение совокупности
  • ∑ = сумма…
  • X = каждое значение
  • μ = среднее значение по совокупности
  • N = количество значений в генеральной совокупности

Стандартное отклонение выборки

Когда вы собираете данные из выборки, стандартное отклонение выборки используется для оценок или выводов о стандартном отклонении генеральной совокупности.

Формула стандартного отклонения выборки выглядит так:

Формула Пояснение
  • с = стандартное отклонение выборки
  • ∑ = сумма…
  • X = каждое значение
  • x̅ = выборочное среднее
  • n = количество значений в выборке

Для выборок мы используем n — 1 в формуле, потому что использование n даст нам смещенную оценку, которая постоянно недооценивает изменчивость.Стандартное отклонение выборки будет, как правило, ниже, чем реальное стандартное отклонение генеральной совокупности.

Уменьшение выборки n до n — 1 делает стандартное отклонение искусственно большим, давая вам консервативную оценку изменчивости.

Хотя это не беспристрастная оценка, это менее предвзятая оценка стандартного отклонения: лучше переоценить, чем недооценить изменчивость в выборках.

Получать отзывы о языке, структуре и макете

Профессиональные редакторы корректируют и редактируют вашу статью, уделяя особое внимание:

  • Академический стиль
  • Расплывчатые предложения
  • Грамматика
  • Единообразие стиля

См. Пример

Шаги для расчета стандартного отклонения

Стандартное отклонение обычно рассчитывается автоматически любым программным обеспечением, которое вы используете для статистического анализа.Но вы также можете рассчитать его вручную, чтобы лучше понять, как работает формула.

Есть шесть основных шагов для определения стандартного отклонения вручную. Мы будем использовать небольшой набор данных из 6 оценок, чтобы пройти через шаги.

Набор данных
46 69 32 60 52 41

Шаг 1 : Найдите среднее значение

Чтобы найти среднее значение, сложите все баллы, затем разделите их на количество баллов.

Среднее (x̅)
x̅ = (46 + 69 + 32 + 60 + 52 + 41) ÷ 6 = 50

Шаг 2 : Найдите отклонение каждой оценки от среднего

Вычтите среднее значение из каждой оценки, чтобы получить отклонения от среднего.

Поскольку x̅ = 50, здесь мы убираем 50 из каждого результата.

Оценка Отклонение от среднего
46 46-50 = -4
69 69-50 = 19
32 32-50 = -18
60 60-50 = 10
52 52-50 = 2
41 41-50 = -9

Шаг 3 : Возвести в квадрат каждое отклонение от среднего

Умножьте каждое отклонение от среднего на само себя.Это приведет к положительным числам.

Квадратные отклонения от среднего
(-4) 2 = 4 × 4 = 16
19 2 = 19 × 19 = 161
(-18) 2 = -18 × -18 = 324
10 2 = 10 × 10 = 100
2 2 = 2 × 2 = 4
(-9) 2 = -9 × -9 = 81

Шаг 4 : Найдите сумму квадратов

Сложите все квадраты отклонений.Это называется суммой квадратов.

Сумма квадратов
16 + 361 + 324 + 100 + 4 + 81 = 886

Шаг 5: Найдите отклонение

Разделите сумму квадратов на n — 1 (для выборки) или N (для генеральной совокупности) — это дисперсия.

Поскольку мы работаем с размером выборки 6, мы будем использовать n — 1, где n = 6.

Разница
886 ÷ (6-1) = 886 ÷ 5 = 177,2

Шаг 6 : Найдите квадратный корень из дисперсии

Чтобы найти стандартное отклонение, мы извлекаем квадратный корень из дисперсии.

Стандартное отклонение
√177,2 = 13,31

Исходя из того, что SD = 13.31, можно сказать, что каждая оценка отклоняется от среднего в среднем на 13,31 балла.

Почему стандартное отклонение является полезным показателем изменчивости?

Хотя существуют более простые способы расчета вариабельности, формула стандартного отклонения позволяет взвешивать неравномерно распределенные образцы больше, чем равномерно распределенные. Более высокое стандартное отклонение говорит о том, что распределение не только более равномерно, но и более неравномерно.

Это означает, что он дает вам лучшее представление об изменчивости ваших данных, чем более простые меры, такие как среднее абсолютное отклонение (MAD).

MAD похоже на стандартное отклонение, но его легче вычислить. Во-первых, вы выражаете каждое отклонение от среднего в абсолютных значениях, преобразуя их в положительные числа (например, -3 становится 3). Затем вы вычисляете среднее значение этих абсолютных отклонений.

В отличие от стандартного отклонения, вам не нужно вычислять квадраты или квадратные корни чисел для MAD. Однако по этой причине он дает менее точную меру изменчивости.

Давайте возьмем две выборки с одной и той же центральной тенденцией, но с разной степенью изменчивости.Образец B более изменчив, чем образец A.

Значения Среднее значение Среднее абсолютное отклонение Стандартное отклонение
Образец A 66, 30, 40, 64 50 15 17,8
Образец B 51, 21, 79, 49 50 15 23,7

Для выборок с одинаковыми средними отклонениями от среднего MAD не может различать уровни разброса.Стандартное отклонение более точное: оно выше для выборки с большим разбросом отклонений от среднего.

Возведя в квадрат разности от среднего, стандартное отклонение более точно отражает неравномерную дисперсию. Эта ступень более взвешивает крайние отклонения, чем небольшие отклонения.

Однако это также делает стандартное отклонение чувствительным к выбросам.

Часто задаваемые вопросы о стандартном отклонении

Что вам говорит стандартное отклонение?

Стандартное отклонение — это средняя величина изменчивости в вашем наборе данных.Он сообщает вам, в среднем, насколько далеко каждая оценка отличается от среднего значения.

В нормальных распределениях высокое стандартное отклонение означает, что значения обычно далеки от среднего, в то время как низкое стандартное отклонение указывает, что значения сгруппированы близко к среднему.

Что такое эмпирическое правило?

Эмпирическое правило, или 68-95-99.Правило 7 говорит вам, где большинство значений лежит в нормальном распределении:

  • Около 68% значений находятся в пределах 1 стандартного отклонения от среднего.
  • Около 95% значений находятся в пределах 2 стандартных отклонений от среднего.
  • Около 99,7% значений находятся в пределах 3 стандартных отклонений от среднего.

Эмпирическое правило — это быстрый способ получить обзор ваших данных и проверить любые выбросы или экстремальные значения, которые не соответствуют этому шаблону.

Пример стандартного отклонения Пример Задача

Это простой пример того, как рассчитать дисперсию выборки и стандартное отклонение выборки.Во-первых, давайте рассмотрим этапы расчета стандартного отклонения выборки:

  1. Рассчитайте среднее (простое среднее чисел).
  2. Для каждого числа: вычтите среднее значение. Возведите результат в квадрат.
  3. Сложите все результаты в квадрате.
  4. Разделите эту сумму на единицу меньше количества точек данных (N — 1). Это дает вам выборочную дисперсию.
  5. Извлеките квадратный корень из этого значения, чтобы получить стандартное отклонение выборки.

Пример задачи

Вы выращиваете 20 кристаллов из раствора и измеряете длину каждого кристалла в миллиметрах.Вот ваши данные:

9, 2, 5, 4, 12, 7, 8, 11, 9, 3, 7, 4, 12, 5, 4, 10, 9, 6, 9, 4

Рассчитайте стандартное отклонение длины кристаллов по образцу.

  1. Рассчитайте среднее значение данных. Сложите все числа и разделите на общее количество точек данных. (9 + 2 + 5 + 4 + 12 + 7 + 8 + 11 + 9 + 3 + 7 + 4 + 12 + 5 + 4 + 10 + 9 + 6 + 9 + 4) / 20 = 140/20 = 7
  2. Вычтите среднее значение из каждой точки данных (или наоборот, если хотите … вы возьмете это число в квадрат, поэтому не имеет значения, положительное оно или отрицательное).(9-7) 2 = (2) 2 = 4
    (2-7) 2 = (-5) 2 = 25
    (5-7) 2 = (-2) 2 = 4
    (4-7) 2 = (-3) 2 = 9
    (12-7) 2 = (5) 2 = 25
    (7-7) 2 = (0) 2 = 0
    (8-7) 2 = (1) 2 = 1
    (11-7) 2 = (4) 2 2 = 16
    (9 — 7) 2 = (2) 2 = 4
    (3-7) 2 = (-4) 2 2 = 16
    (7-7) 2 = (0) 2 = 0
    (4-7) 2 = (-3) 2 = 9
    (12-7) 2 = (5) 2 = 25
    (5-7) 2 = (-2) 2 = 4
    (4-7) 2 = (-3) 2 = 9
    (10-7) 2 = (3) 2 = 9
    (9 — 7) 2 = (2) 2 = 4
    (6-7) 2 = (-1) 2 = 1
    (9-7) 9 0129 2 = (2) 2 = 4
    (4-7) 2 = (-3) 2 2 = 9
  3. Вычислите среднее значение квадратов разностей.(4 + 25 + 4 + 9 + 25 + 0 + 1 + 16 + 4 + 16 + 0 + 9 + 25 + 4 + 9 + 9 + 4 + 1 + 4 + 9) / 19 = 178/19 = 9,368
    Это значение представляет собой отклонение выборки . Вариация выборки 9,368
  4. Стандартное отклонение генеральной совокупности — это квадратный корень из дисперсии. Используйте калькулятор, чтобы получить это число. (9,368) 1/2 = 3,061
    Стандартное отклонение генеральной совокупности составляет 3,061

Сравните это с дисперсией и стандартным отклонением генеральной совокупности для тех же данных.

Как рассчитать стандартное отклонение выборки

Распространенный способ количественной оценки разброса набора данных — использовать стандартное отклонение выборки.В вашем калькуляторе может быть встроенная кнопка стандартного отклонения, на которой обычно находится s x . Иногда приятно знать, что делает ваш калькулятор за кулисами.

Приведенные ниже шаги разбивают формулу стандартного отклонения на процесс. Если вас когда-либо просили решить такую ​​задачу на тесте, знайте, что иногда легче запомнить пошаговый процесс, чем запоминать формулу.

После того, как мы рассмотрим процесс, мы увидим, как его использовать для вычисления стандартного отклонения.

Процесс

  1. Рассчитайте среднее значение вашего набора данных.
  2. Вычтите среднее значение из каждого значения данных и перечислите различия.
  3. Возведите в квадрат каждое из отличий от предыдущего шага и составьте список квадратов.
    1. Другими словами, умножьте каждое число само на себя.
    2. Будьте осторожны с негативами. Умножение отрицательного на отрицательное дает положительное.
  4. Сложите квадраты из предыдущего шага вместе.
  5. Вычтите единицу из количества значений данных, с которых вы начали.
  6. Разделите сумму из шага четыре на число из шага пять.
  7. Извлеките квадратный корень из числа из предыдущего шага. Это стандартное отклонение.
    1. Чтобы найти квадратный корень, возможно, потребуется обычный калькулятор.
    2. Обязательно используйте значащие цифры при округлении окончательного ответа.

Рабочий пример

Предположим, вам дан набор данных 1, 2, 2, 4, 6.Выполните каждый шаг, чтобы найти стандартное отклонение.

  1. Рассчитайте среднее значение вашего набора данных. Среднее значение данных составляет (1 + 2 + 2 + 4 + 6) / 5 = 15/5 = 3.
  2. Вычтите среднее значение из каждого значения данных и перечислите различия. Вычтите 3 из каждого из значений 1, 2, 2, 4, 6
    1-3 = -2
    2-3 = -1
    2-3 = -1
    4-3 = 1
    6-3 = 3
    Ваш список различий: -2, -1, -1, 1, 3
  3. Возведите в квадрат каждое из отличий от предыдущего шага и составьте список квадратов.Вам нужно возвести в квадрат каждое из чисел -2, -1, -1, 1, 3
    Ваш список различий: -2, -1, -1, 1, 3
    (-2) 2 = 4
    ( -1) 2 = 1
    (-1) 2 = 1
    1 2 = 1
    3 2 = 9
    Ваш список квадратов: 4, 1, 1, 1, 9
  4. Сложите квадраты из предыдущего шага вместе. Вам нужно добавить 4 + 1 + 1 + 1 + 9 = 16
  5. Вычтите единицу из количества значений данных, с которых вы начали. Вы начали этот процесс (может показаться, что некоторое время назад) с пятью значениями данных.На единицу меньше этого значения 5-1 = 4.
  6. Разделите сумму из шага четыре на число из шага пять. Сумма была 16, а число из предыдущего шага было 4. Вы разделите эти два числа 16/4 = 4.
  7. Извлеките квадратный корень из числа из предыдущего шага. Это стандартное отклонение. Стандартное отклонение — это квадратный корень из 4, который равен 2.

Совет. Иногда бывает полезно организовать все в виде таблицы, как показано ниже.

Таблицы средних данных
Данные Среднее значение данных (среднее значение) 2
1-2 4
2–1 1
2–1 1
4 1 1
6 3 9

Затем мы складываем все записи в правом столбце.Это сумма квадратов отклонений. Затем разделите на единицу меньше, чем количество значений данных. Наконец, извлекаем квадратный корень из этого частного, и все готово.

Смотри: Как складывать дроби

Примеров стандартного отклонения и его использования

Оценочные тесты

Класс студентов сдал тест по математике. Их учитель хочет знать, на одном ли уровне успеваемость у большинства учеников или имеется высокое стандартное отклонение.

1.Результаты теста: 85, 86, 100, 76, 81, 93, 84, 99, 71, 69, 93, 85, 81, 87 и 89. Когда учитель складывает их вместе, она получает 1279. Она делит по количеству баллов (15), чтобы получить средний балл.

1279 ÷ 15 = 85,2 (среднее)

2. 85,2 — это высокий балл, но все ли работают на этом уровне? Чтобы выяснить это, учитель вычитает среднее значение из каждой оценки за тест.

85 — 85,2 = -0,2
86 — 85,2 = 0,8
100 — 85.2 = 14,8
76-85,2 = -9,2
81-85,2 = -4,2
93-85,2 = 7,8
84-85,2 = -1,2
99-85,2 = 13,8
71 — 85,2 = -14,2
69 — 85,2 = -16,2
93 — 85,2 = 7,8
85 — 85,2 = — 0,2
81 — 85,2 = -4,2
87 — 85,2 = 1,8
89 — 85,2 = 3,8

3. Она возводит в квадрат каждую разницу:

-0.2 x -0,2 = 0,04
0,8 x 0,8 = 0,64
14,8 14,8 = 219,04
-9,2 x -9,2 = 84,64
-4,2 x -4,2 = 17,64
7,8 x 7,8 = 60,84
-1,2 x -1,2 = 1,44
13,8 x 13,8 = 190,44
-14,2 x -14,2 = 201,64
-16,2 x -16,2 = 262,44
7,8 x 7,8 = 60,84
-0,2 x -0,2 = 0,04
-4,2 x -4,2 = 17,64
1.8 x 1,8 = 3,24
3,8 x 3,8 = 14,44

4. Учитель находит дисперсию, которая представляет собой среднее значение квадратов:

0,04 + 0,64 + 219,04 + 84,64 + 17,64 + 60,84 +1,44 +190,44 +201,64 + 262,44 + 60,84 + 0,04 + 17,64 + 3,24 + 14,44 = 1135

830,64 ÷ 15 = 75,6 (дисперсия)

5. Наконец, учитель находит квадратный корень из дисперсии:

Корень квадратный из 75,6 = 8,7 (стандартное отклонение)

Стандартное отклонение этих тестов составляет 8.7 балла из 100. Поскольку дисперсия несколько невелика, учитель знает, что большинство учеников показывают примерно одинаковый уровень.

Стандартное отклонение

— Математика, выпуск GCSE

Стандартное отклонение измеряет разброс данных о среднем значении . Это полезно при сравнении наборов данных, которые могут иметь одинаковое среднее значение, но разный диапазон. Например, среднее значение следующих двух одинаково: 15, 15, 15, 14, 16 и 2, 7, 14, 22, 30.Однако второй явно более распространен. Если набор имеет низкое стандартное отклонение, значения не слишком сильно разбросаны.

Как и при вычислении среднего значения, метод отличается, если данные предоставляются вам группами.

В этом видео показано, как рассчитать стандартное отклонение.

Несгруппированные данные

Несгруппированные данные — это просто список значений. Стандартное отклонение рассчитывается по формуле:

.

с означает «стандартное отклонение».
S означает «сумма».
означает «среднее значение»

Пример

Найдите стандартное отклонение 4, 9, 11, 12, 17, 5, 8, 12, 14
Сначала определите среднее значение: 10,222
Теперь вычтите среднее значение индивидуально из каждого из приведенных чисел и возведите результат в квадрат. Это эквивалентно шагу (x -) ². x относится к значениям, указанным в вопросе.

х 4 9 11 12 17 5 8 12 14
(х -) 2 38.7 1,49 0,60 3,16 45,9 27,3 4,94 3,16 14,3

Теперь сложите эти результаты (это «сигма» в формуле): 139,55
Разделите на n. n — количество значений, поэтому в данном случае это 9. Это дает нам: 15.51
И, наконец, квадратный корень: 3.94

Стандартное отклонение обычно гораздо проще вычислить с помощью калькулятора, и это может быть приемлемо для некоторых экзаменов.На моем калькуляторе вы переходите в режим стандартного отклонения (режим ‘.’). Затем введите первое значение, нажмите «данные», введите второе значение, нажмите «данные». Делайте это, пока не введете все значения, затем нажмите кнопку стандартного отклонения (на ней, вероятно, будет строчная сигма). Обратитесь к руководству к своему калькулятору, чтобы узнать, как рассчитать его на вашем.

NB: если у вас есть набор чисел (например, 1, 5, 2, 7, 3, 5 и 3), если каждое число увеличивается на ту же величину (например, до 3, 7, 4, 9, 5, 7 и 5) стандартное отклонение будет таким же, а среднее значение увеличится на величину, на которую увеличилось каждое из чисел (в данном случае 2).Это потому, что стандартное отклонение измеряет разброс данных. Увеличение каждого из чисел на 2 не приводит к разбросу чисел, а просто сдвигает их все вместе.

Сгруппированные данные

При работе с сгруппированными данными, например:

х ф
4 9
5 14
6 22
7 11
8 17

формула стандартного отклонения принимает следующий вид:

Попробуйте определить стандартное отклонение приведенных выше данных.