Ско среднего – Среднеквадратическое отклонение — Википедия

Содержание

Дисперсия, среднеквадратичное (стандартное) отклонение, коэффициент вариации

Из предыдущей статьи мы узнали о таких показателях, как размах вариации, межквартильный размах и среднее линейное отклонение. Но наиболее информативными и часто используемыми явлются: дисперсия, среднеквадратичное отклонение и коэффициент вариации.

Напомню, что среднее линейное отклонение отражает среднее абсолютное отклонение значений от их средней величины. При расчете этого показателя, чтобы избежать взаимопогашения положительных и отрицательных отклонений, используется модуль, то есть каждое отклонение от средней берется с положительным знаком. Та же идея лежит в расчете другого известного в статистике показателя, только отклонения берутся не по модулю, а возводятся в квадрат. Квадрат любого числа, как известно, всегда будет положительным.

Дисперсия

Речь идет о дисперсии случайной величины. Это очень важный показатель, который активно используется в различных методах статистического анализа (проверка гипотез, анализ причинно-следственных связей и др.). Как и среднее линейное отклонение, дисперсия также отражает меру разброса данных вокруг средней величины.

Сейчас небольшой экскурс в теорию вероятностей, которая лежит в основе математической статистики. Как и матожидание, дисперсия является важной характеристикой случайной величины. Если матожидание отражает центр случайной величины, то дисперсия дает характеристику разброса данных вокруг центра.

Формула дисперсии в теории вероятностей имеет вид:

То есть дисперсия — это математическое ожидание отклонений от математического ожидания.

На практике при анализе выборок математическое ожидание, как правило, не известно. Поэтому вместо него используют оценку – среднее арифметическое.

где

s2 – выборочная дисперсия, рассчитанная по данным наблюдений,

X – отдельные значения,

– среднее арифметическое по выборке.

Примечание. Для расчета дисперсии в Excel предусмотрена специальная функция.

Стоит отметить, что у такого расчета дисперсии есть недостаток – она получается смещенной, т.е. ее математическое ожидание не равно истинному значению дисперсии. Подробней об этом здесь. В то же время не все так плохо. При увеличении объема выборки она все-таки приближается к своему теоретическому аналогу, т.е. является асимптотически не смещенной. Поэтому при работе с большими размерами выборок можно использовать формулу выше.

Язык знаков полезно перевести на язык слов. Получится, что дисперсия — это средний квадрат отклонений. То есть вначале рассчитывается среднее значение, затем берется разница между каждым исходным и средним значением, возводится в квадрат, складывается и затем делится на количество значений в данной совокупности. Разница между отдельным значением и средней отражает меру отклонения. В квадрат возводится для того, чтобы все отклонения стали исключительно положительными числами и чтобы избежать взаимоуничтожения положительных и отрицательных отклонений при их суммировании. Затем, имея квадраты отклонений, мы просто рассчитываем среднюю арифметическую. Средний – квадрат – отклонений. Отклонения возводятся в квадрат, и считается средняя. Разгадка заключается всего в трех словах.

Однако в чистом виде, как, например, средняя арифметическая, или индекс, дисперсия не используется. Это скорее вспомогательный и промежуточный показатель, который необходим для других видов статистического анализа. У нее даже единицы измерения нормальной нет. Судя по формуле, это квадрат единицы измерения исходных данных. Без бутылки, как говорится, не разберешься.

Среднеквадратичное отклонение

{module 111}

Дабы вернуть дисперсию в реальность, то есть использовать в более приземленных целей, из нее извлекают квадратный корень. Получается так называемое среднеквадратичное отклонение (СКО). Встречаются названия «стандартное отклонение» или «сигма» (от названия греческой буквы). Формула стандартного отклонения имеет вид:

Для получения этого показателя по выборке используют формулу:

Как и с дисперсией, есть и немного другой вариант расчета. Но с ростом выборки разница исчезает.

Среднеквадратичное отклонение, очевидно, также характеризует меру рассеяния данных, но теперь (в отличие от дисперсии) его можно сравнивать с исходными данными, так как единицы измерения у них одинаковые (это явствует из формулы расчета). Но и этот показатель в чистом виде не очень информативен, так как в нем заложено слишком много промежуточных расчетов, которые сбивают с толку (отклонение, в квадрат, сумма, среднее, корень). Тем не менее, со среднеквадратичным отклонением уже можно работать непосредственно, потому что свойства данного показателя хорошо изучены и известны. К примеру, есть такое правило трех сигм, которое гласит, что у нормально распределенных данных 997 значений из 1000 находятся в пределах ±3 сигмы от средней арифметической. Среднеквадратичное отклонение, как мера неопределенности, также участвует во многих статистических расчетах. С ее помощью устанавливают степень точности различных оценок и прогнозов. Если вариация очень большая, то стандартное отклонение тоже получится большим, следовательно, и прогноз будет неточным, что выразится, к примеру, в очень широких доверительных интервалах.

Коэффициент вариации

Среднее квадратическое отклонение дает абсолютную оценку меры разброса. Поэтому чтобы понять, насколько разброс велик относительно самих значений (т.е. независимо от их масштаба), требуется относительный показатель. Такой показатель называется коэффициентом вариации и рассчитывается по следующей формуле:

Коэффициент вариации измеряется в процентах (если умножить на 100%). По этому показателю можно сравнивать однородность самых разных явлений независимо от их масштаба и единиц измерения. Данный факт и делает коэффициент вариации столь популярным.

В статистике принято, что, если значение коэффициента вариации менее 33%, то совокупность считается однородной, если больше 33%, то – неоднородной. Мне здесь трудно что-то прокомментировать. Не знаю, кто и почему так определил, но это считается аксиомой.

Чувствую, что я увлекся сухой теорией и нужно привести что-то наглядное и образное. С другой стороны все показатели вариации описывают примерно одно и то же, только рассчитываются по-разному. Поэтому разнообразием примеров блеснуть трудно, Отличаться могут лишь значения показателей, но не их суть. Вот и сравним, как отличаются значения различных показателей вариации для одной и той же совокупности данных. Возьмем пример с расчетом среднего линейного отклонения (из предыдущей статьи). Вот исходные данные:

И график для напоминания.

По этим данным рассчитаем различные показатели вариации.

Среднее значение – это обычная средняя арифметическая.

Размах вариации – разница между максимумом и минимумом:

Среднее линейное отклонение считается по формуле:

Дисперсия:

Стандартное отклонение:

Расчет сведем в табличку.

Как видно, среднее линейное и среднеквадратичное отклонение дают похожие значения степени вариации данных. Дисперсия – это сигма в квадрате, поэтому она всегда будет относительно большим числом, что, собственно, ни о чем не говорит. Размах вариации – это разница между крайними значениями и может говорить о многом.

Подведем некоторые итоги.

Вариация показателя отражает изменчивость процесса или явления. Ее степень может измеряться с помощью нескольких показателей.

1. Размах вариации – разница между максимумом и минимумом. Отражает диапазон возможных значений.
2. Среднее линейное отклонение – отражает среднее из абсолютных (по модулю) отклонений всех значений анализируемой совокупности от их средней величины.
3. Дисперсия – средний квадрат отклонений.
4. Среднеквадратичное отклонение – корень из дисперсии (среднего квадрата отклонений).
5. Коэффициент вариации – наиболее универсальный показатель, отражающий степень разброса значений независимо от их масштаба и единиц измерения. Коэффициент вариации измеряется в процентах и может быть использован для сравнения вариации различных процессов и явлений.

Таким образом, в статистическом анализе существует система показателей, отражающих однородность явлений и устойчивость процессов. Часто показатели вариации не имеют самостоятельного смысла и используются для дальнейшего анализа данных (расчет доверительных интервалов, проверка статистических гипотез и др.). Исключением является коэффициент вариации, который характеризует однородность данных, что является ценной статистической характеристикой.

Про дисперсию можно много чего еще рассказать. Например, у нее есть ряд полезных свойств. Но на сегодня все. До скорых встреч.

Поделиться в социальных сетях:

statanaliz.info

Среднеквадратическое отклонение — Википедия (с комментариями)

Материал из Википедии — свободной энциклопедии

Среднеквадрати́ческое отклоне́ние (синонимы: среднее квадрати́ческое отклоне́ние, среднеквадрати́чное отклоне́ние, квадрати́чное отклоне́ние; близкие термины: станда́ртное отклоне́ние, станда́ртный разбро́с) — в теории вероятностей и статистике наиболее распространённый показатель рассеивания значений случайной величины относительно её математического ожидания. При ограниченных массивах выборок значений вместо математического ожидания используется среднее арифметическое совокупности выборок.

Основные сведения

Среднеквадратическое отклонение измеряется в единицах измерения самой случайной величины и используется при расчёте стандартной ошибки среднего арифметического, при построении доверительных интервалов, при статистической проверке гипотез, при измерении линейной взаимосвязи между случайными величинами. Определяется как квадратный корень из дисперсии случайной величины.

Среднеквадратическое отклонение:

<math>\sigma=\sqrt{\frac{1}{n}\sum_{i=1}^n\left(x_i-\bar{x}\right)^2}.</math>

Стандартное отклонение (оценка среднеквадратического отклонения случайной величины x относительно её математического ожидания на основе несмещённой оценки её дисперсии) <math>s</math>:

<math>s=\sqrt{\frac{n}{n-1}\sigma^2}=\sqrt{\frac{1}{n-1}\sum_{i=1}^n\left(x_i-\bar{x}\right)^2};</math>

где <math>\sigma^2</math> — дисперсия; <math>x_i</math> — i-й элемент выборки; <math>n</math> — объём выборки; <math>\bar{x}</math> — среднее арифметическое выборки:

<math>\bar{x} = \frac{1}{n}\sum_{i=1}^n x_i = \frac{1}{n} (x_1+\ldots+x_n).</math>

Следует отметить, что обе оценки являются смещёнными. В общем случае несмещённую оценку построить невозможно. Однако оценка на основе оценки несмещённой дисперсии является состоятельной.

Правило трёх сигм

Правило трёх сигм (<math>3\sigma</math>) — практически все значения нормально распределённой случайной величины лежат в интервале <math>\left(\bar{x}-3\sigma;\bar{x}+3\sigma\right)</math>. Более строго — приблизительно с вероятностью 0,9973 значение нормально распределённой случайной величины лежит в указанном интервале (при условии, что величина <math>\bar{x}</math> истинная, а не полученная в результате обработки выборки).

Если же истинная величина <math>\bar{x}</math> неизвестна, то следует пользоваться не <math>\sigma</math>, а s. Таким образом, правило трёх сигм преобразуется в правило трёх s.

Интерпретация величины среднеквадратического отклонения

Большее значение среднеквадратического отклонения показывает больший разброс значений в представленном множестве со средней величиной множества; меньшее значение, соответственно, показывает, что значения в множестве сгруппированы вокруг среднего значения.

Например, у нас есть три числовых множества: {0, 0, 14, 14}, {0, 6, 8, 14} и {6, 6, 8, 8}. У всех трёх множеств средние значения равны 7, а среднеквадратические отклонения, соответственно, равны 7, 5 и 1. У последнего множества среднеквадратическое отклонение маленькое, так как значения в множестве сгруппированы вокруг среднего значения; у первого множества самое большое значение среднеквадратического отклонения — значения внутри множества сильно расходятся со средним значением.

В общем смысле среднеквадратическое отклонение можно считать мерой неопределённости. К примеру, в физике среднеквадратическое отклонение используется для определения погрешности серии последовательных измерений какой-либо величины. Это значение очень важно для определения правдоподобности изучаемого явления в сравнении с предсказанным теорией значением: если среднее значение измерений сильно отличается от предсказанных теорией значений (большое значение среднеквадратического отклонения), то полученные значения или метод их получения следует перепроверить.

Практическое применение

На практике среднеквадратическое отклонение позволяет оценить, насколько значения из множества могут отличаться от среднего значения.

Экономика и финансы

Среднее квадратическое отклонение доходности портфеля <math> \sigma =\sqrt{D[X]}</math> отождествляется с риском портфеля.

В техническом анализе среднеквадратическое отклонение используется для построения линий Боллинджера, расчёта волатильности.

Климат

Предположим, существуют два города с одинаковой средней максимальной дневной температурой, но один расположен на побережье, а другой на равнине. Известно, что в городах, расположенных на побережье, множество различных максимальных дневных температур меньше, чем у городов, расположенных внутри континента. Поэтому среднеквадратическое отклонение максимальных дневных температур у прибрежного города будет меньше, чем у второго города, несмотря на то, что среднее значение этой величины у них одинаковое, что на практике означает, что вероятность того, что максимальная температура воздуха каждого конкретного дня в году будет сильнее отличаться от среднего значения, выше у города, расположенного внутри континента.

Спорт

Предположим, что есть несколько футбольных команд, которые оцениваются по некоторому набору параметров, например, количеству забитых и пропущенных голов, голевых моментов и т. п. Наиболее вероятно, что лучшая в этой группе команда будет иметь лучшие значения по большему количеству параметров. Чем меньше у команды среднеквадратическое отклонение по каждому из представленных параметров, тем предсказуемее является результат команды, такие команды являются сбалансированными. С другой стороны, у команды с большим значением среднеквадратического отклонения сложно предсказать результат, что в свою очередь объясняется дисбалансом, например, сильной защитой, но слабым нападением.

Использование среднеквадратического отклонения параметров команды позволяет в той или иной мере предсказать результат матча двух команд, оценивая сильные и слабые стороны команд, а значит, и выбираемых способов борьбы.

См. также

Напишите отзыв о статье «Среднеквадратическое отклонение»

Литература

  • Боровиков В. STATISTICA. Искусство анализа данных на компьютере: Для профессионалов / В. Боровиков. — СПб.: Питер, 2003. — 688 с. — ISBN 5-272-00078-1..

Отрывок, характеризующий Среднеквадратическое отклонение

И, быстро отворив дверь, он вышел решительными шагами на балкон. Говор вдруг умолк, шапки и картузы снялись, и все глаза поднялись к вышедшему графу.
– Здравствуйте, ребята! – сказал граф быстро и громко. – Спасибо, что пришли. Я сейчас выйду к вам, но прежде всего нам надо управиться с злодеем. Нам надо наказать злодея, от которого погибла Москва. Подождите меня! – И граф так же быстро вернулся в покои, крепко хлопнув дверью.
По толпе пробежал одобрительный ропот удовольствия. «Он, значит, злодеев управит усех! А ты говоришь француз… он тебе всю дистанцию развяжет!» – говорили люди, как будто упрекая друг друга в своем маловерии.
Через несколько минут из парадных дверей поспешно вышел офицер, приказал что то, и драгуны вытянулись. Толпа от балкона жадно подвинулась к крыльцу. Выйдя гневно быстрыми шагами на крыльцо, Растопчин поспешно оглянулся вокруг себя, как бы отыскивая кого то.
– Где он? – сказал граф, и в ту же минуту, как он сказал это, он увидал из за угла дома выходившего между, двух драгун молодого человека с длинной тонкой шеей, с до половины выбритой и заросшей головой. Молодой человек этот был одет в когда то щегольской, крытый синим сукном, потертый лисий тулупчик и в грязные посконные арестантские шаровары, засунутые в нечищеные, стоптанные тонкие сапоги. На тонких, слабых ногах тяжело висели кандалы, затруднявшие нерешительную походку молодого человека.
– А ! – сказал Растопчин, поспешно отворачивая свой взгляд от молодого человека в лисьем тулупчике и указывая на нижнюю ступеньку крыльца. – Поставьте его сюда! – Молодой человек, брянча кандалами, тяжело переступил на указываемую ступеньку, придержав пальцем нажимавший воротник тулупчика, повернул два раза длинной шеей и, вздохнув, покорным жестом сложил перед животом тонкие, нерабочие руки.
Несколько секунд, пока молодой человек устанавливался на ступеньке, продолжалось молчание. Только в задних рядах сдавливающихся к одному месту людей слышались кряхтенье, стоны, толчки и топот переставляемых ног.
Растопчин, ожидая того, чтобы он остановился на указанном месте, хмурясь потирал рукою лицо.
– Ребята! – сказал Растопчин металлически звонким голосом, – этот человек, Верещагин – тот самый мерзавец, от которого погибла Москва.
Молодой человек в лисьем тулупчике стоял в покорной позе, сложив кисти рук вместе перед животом и немного согнувшись. Исхудалое, с безнадежным выражением, изуродованное бритою головой молодое лицо его было опущено вниз. При первых словах графа он медленно поднял голову и поглядел снизу на графа, как бы желая что то сказать ему или хоть встретить его взгляд. Но Растопчин не смотрел на него. На длинной тонкой шее молодого человека, как веревка, напружилась и посинела жила за ухом, и вдруг покраснело лицо.
Все глаза были устремлены на него. Он посмотрел на толпу, и, как бы обнадеженный тем выражением, которое он прочел на лицах людей, он печально и робко улыбнулся и, опять опустив голову, поправился ногами на ступеньке.
– Он изменил своему царю и отечеству, он передался Бонапарту, он один из всех русских осрамил имя русского, и от него погибает Москва, – говорил Растопчин ровным, резким голосом; но вдруг быстро взглянул вниз на Верещагина, продолжавшего стоять в той же покорной позе. Как будто взгляд этот взорвал его, он, подняв руку, закричал почти, обращаясь к народу: – Своим судом расправляйтесь с ним! отдаю его вам!
Народ молчал и только все теснее и теснее нажимал друг на друга. Держать друг друга, дышать в этой зараженной духоте, не иметь силы пошевелиться и ждать чего то неизвестного, непонятного и страшного становилось невыносимо. Люди, стоявшие в передних рядах, видевшие и слышавшие все то, что происходило перед ними, все с испуганно широко раскрытыми глазами и разинутыми ртами, напрягая все свои силы, удерживали на своих спинах напор задних.
– Бей его!.. Пускай погибнет изменник и не срамит имя русского! – закричал Растопчин. – Руби! Я приказываю! – Услыхав не слова, но гневные звуки голоса Растопчина, толпа застонала и надвинулась, но опять остановилась.
– Граф!.. – проговорил среди опять наступившей минутной тишины робкий и вместе театральный голос Верещагина. – Граф, один бог над нами… – сказал Верещагин, подняв голову, и опять налилась кровью толстая жила на его тонкой шее, и краска быстро выступила и сбежала с его лица. Он не договорил того, что хотел сказать.
– Руби его! Я приказываю!.. – прокричал Растопчин, вдруг побледнев так же, как Верещагин.
– Сабли вон! – крикнул офицер драгунам, сам вынимая саблю.
Другая еще сильнейшая волна взмыла по народу, и, добежав до передних рядов, волна эта сдвинула переднии, шатая, поднесла к самым ступеням крыльца. Высокий малый, с окаменелым выражением лица и с остановившейся поднятой рукой, стоял рядом с Верещагиным.
– Руби! – прошептал почти офицер драгунам, и один из солдат вдруг с исказившимся злобой лицом ударил Верещагина тупым палашом по голове.
«А!» – коротко и удивленно вскрикнул Верещагин, испуганно оглядываясь и как будто не понимая, зачем это было с ним сделано. Такой же стон удивления и ужаса пробежал по толпе.
«О господи!» – послышалось чье то печальное восклицание.
Но вслед за восклицанием удивления, вырвавшимся У Верещагина, он жалобно вскрикнул от боли, и этот крик погубил его. Та натянутая до высшей степени преграда человеческого чувства, которая держала еще толпу, прорвалось мгновенно. Преступление было начато, необходимо было довершить его. Жалобный стон упрека был заглушен грозным и гневным ревом толпы. Как последний седьмой вал, разбивающий корабли, взмыла из задних рядов эта последняя неудержимая волна, донеслась до передних, сбила их и поглотила все. Ударивший драгун хотел повторить свой удар. Верещагин с криком ужаса, заслонясь руками, бросился к народу. Высокий малый, на которого он наткнулся, вцепился руками в тонкую шею Верещагина и с диким криком, с ним вместе, упал под ноги навалившегося ревущего народа.
Одни били и рвали Верещагина, другие высокого малого. И крики задавленных людей и тех, которые старались спасти высокого малого, только возбуждали ярость толпы. Долго драгуны не могли освободить окровавленного, до полусмерти избитого фабричного. И долго, несмотря на всю горячечную поспешность, с которою толпа старалась довершить раз начатое дело, те люди, которые били, душили и рвали Верещагина, не могли убить его; но толпа давила их со всех сторон, с ними в середине, как одна масса, колыхалась из стороны в сторону и не давала им возможности ни добить, ни бросить его.

wiki-org.ru

Среднеквадратическое отклонение — это… Что такое Среднеквадратическое отклонение?

Среднеквадрати́ческое отклоне́ние (синонимы: среднеквадрати́чное отклоне́ние, квадрати́чное отклоне́ние; близкие термины: станда́ртное отклоне́ние, станда́ртный разбро́с) — в теории вероятностей и статистике наиболее распространённый показатель рассеивания значений случайной величины относительно её математического ожидания.

Основные сведения

Измеряется в единицах измерения самой случайной величины. Равно корню квадратному из дисперсии случайной величины. Среднеквадратическое отклонение используют при расчёте стандартной ошибки среднего арифметического, при построении доверительных интервалов, при статистической проверке гипотез, при измерении линейной взаимосвязи между случайными величинами.

Среднеквадратическое отклонение:

Стандартное отклонение (оценка среднеквадратического отклонения случайной величины Пол, стены вокруг нас и потолок,x относительно её математического ожидания на основе несмещённой оценки её дисперсии):

где  — дисперсия;  — Пол, стены вокруг нас и потолок,i-й элемент выборки;  — объём выборки;  — среднее арифметическое выборки:

Следует отметить, что обе оценки являются смещёнными. В общем случае несмещённую оценку построить невозможно. Однако оценка на основе оценки несмещённой дисперсии является состоятельной[1].

Правило трёх сигм

Правило трёх сигм () — практически все значения нормально распределённой случайной величины лежат в интервале . Более строго — не менее чем с 99,7 % достоверностью значение нормально распределенной случайной величины лежит в указанном интервале (при условии, что величина истинная, а не полученная в результате обработки выборки).

Если же истинная величина неизвестна, то следует пользоваться не , а Пол, стены вокруг нас и потолок,s. Таким образом, правило трёх сигм преобразуется в правило трёх Пол, стены вокруг нас и потолок,s.

Интерпретация величины среднеквадратического отклонения

Большое значение среднеквадратического отклонения показывает большой разброс значений в представленном множестве со средней величиной множества; маленькое значение, соответственно, показывает, что значения в множестве сгруппированы вокруг среднего значения.

Например, у нас есть три числовых множества: {0, 0, 14, 14}, {0, 6, 8, 14} и {6, 6, 8, 8}. У всех трёх множеств средние значения равны 7, а среднеквадратические отклонения, соответственно, равны 7, 5 и 1. У последнего множества среднеквадратическое отклонение маленькое, так как значения в множестве сгруппированы вокруг среднего значения; у первого множества самое большое значение среднеквадратического отклонения — значения внутри множества сильно расходятся со средним значением.

В общем смысле среднеквадратическое отклонение можно считать мерой неопределенности. К примеру, в физике среднеквадратическое отклонение используется для определения погрешности серии последовательных измерений какой-либо величины. Это значение очень важно для определения правдоподобности изучаемого явления в сравнении с предсказанным теорией значением: если среднее значение измерений сильно отличается от предсказанных теорией значений (большое значение среднеквадратического отклонения), то полученные значения или метод их получения следует перепроверить.

Практическое применение

На практике среднеквадратическое отклонение позволяет определить, насколько значения в множестве могут отличаться от среднего значения.

Климат

Предположим, существуют два города с одинаковой средней максимальной дневной температурой, но один расположен на побережье, а другой внутри континента. Известно, что в городах, расположенных на побережье, множество различных максимальных дневных температур меньше, чем у городов, расположенных внутри континента. Поэтому среднеквадратическое отклонение максимальных дневных температур у прибрежного города будет меньше, чем у второго города, несмотря на то, что среднее значение этой величины у них одинаковое, что на практике означает, что вероятность того, что максимальная температура воздуха каждого конкретного дня в году будет сильнее отличаться от среднего значения, выше у города, расположенного внутри континента.

Спорт

Предположим, что есть несколько футбольных команд, которые оцениваются по некоторому набору параметров, например, количеству забитых и пропущенных голов, голевых моментов и т. п. Наиболее вероятно, что лучшая в этой группе команда будет иметь лучшие значения по большему количеству параметров. Чем меньше у команды среднеквадратическое отклонение по каждому из представленных параметров, тем предсказуемее является результат команды, такие команды являются сбалансированными. С другой стороны, у команды с большим значением среднеквадратического отклонения сложно предсказать результат, что в свою очередь объясняется дисбалансом, например, сильной защитой, но слабым нападением.

Использование среднеквадратического отклонения параметров команды позволяет в той или иной мере предсказать результат матча двух команд, оценивая сильные и слабые стороны команд, а значит, и выбираемых способов борьбы.

Технический анализ

В техническом анализе среднеквадратическое отклонение используется для построения линий Боллинджера.

См. также

Литература

* Боровиков, В. STATISTICA. Искусство анализа данных на компьютере: Для профессионалов / В. Боровиков. — СПб.: Питер, 2003. — 688 с. — ISBN 5-272-00078-1.

  1. Обе вышеупомянутые оценки — состоятельные
Столбчатая диаграмма · Совмещённая диаграмма · Диаграмма управления · Лесная диаграмма · Гистограмма · Q-Q диаграмма · Диаграмма выполнения · Диаграмма разброса · Стебель-листья · Ящик с усами

dic.academic.ru

Оценка дисперсии, среднеквадратичное отклонение. — КиберПедия

Оценка дисперсии (S2) и среднеквадратичного отклонения (S) производится по формулам:

Выборочная дисперсия (S2) определяется по формуле:

Где:

— объем выборки;

mi– частота встречаемости значения признака хi;

Хiслучайные (текущие) величины;

среднее значение случайных величин по выборке, рассчитывается по формуле:

Итак, дисперсия — это средний квадрат отклонений. То есть вначале рассчитывается среднее значение, затем берется разница между каждым исходным и средним значением, возводится в квадрат, складывается и затем делится на количество значений в данной совокупности.

Разница между отдельным значением и средней отражает меру отклонения. В квадрат возводится для того, чтобы все отклонения стали исключительно положительными числами и чтобы избежать взаимоуничтожения положительных и отрицательных отклонений при их суммировании. Затем, имея квадраты отклонений, мы просто рассчитываем среднюю арифметическую.

Разгадка магического слова «дисперсия» заключается всего в этих трех словах: средний – квадрат – отклонений.

Среднее квадратичное отклонение (СКО)

Извлекая из дисперсии квадратный корень, получаем, так называемое «среднеквадратичное отклонение». Встречаются названия «стандартное отклонение» или «сигма» (от названия греческой буквыσ.). Формула среднего квадратичного отклонения имеет вид:

.

Итак, дисперсия – это сигма в квадрате, или – среднее квадратичное отклонение в квадрате.

Среднеквадратичное отклонение, очевидно, также характеризует меру рассеивания данных, но теперь (в отличие от дисперсии) его можно сравнивать с исходными данными, так как единицы измерения у них одинаковые (это явствует из формулы расчета). Размах вариации – это разница между крайними значениями. Среднеквадратичное отклонение, как мера неопределенности, также участвует во многих статистических расчетах. С ее помощью устанавливают степень точности различных оценок и прогнозов. Если вариация очень большая, то стандартное отклонение тоже получится большим, следовательно, и прогноз будет неточным, что выразится, к примеру, в очень широких доверительных интервалах.

Поэтому в методах статистической обработки данных в оценках объектов недвижимости в зависимости от необходимой точности поставленной задачи используют правило двух или трех сигм.

Для сравнения правила двух сигм и правила трех сигм используем формулу Лапласа:

Ф— Ф,

где Ф(x) – функция Лапласа;



= минимальное значение

β = максимальное значение

s = значение сигмы (среднее квадратичное отклонение)

a = среднее значение

Правило двух сигм

Почти достоверно (с доверительной вероятностью 0,954) можно утверждать, что все значения случайной величины X с нормальным законом распределения отклоняются от ее математического ожидания M(X) = a на величину, не большую 2s (двух средних квадратических отклонений). Доверительной вероятностью (Pд) называют вероятность событий, которые условно принимаются за достоверные (их вероятность близка к 1).

Проиллюстрируем правило двух сигм геометрически. На рис. 6 изображена кривая Гаусса с центром распределения а. Площадь, ограниченная всей кривой и осью Оx, равна 1 (100%), а площадь криволинейной трапеции между абсциссами а–2s и а+2s, согласно правилу двух сигм, равна 0,954 (95,4% от всей площади). Площадь заштрихованных участков равна 1-0,954 = 0,046 (»5% от всей площади). Эти участки называют критической областью значений случайной величины. Значения случайной величины, попадающие в критическую область, маловероятны и на практике условно принимаются за невозможные.

 

Вероятность условно невозможных значений называют уровнем значимости случайной величины. Уровень значимости связан с доверительной вероятностью формулой:

= 1-,

где q – уровень значимости, выраженный в процентах.

Правило трех сигм

При решении вопросов, требующих большей надежности, когда доверительную вероятность (Pд) принимают равной 0,997 (точнее — 0,9973), вместо правила двух сигм, согласно формуле (3), используют правило трех сигм.



Согласно правилу трех сигм при доверительной вероятности 0,9973 критической областью будет область значений признака вне интервала (а-3s, а+3s). Уровень значимости составляет 0,27%.

Другими словами, вероятность того, что абсолютная величина отклонения превысит утроенное среднее квадратическое отклонение, очень мала, а именно равна 0,0027=1-0,9973. Это означает, что лишь в 0,27% случаев так может произойти. Такие события, исходя из принципа невозможности маловероятных событий, можно считать практически невозможными. Т.е. выборка высокоточная.

В этом и состоит сущность правила трех сигм:

Если случайная величина распределена нормально, то абсолютная величина ее отклонения от математического ожидания не превосходит утроенного среднего квадратического отклонения (СКО).

На практике правило трех сигм применяют так: если распределение изучаемой случайной величины неизвестно, но условие, указанное в приведенном правиле, выполняется, то есть основание предполагать, что изучаемая величина распределена нормально; в противном случае она не распределена нормально.

Уровень значимости принимают в зависимости от дозволенной степени риска и поставленной задачи. Для оценки недвижимости обычно принимается менее точная выборка, следуя правилу двух сигм.

cyberpedia.su

2. Нормальный закон распределения. Дисперсия. Ско.

  1. Закон и плотность распределения случайной величины. Показатели формы распределения.

Определение случайной величины. Многие случайные события могут быть оценены количественно как случайные величины. Случайной называют такую величину, которая принимает значения в зависимости от стечения случайных обстоятельств. Различают дискретные и непрерывные случайные величины.

Распределение дискретной случайной величины. Дискретная величина считается заданной, если указаны возможные ее значения и соответствующие им вероятности. Обозначим дискретную случайную величину х, ее значения х1, х2…, в вероятности: Р (х1) =р2, Р (х2) = р2 и т. д.

Совокупность х и Р называется распределением дискретной случайной величины.

Так как все возможные значения дискретной случайной величины представляют полную систему, то сумма вероятностей равна единице:

Здесь предполагается, что дискретная случайная величина имеет n значений. Выражение называется условием нормировки.

Во многих случаях наряду с распределением случайной величины или вместо него информацию об этих величинах могут дать числовые параметры, получившие название числовых характеристик случайной величины. Наиболее употребительные из них: 1) математическое ожидание (среднее значение) случайной величины есть сумма произведений всех возможных ее значений на вероятности этих значений;

2) дисперсией случайной величины называют математическое ожидание квадрата отклонения случайной величины от ее математического ожидания.

Для непрерывной случайной величины математическое ожидание и дисперсия записываются в виде:

где f(x) – плотность вероятности или функция распределения вероятностей. Она показывает, как изменяется вероятность отнесения к интервалу dx случайной величины в зависимости от значения самой этой величины. Нормальный закон распределения. В теориях вероятностей и математической статистики, в различных приложениях важную роль играет нормальный закон распределения (закон Гаусса). Случайная величина распределена по этому закону, если плотность ее вероятности имеет вид:

где а = М(х) – математическое ожидание случайной величины;

σ – среднее квадратное отклонение; следовательно;

σ2– дисперсия случайной величины. Кривая нормального закона распределения имеет колоколообразную форму, симметричную относительно прямой х = а (центр рассеивания).

Формы распределения.

Любое реальное распределение можно изобразить схематически в виде кривой, воспроизводящей основные особенности данного распределения. Под кривой распределения понимается графическое изображение в виде непрерывной линии изменения частот, функционально связанных с изменением вариант.

Элементами распределения являются:

варианта

частота

В зависимости от вида кривых, изображающих распределение, выделяют несколько основных типов распределения:

одновершинные

многовершинные

К одновершинным относятся те, в которых один, обычно центральный вариант, имеет наибольшую частоту (плотность распределения). Частоты же остальных вариантов убывают по мере удаления от центрального.

Если частоты убывают слева и справа от центрального значения одинаково, то такие распределения называются симметричными.

Если частоты убывают слева и справа от центра распределения с разной скоростью, то такие распределения называют асимметричными.

Многовершинные распределения — это распределения, в которых несколько центров, т. е. такие, у которых несколько максимумов частот.

Для однородных совокупностей, как правило, характерны одновершинные распределения.

Многовершинность распределения свидетельствует о неоднородности изучаемого явления. В этом случае необходимо произвести перегруппировку данных с целью выделения более однородных групп.

Выяснение общего характера распределения предполагает, наряду с оценкой его однородности, вычисление показателей асимметрии и эксцесса.

Кривые распределения бывают:

симметричными

асимметричными.

В зависимости от того, какая ветвь кривой распределения вытянута, различают:

правостороннюю асимметрию

левостороннюю асимметрию.

Для характеристики степени асимметрии двух или нескольких рядов пользуются коэффициентом асимметрии.

Для одновершинных распределений:

Более точным является коэффициент асимметрии, рассчитанный как отношение центрального момента третьего порядка (μ3) к среднеквадратическому отклонению в 3-й степени (Ϭ3):

  1. Для симметричного распределения:

Соответственно, в симметричном распределении центральный момент 3-го порядка равен нулю (μ3=0), т. е. алгебраическая сумма отклонений отдельных значений признака (вариант), расположенных слева и справа от средней, равна нулю. График симметричного распределения симметричен относительно точки максимума.

Для несимметричных распределений центральные моменты нечетного порядка отличны от нуля:

2. Асимметрия положительна (As>0), если длинная часть кривой распределения расположена справа от моды (Мо). В этом случае соотношение между средней, медианой и модой нарушено:

As< 0.25 – слабая асимметрия

As= 0.25-0.5 – умеренная асимметрия

As> 0.5 – крайне асимметричное распределение

Для оценки «крутизны» (островершинности) распределения пользуются характеристикой – эксцессом.

Коэффициент эксцесса:

  1. Для нормального распределения:

  1. Выше нормального (островершинное распределение):

  1. Ниже нормального (плосковершинное распределение):

Дисперсия — средний квадрат отклонений индивидуальных значений признака от их средней величины.

Существует закон, связывающий три вида дисперсии. Общая дисперсия равна сумме средней из внутригрупповых и межгрупповых дисперсий:

Данное соотношение называют правилом сложения дисперсий. Согласно этому правилу, общая дисперсия, возникающая под действием всех факторов, равна сумме дисперсии, возникающей за счет группировочного признака.

Зная любые два вида дисперсий, можно определить или проверить правильность расчета третьего вида.

Правило сложения дисперсий широко применяется при исчислении показателей тесноты связей, в дисперсионном анализе, при оценке точности типической выборки и в ряде других случаев.

Свойства дисперсии:

1. Дисперсия постоянной величины равна нулю.

2. Уменьшение всех значений признака на одну и ту же величину А не меняет величины дисперсии. Значит средний квадрат отклонений можно вычислить не по заданным значениям признака, а по отклонениям их от какого-то постоянного числа.

3. Уменьшение всех значений признака в k раз уменьшает дисперсию в k2 раз, а среднее квадратическое отклонение — к раз. Значит, все значения признака можно разделить на какое-то постоянное число (скажем, на величину интервала ряда), исчислить среднее квадратическое отклонение, а затем умножить его на постоянное число.

4. Если исчислить средний квадрат отклонений от любой величины А, то в той или иной степени отличающейся от средней арифметической (X~), то он всегда будет больше среднего квадрата отклонений, исчисленного от средней арифметической. Средний квадрат отклонений при этом будет больше на вполне определенную величину — на квадрат разности средней и этой условно взятой величины.

Внутригрупповая и межгрупповая дисперсия.

Выделяют дисперсию общую, межгрупповую и внутригрупповую. Общая дисперсия s2 измеряет вариацию признака во всей совокупности под влиянием всех факторов, обусловивших эту вариацию.

Межгрупповая дисперсия (s2x) характеризует систематическую вариацию, т.е. различия в величине изучаемого признака, возникающие под влиянием признака-фактора, положенного в основание группировки.

Внутригрупповая дисперсия (s2i) отражает случайную вариацию, т.е. часть вариации, происходящую под влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки.

3. Проверка данных на соответствие нормальному закону.

С этого начинаются практически все виды стат. Анализа

Наиболее используемый критерий Пирсона, Романовского, Колмогорова

Все 3 критерия основываются на сравнении эмпирических и теоретических частот.

Теоретические частоты вычисляются так:

  1. По исходным данным находят среднее (х ср) и СКО/дисперсию

  2. Для каждой варианты вычисляются нормированные величины Ти=(Хи-Хср)/СКО

  3. Находят значение нормальной функции фи(Ти)=1/корень2Пи*е в степени -Ти2/2

  4. Вычисляют теоретические частоты фти=фи(Ти)*Nhi/СКО (N– объем совокупности,hi–длина интервала)

  5. По пирсону: вычисляется хи2 =смм(фи-фти)2/фти на основе отклонения теоретических частот от эмпирических по таблице значений находится хи2крит для уровня значимости альфа=0,1 0,05 0,01

v– число степ свобод, к-число интервалов,v=к-3

уровень значимости альфа показывает вероятность принятия ошибочного решения

Сравнивая рачетные значения с критическими и получив хи2< хи2крит мы принимаем гипотезу вероятности с вероятностью Р=1-альфа

Критерий пирсона пригоден если –результаты наблюдений независимы, N>50, в каждом интервалеn>5

Критерий романовского также основан на расчете хи2

По этому критерию вычисляется величина С=|хи2-v|/корень 2Пи. Если С<3, то закон распределения эмпирических данных считается нормальным

Критерий согласия Колмогорова

Вычисляется величина Дмакс между накопленными эмпирическими и теоретическими частотами

Вычисляется лямда=Дмакс/кореньN

Находят вероятность Р(лямда) того, что исследуемые экспериментальные данные подчиняются нормальному закону распределения Р(лямда)принадлежит(0,1)

studfiles.net

Определение оценок среднеквадратического отклонения — МегаЛекции

 

Оценка S 2генеральной дисперсии σ2 любого закона распределения может быть вычислена (при неизвестном математическом ожидании генерального среднего) по формуле:

 

(17)

Эта оценка является несмещенной и состоятельной, а для нормального распределения — еще и эффективной.

Для нормального закона распределения оценка генерального среднеквадратического отклонения (СКО) S результатов наблюдений определяется:

 

(18)

Оценка является несмещенной, состоятельной и асимптотически эффективной только для нормального закона. В случае представления результатов вариационным рядом следует пользоваться формулой (5.3).

Несмещенная оценка СКО для нормальных распределений так же определяется по формуле:

(19)

 

(20)

Значения коэффициента Мкприведены в таблице 1

 

Таблица 1 — Значения коэффициента Мкв зависимости от количества наблюдений п

СКО случайной погрешности оценки центра распределения (СКО результата измерений) убывает по сравнению с СКО результата наблюдений

в как показано по формуле:

(21)

Определение оценок третьего центрального момента μ3 коэффициента асимметрии γa, СКО коэффициента асимметрии σa) проводится по формулам:

 

; (22)

(23)

(24)

 

Формулы для вычисления начальных akи центральных μkмоментов и соотношения между ними приведены в таблице 2.

Таблица 2 — Перечень формул

Выбор формул, приведенных во второй и третьей графах таблицы и дающих практически одинаковые результаты, осуществляют в зависимости от особенностей используемых средств вычислительной техники, алгоритмов и программ обработки информации.

Рассмотрим на примере последовательность определения оценок центра распределения. Даны результаты 20 измерений перемещения для точек пера лопатки компрессора под действием центробежной силы. Результаты наблюдения и частота их появления указаны в таблице 3.

 

Таблица 3 — Результаты наблюдений

Требуется определить оценки результата измерения и СКО результатов наблюдений и измерения.



Будем считать, что закон распределения не известен. В этом случае, как отмечалось раньше, за оценку центра распределения экспериментальных данных принимают медиану из ряда пяти оценок центров (расположенных в вариационный ряд).

Определяем оценку центра как:

· среднее арифметическое по формуле (4):

 

мкм;

среднее арифметическое 90 %-ной выборки определяем по
формуле (7). Пять процентов выборки в нашем случае 0,05 .n = 0,05 . 20 =1,
т. е. один результат измерения. Отбрасываем по одному измерению с концов
вариационного ряда, т. е. результаты x1 = 23,0 мкм и x20 = 23,7 мкм.

Тогда:

мкм;

· медиану распределения — по формуле (9). Поскольку n-четное, то

 

мкм

 

мкм;

 

· срединный размах определяем по формуле (15). Для этого вычисляем 25 % и 75 %-ные квантили опытного распределения. Этими квантилями являются точки между 4 и 5, а также между 16 и 17 результатами:

мкм; мкм.

Тогда:

 

мкм.

 

· центр размаха определяем по формуле (16):

 

мкм

 

мкм.

 

Полученные оценки центра распределения располагаем в вариационный ряд:

 

или

 

23,20 < 23,225 < 23,25 < 23,26 < 23,35 мкм.

 

За оценку центра распределения (результата измерения) окончательно принимаем среднее арифметическое 90 %-ной выборки, так как эта оценка занимает медианное положение в ряду оценок: мкм.

Оценку СКО результатов наблюдений вычисляем по формуле (17):

 

мкм.

 

Оценку СКО результатов измерений определяем по формуле (21):

 

мкм.

 

ПОРЯДОК выполнения работы

1 Изучить устройство и принцип работы дозиметра-радиометра АНРИ-01 “СОСНА”.

2 Получить допуск к проведению измерений.

3 Провести измерения удельной активности гамма-излучения в лаборатории (не менее 30 измерений).

4 Выполнить обработку результатов измерений по методике описанной в теоретической части работы.

5 Результаты измерений и результаты расчетов занести в таблицу

 

6 Сделать выводы.

 

Контрольные вопросы:

1. Дать определение точечной оценки.

2. Какую оценку называют несмещенной? эффективной? состоятельной?

3. Как определяется выборочное среднее?

4. Как определить несмещенную и состоятельную оценку математического ожидания генеральной совокупности?

5. Дать определение выборочной дисперсии. Каким свойством оценок она обладает?

6. Как определяются мода и медиана совокупности?

7. Понятие интервальной оценки неизвестного параметра генеральной совокупности.

8. Как найти интервальную оценку для генеральной средней нормально распределенной совокупности при известном среднем квадратическом отклонении?

9. Как найти интервальную оценку для генеральной средней нормально распределенной совокупности при неизвестном среднем квадратическом отклонении?

10. Каким образом определяется интервальная оценка среднего квадратического и дисперсии нормально распределенной генеральной совокупности?

Литература:

 

1 Сытько В.В. Теоретическая метрология. 1. Физические величины и их

измерение. Мн., — 1998.

2 Сергеев А.Г., Крохин В.В. Метрология: Учебное пособие для вузов. — М.:

Логос, 2001.

3 Маркин Н.С. Введение в метрологию. — М.: Издательство стандартов, 1991.

4 Тойберг П. Оценка точности результатов измерений. — М.: Энергоатомиздат,

1988.

5 Новицкий П.В., Зограф И.А. Оценка погрешностей результатов измерений.

— М.: Энергоатомиздат, 1990.

 


Рекомендуемые страницы:


Воспользуйтесь поиском по сайту:

megalektsii.ru

СТАНДАРТНОЕ (СРЕДНЕЕ КВАДРАТИЧЕСКОЕ) ОТКЛОНЕНИЕ — это… Что такое СТАНДАРТНОЕ (СРЕДНЕЕ КВАДРАТИЧЕСКОЕ) ОТКЛОНЕНИЕ?


СТАНДАРТНОЕ (СРЕДНЕЕ КВАДРАТИЧЕСКОЕ) ОТКЛОНЕНИЕ
— неотрицательное значение корня квадратного из дисперсии случайной величины, которое часто обозначают через а. С. о. есть характеристика рассеяния той же размерности, что и сама случайная величина. Выборочное С. о. есть где xi,…,xп выборка объема n, — выборочное среднее. С. о. используется весьма широко, является характеристикой устойчивости исследуемой случайной величины.

Геологический словарь: в 2-х томах. — М.: Недра. Под редакцией К. Н. Паффенгольца и др.. 1978.

  • СТАМПИЙСКИЙ ЯРУС
  • СТАНДАРТНЫЙ ОБЪЕМ

Смотреть что такое «СТАНДАРТНОЕ (СРЕДНЕЕ КВАДРАТИЧЕСКОЕ) ОТКЛОНЕНИЕ» в других словарях:

  • Стандартное (среднее квадратическое) отклонение результатов испытаний — Стандартное (среднее квадратическое) отклонение: мера рассеяния серий результатов испытаний относительно среднего значения равна положительному значению квадратного корня из дисперсии (оценивают по положительному значению квадратного корня из… …   Официальная терминология

  • Стандартное (среднее квадратическое) отклонение внутрилабораторной прецизионности — 3.10 Стандартное (среднее квадратическое) отклонение внутрилабораторной прецизионности: Среднее квадратическое отклонение результатов анализа полученных в условиях внутрилабораторной прецизионности (с учетом ГОСТ Р ИСО 5725 1). Источник …   Словарь-справочник терминов нормативно-технической документации

  • Среднее квадратическое отклонение — см. Стандартное отклонение …   Физическая Антропология. Иллюстрированный толковый словарь.

  • среднее квадратическое (стандартное) отклонение воспроизводимости — 3.17 среднее квадратическое (стандартное) отклонение воспроизводимости: Среднее квадратическое отклонение результатов анализа, полученных в условиях воспроизводимости (с учетом [1]). Источник …   Словарь-справочник терминов нормативно-технической документации

  • среднее квадратическое (стандартное) отклонение повторяемости — 3.15 среднее квадратическое (стандартное) отклонение повторяемости: Среднее квадратическое отклонение результатов единичного анализа, полученных по методике в условиях повторяемости (с учетом [1]). Источник …   Словарь-справочник терминов нормативно-технической документации

  • стандартное — 3.34 стандартное значение: Значение влияющего на прибор параметра (или параметра самого прибора), выбранное в качестве стандарта, когда значение влияющего на прибор параметра (или параметра самого прибора), при котором корректирующий коэффициент… …   Словарь-справочник терминов нормативно-технической документации

  • среднее — 3.3 среднее (mean): Среднее значение для (выбранного) времени усреднения результатов измерений анемометром. Источник: ГОСТ Р ИСО 1 …   Словарь-справочник терминов нормативно-технической документации

  • стандартное (среднеквадратическое) отклонение внутрилабораторной прецизионности — 3.1.10 стандартное (среднеквадратическое) отклонение внутрилабораторной прецизионности: Среднее квадратическое отклонение (СКО) результатов анализа получаемых в условиях внутрилабораторной прецизионности (по ГОСТ Р ИСО 5725 1). Источник: РД 52.24 …   Словарь-справочник терминов нормативно-технической документации

  • Стандартное отклонение — (σ или SD) показатель степени разброса отдельных индивидуальных наблюдений относительно этого среднего, то есть, мера внутригрупповой изменчивости данного признака. В качестве такого показателя для каждого из m признаков вычисляют дисперсию (s2) …   Физическая Антропология. Иллюстрированный толковый словарь.

  • МИ 2335-2003: Государственная система обеспечения единства измерений. Внутренний контроль качества результатов количественного химического анализа — Терминология МИ 2335 2003: Государственная система обеспечения единства измерений. Внутренний контроль качества результатов количественного химического анализа: 6.2.2 Алгоритм проведения контрольной процедуры для контроля внутрилабораторной… …   Словарь-справочник терминов нормативно-технической документации

dic.academic.ru