Каким свойством обладает дисперсия

Дисперсией (рассеянием) дискретной случайной величиныD(X) называют математическое ожидание квадрата отклонения случайной величины от ее математического ожидания
1 свойство. Дисперсия постоянной величины C равна нулю; D(C) = 0.
Доказательство. По определению дисперсии, D(C) = M{[C – M(C)]2}.
Из первого свойства математического ожидания D(C) = M[(C – C)2] = M(0) = 0.
2 свойство. Постоянный множитель можно выносить за знак дисперсии, возводя его в квадрат:
D(CX) = C2 D(X)
Доказательство. По определению дисперсии, D(CX) = M{[CX – M(CX)]2}
Из второго свойства математического ожидания D(CX)=M{[CX – CM(X)]2}= C2M{[X – M(X)]2}=C2D(X)
3 свойство. Дисперсия суммы двух независимых случайных величин равна сумме дисперсий этих величин:
D[X + Y ] = D[X] + D[Y ].
Доказательство. По формуле для вычисления дисперсии имеем
D(X + Y) = M[(X + Y )2] − [M(X + Y)]2
Раскрыв скобки и пользуясь свойствами математического ожидания суммы нескольких величин и произведения двух независимых случайных величин, получим
D(X + Y) = M[X2+ 2XY + Y2] − [M(X) + M(Y )]2 = M(X2) + 2M(X)M(Y) + M(Y2) − M2(X) − 2M(X)M(Y) − M2(Y) = {M(X2) − [M(X)]2}+{M(Y2) − [M(Y)]2} = D(X) + D(Y). Итак, D(X + Y) = D(X) + D(Y)
4 свойство. Дисперсия разности двух независимых случайных величин равна сумме их дисперсий:
D(X − Y) = D(X) + D(Y)
Доказательство. В силу третьего свойства D(X − Y) = D(X) + D(–Y). По второму свойству
D(X − Y) = D(X) + (–1)2 D(Y) или D(X − Y) = D(X) + D(Y)
Числовые характеристики систем случайных величин. Коэффициент корреляции, свойства коэффициента корреляции.
Корреляционный момент.Характеристикой зависимости между случайными величинами и служит математическое ожидание произведения отклонений и от их центров распределений (так иногда называют математическое ожидание случайной величины), которое называется корреляционным моментом или ковариацией:
Для вычисления корреляционного момента дискретных величин используют формулу:
а для непрерывных величин – формулу:
Коэффициентом корреляции rxy случайных величин X и Y называют отношение корреляционного момента к произведению среднеквадратичных отклонений величин:
– коэффициент корреляции;
Свойства коэффициента корреляции:
1. Если Х и У независимые случайные величины, то r =0;
2. -1≤ r ≤1 .При этом, если |r| =1, то между Х и У функциональная, а именно линейная зависимость;
3. r характеризует относительную величину отклонения М(ХУ) от М(Х)М(У), и т.к. отклонение имеет место только для зависимых величин, то rхарактеризует тесноту зависимости.
Линейная функция регрессии.
Рассмотрим двумерную случайную величину (X, Y), где X и У — зависимые случайные величины. Представим одну из величин как функцию другой. Ограничимся приближенным представлением (точное приближение, вообще говоря, невозможно) величины Y в виде линейной функции величины X:
где α и β — параметры, подлежащие определению.
Теорема. Линейная средняя квадратическая регрессия Y на X имеет вид
где mx=M(X), my=M(Y), σx=√D(X), σy=√D(Y), r=µxy/(σxσy)—коэффициент корреляции величин X и Y.
Коэффициент β=rσy/σx называют коэффициентом регрессии Y на X, а прямую
называют прямой среднеквадратической регрессии Y на X.
Неравенство Маркова.
Формулировка неравенства Маркова
Если среди значений случайной величины Х нет отрицательных, то вероятность того, что она примет какое-нибудь значение, превосходящее положительное число А, не больше дроби , т.е.
,
а вероятность того, что она примет какое-нибудь значение, не превосходящее положительного числа А, не меньше , т.е.
.
Неравенство Чебышева.
Неравенство Чебышева. Вероятность того, что отклонение случайной величины X от ее математического ожидания по абсолютной величине меньше положительного числа ε, не меньше, чем 1 −D[X]ε2
P(|X – M(X)| < ε) ≥ 1 –D(X)ε2
Доказательство. Так как события, состоящие в осуществлении неравенств
P(|X−M(X)| < ε) и P(|X – M(X)| ≥ε) противоположны, то сумма их вероятностей равна единице, т. е.
P(|X – M(X)| < ε) + P(|X – M(X)| ≥ ε) = 1.
Отсюда интересующая нас вероятность
P(|X – M(X)| < ε) = 1 − P(|X – M(X)| > ε).
Таким образом, задача сводится к вычислению вероятности P(|X –M(X)| ≥ ε).
Напишем выражение для дисперсии случайной величины X
D(X) = [x1 – M(x)]2p1 + [x2 – M(x)]2p2 + . . . + [xn – M(x)]2pn
Все слагаемые этой суммы неотрицательны. Отбросим те слагаемые, у которых |xi – M(X)| < ε (для оставшихся слагаемых |xj – M(X)| ≥ ε), вследствие чего сумма может только уменьшиться. Условимся считать для определенности, что отброшено k первых слагаемых (не нарушая общности, можно считать, что в таблице распределения возможные значения занумерованы именно в таком порядке). Таким образом,
D(X) ≥ [xk+1 – M(x)]2pk+1 + [xk+2 – M(x)]2pk+2 + . . . + [xn – M(x)]2pn
Обе части неравенства |xj –M(X)| ≥ ε (j = k+1, k+2, . . ., n) положительны, поэтому, возведя их в квадрат, получим равносильное неравенство |xj – M(X)|2 ≥ε2.Заменяя в оставшейся сумме каждый из множителей
|xj – M(X)|2числом ε2(при этом неравенство может лишь усилиться), получим
D(X) ≥ ε2(pk+1 + pk+2 + . . . + pn)
По теореме сложения, сумма вероятностей pk+1+pk+2+. . .+pn есть вероятность того, что X примет одно, безразлично какое, из значений xk+1 +xk+2 +. . .+xn, а при любом из них отклонение удовлетворяет неравенству |xj – M(X)| ≥ ε. Отсюда следует, что сумма pk+1 + pk+2 + . . . + pn выражает вероятность
P(|X – M(X)| ≥ ε).
Это позволяет переписать неравенство для D(X) так
D(X) ≥ ε2P(|X – M(X)| ≥ ε)
или
P(|X – M(X)|≥ ε) ≤D(X)/ε2
Окончательно получим
P(|X – M(X)| < ε) ≥D(X)/ε2
Теорема Чебышева.
Теорема Чебышева. Если — попарно независимые случайные величины, причем дисперсии их равномерно ограничены (не превышают постоянного числа С), то, как бы мало ни было положительное число ε, вероятность неравенства
будет как угодно близка к единице, если число случайных величин достаточно велико.
Другими словами, в условиях теоремы
Доказательство. Введем в рассмотрение новую случайную величину — среднее арифметическое случайных величин
Найдем математическое ожидание Х. Пользуясь свойствами математического ожидания (постоянный множитель можно вынести за знак математического ожидания, математическое ожидание суммы равно сумме математических ожиданий слагаемых), получим
(1) |
Применяя к величине Х неравенство Чебышева, имеем
или, учитывая соотношение (1)
Пользуясь свойствами дисперсии (постоянный множитель можно вынести за знак дисперсии, возведя его в квадрат; дисперсия суммы независимых случайных величин равна сумме дисперсий слагаемых), получим
По условию дисперсии всех случайных величин ограничены постоянным числом С, т.е. имеют место неравенства:
поэтому
Итак,
(2) |
Подставляя правую часть (2) в неравенство (1) (отчего последнее может быть лишь усилено), имеем
Отсюда, переходя к пределу при n→∞, получим
Наконец, учитывая, что вероятность не может превышать единицу, окончательно можем написать
Теорема доказана.
Теорема Бернулли.
Теорема Бернулли. Если в каждом из n независимых испытаний вероятность p появления события A постоянна, то как угодно близка к единице вероятность того, что отклонение относительной частоты от вероятности p по абсолютной величине будет сколь угодно малым, если число испытаний достаточно велико.
Другими словами, если ε — сколь угодно малое положительное число, то при соблюдении условий теоремы имеет место равенство
Доказательство. Обозначим через X1 дискретную случайную величину — число появлений события в первом испытании, через X2 — во втором, …, Xn — в n-м испытании. Ясно, что каждая из величин может принять лишь два значения: 1 (событие A наступило) с вероятностью p и 0 (событие не появилось) с вероятностью .
Можно ли применить к рассматриваемым величинам теорему Чебышева? Можно, если случайные величины попарно независимы и дисперсии их ограничены. Оба условия выполняются Действительно, попарная независимость величин следует из того, что испытания независимы. Дисперсия любой величины равна произведению ; так как , то произведение не превышает 1/4и, следовательно, дисперсии всех величин ограничены, например, числом .
Применяя теорему Чебышева (частный случай) к рассматриваемым величинам, имеем
Приняв во внимание, что математическое ожидание a каждой из величин (т.е. математическое ожидание числа появлений события в одном испытании) равно вероятности p наступления события, получим
Остается показать, что дробь
равна относительной частоте появлений события A в испытаниях. Действительно, каждая из величин при появлении события в соответствующем испытании принимает значение, равное единице; следовательно, сумма равна числу появлений события в испытаниях, а значит,
Учитывая это равенство, окончательно получим
Источник
Содержание:
- Пример с решением
- Пример 1.
- Пример 2.
- Пример 3.
- Пример 4.
- Пример 5.
- Пример 6.
- Пример 7.
- Пример 8.
- Пример 9.
- Пример 10.
- Пример 11.
- Пример 12.
Разность называется отклонением случайной величины А от ее математического ожидания М(Х). Математическое ожидание отклонения равно нулю:
Дисперсией, или рассеянием, случайной величины X называется математическое ожидание квадрата ее отклонения:
Из определения и свойств математического ожидания следует, чтс дисперсия любой случайной величины неотрицательна, т.е.
Для вычисления дисперсии применяется формула
По этой ссылке вы найдёте полный курс лекций по теории вероятности:
Дисперсия случайной величины обладает следующими свойствами:
1. Дисперсия постоянной величины равна нулю:
2. Постоянный множитель можно выносить за знак дисперсии, возводя его в квадрат:
4. Дисперсия суммы двух независимых случайных величин равна сумме их дисперсий:
5. Дисперсия разности двух независимых случайных величин равна сумме их дисперсий:
Возможно вам будут полезны данные страницы:
Замечание.
Свойство 3 распространяется на п независимых случайных величин:
Дисперсия дискретной случайной величины с законом распределения
определяется формулой
или формулой
где
– другое обозначение для математического ожидания. Этим обозначением будем пользоваться и в дальнейшем, в зависимости от обстоятельств.
Если дискретная случайная величина принимает бесконечную по-следовательность-значений с законом распределения
то ее дисперсия определяется формулой
при условии, что этот ряд сходится.
Дисперсия непрерывной случайной величины X, все значения которой принадлежат отрезку определяется формулой
где р(х) – плотность распределения вероятностей этой величины, – ее математическое ожидание.
Дисперсию можно вычислять по формуле
Дисперсия непрерывной случайной величины X, все значения которой принадлежат отрезку , определяется формулой
если этот несобственный интеграл сходится.абсолютно.
Средним квадратическим отклонением, или стандартным отклонением, случайной величины X называется корень квадратный из ее дисперсии:
Это определение имеет смысл, поскольку выполнено условие (2.5.3).
Пример с решением
Пример 1.
Доказать формулы (2.5.1) и (2.5.4).
Решение:
Так как математическое ожидание М(Х) – постоянная величина, математическое ожидание постоянной равно этой постоянной, математическое ожидание разности случайных величин равно разности их математических ожиданий, то
равенство (2.5.1) доказано.
Учитывая свойства математического ожидания, получаем
равенство (2.5.4) доказано.
Пример 2.
Доказать равенства (2.5.5) – (2.5.8).
Решение:
Принимая во внимание определение дисперсии и тот факт, что математическое ожидание постоянной равно этой постоянной, получаем
Из определения дисперсии и свойств математического ожидания следует, что
Для доказательства формулы (2.5.8) воспользуемся формулой (2.5.4):
Равенство (2.5.8) следует из формул (2.5.6) и (2.5.7):
Пример 3.
Дискретная случайная величина X имеет закон распределения
Найти дисперсию и среднее квадратическое отклонение случайной величины X.
Решение:
По формуле (2.4.3) находим
Запишем закон распределения квадрата отклонения этой величины, т.е. величины
По формуле (2.5.10) получаем
В соответствии с формулой (2.5.16) находим среднее квадратическое отклонение
Замечание. Дисперсию можно вычислить и по формуле (2.5.4). Найдем для этого математическое ожидание квадрата случайной величины X, предварительно записав закон распределения случайной величины X2;
По формуле (2.4.3) находим
В соответствии с формулой (2.5.4) находим
Пример 4.
Закон распределения дискретной случайной величины X задан таблицей
Вычислить дисперсию случайной величины X по формуле (2.5.4) и по формуле (2.5.10).
Решение:
Сначала найдем математическое ожидание случайной величины^:
Запишем закон распределения случайной величины
и найдем дисперсию случайной величины Xпо формуле (2.5.10):
Квадрат случайной величины X, т.е. X2 – это новая случайная величина, которая с теми же вероятностями, что и случайная величина X, принимает значения, равные квадратам ее значений.
Квадраты значений случайной величины X равны: ,, т.е. величина принимает значения Закон распределения случайной величины X2 можно записать в виде:
Вероятность 0,4 для значения получена по теореме сложения вероятностей, с которыми случайная величина X принимает значения -1 и 1. Аналогично получена вероятность 0,2 для значения
По формуле (2.4.3) находим
Следовательно, по формуле (2.5.4) имеем
Пример 5.
Симметричная монета подбрасывается 4 раза. Случайная величина X- “число выпадений герба при этих подбрасываниях”. Найти числовые характеристики случайной величины
Решение:
Данная дискретная случайная величина X может принимать пять значений: .
Закон распределения случайной величины X можно задать таблицей Находим математическое ожидание
Закон распределения случайной величины имеет вид:
Вычислим дисперсию и среднее квадратическое отклонение :
Пример 6.
Найти дисперсию дискретной случайной величины X -числа очков, выпадающих при подбрасывании игрального кубика.
Решение:
Запишем сначала закон распределения этой случайной величины в виде таблицы
Найдем математические ожидания :
Дисперсию вычислим по формуле (2.5.4):
Пример 7.
Даны все возможные значения дискретной случайной величины а также известны Найти закон распределения случайной величины X
Решение:
Запишем законы распределения дискретных случайных величин X и X2.
где пока неизвестны, причем Используя условие, получаем систему двух уравнений с тремя неиз-вестными
Поскольку то система уравнений принимает вид
откуда . Поэтому
Итак, закон распределения случайной величины X определяется таблицей
Пример 8.
Дискретная случайная величина X может принимать только два значения , причем . Известны вероятность математическое ожидание и дисперсия Найти закон распределения дискретной случайной вели-чиньгЛ.
Решение:
Поскольку (см. формулу (2.1.2)) и то откуда . По формуле (2.5.12) находим
Решая систему уравнений
и учитывая условие получаем Следовательно,
Пример 9.
Найти числовые характеристики непрерывной случайной величины X, заданной плотностью распределения
Решение:
Сначала находим М(Х) по формуле (2.4.7):
В соответствии с формулой (2.5.13) найдем D(X) :
По формуле (2.5.16) находим
Пример 10.
Найти числовые характеристики непрерывной случайной величины X, заданной плотностью вероятностей
Решение:
С помощью формулы (2.4.7) находим математическое ожидание:
По формулам (2.5.13) и (2.5.16) соответственно получаем
Пример 11.
Случайная величина X задана функцией распределения
Найти числовые характеристики случайной величины
Решение:
Сначала найдем плотность распределения р(х) с помощью формулы (2.3.5). Так как , то
По формуле (2.4.7) вычисляем математическое ожидание:
В соответствии с формулами (2.5.13) и (2.5.16) находим дисперсию и среднее квадратическое отклонение:
Пример 12.
Независимые случайные величины имеют одинаковые распределения, для них
при Найти числовые характеристики среднего арифметического этих случайных величин, т.е. случайной величины
Решение:
С учетом формулы (2.4.13) и условия (I) находим
т.е. математическое ожидание среднего арифметического п независимых одинаково распределенных случайных величин равно математическому ожиданию каждой из этих величин.
Учитывая формулы (2.5.6), (2.5.9) и условие (I), получаем
т.е. дисперсия среднего арифметического п независимых одинаково распределенных случайных величин в л раз меньше дисперсии каждой из этих величин.
Учитывая определение и условие (I), находим
Таким образом, среднее квадратическое отклонение среднего арифметического n независимых одинаково распределенных случайных величин в раз меньше среднего квадратического отклонения каждой величины.
Источник
В различных научных дисциплинах словосочетание «дисперсия это» характеризует мало схожие понятия. С латыни «dispersio» переводится как «рассеяние».
В физике, например, означает связь фазовой скорости волны с частотой. В химии описывает несмешиваемые субстанции. В биологии – многообразие признаков популяции.
В данной статье речь пойдет о математической трактовке. Рассматривается как одно из свойств случайных величин.
Что такое дисперсия в статистике
Статистика, в частности, оперирует рядами данных, характеризующих какой-либо признак, явление. Интересует их изменение.
Вариация представляет собой отличие величин одинакового показателя у разных предметов. Ее изучение позволит понять причины отклонений от нормы, анализировать их и в какой-то мере прогнозировать. Также станет возможным выявить факторы, влияющие на значения, отсеяв случайные.
Характеристики равномерного распределения представлены на картинке:
При значительном объеме статистики, средняя величина очевидно близка к нормальной. Об этом говорят и законы распределения. Отклонения от нее будут являться объективной характеристикой.
Только вот отрицательные значения этих разбросов будут сбивать с толку при расчетах, погашая положительные. А оставлять лишь модули – для математика не корректно. Напрашивается возвести в четную степень, а именно – во вторую.
Решение оказалось не только удобным. Оно открыло бо́льшие возможности в изучении отклонений. А важны именно они, поскольку сама по себе средняя мало что дает.
В качестве одного из важных показателей вариации, вводится понятие «дисперсия» – усредненный квадрат отклонений численных значений каких-либо событий от средней величины.
Кратко записывается D[X] в русскоязычных источниках и Var[X] (от «variance») в английских. В статистических выкладках используется σ2.
Никакого наглядного смысла величина не несет. Другое дело, среднее квадратическое отклонение – корень квадратный из дисперсии.
Виды дисперсии дискретной случайной величины
Для анализа данных цифр в таком виде недостаточно. Гораздо больше можно выжать из последовательности, если разбить ее на группы по определенному признаку.
Общая дисперсия
Как можно заметить, вычисленная по приведенному выше определению величина характеризует отклонения в целом. Без учета определяющих вариацию факторов. Вернее, с учетом всех, включая совершенно случайные. Поэтому и называется «общей» и рассчитывается по формулам, указанным ниже.
Простая дисперсия, без разделения на группы:
Или в несколько преобразованном виде:
Взвешенная дисперсия, для вариационного ряда:
где xi – значение из ряда;
fi – частота, количество повторений;
k – групп;
n – число вариантов.
Черта сверху указывает на среднюю величину.
Межгрупповая дисперсия
Характеризует систематическое отклонение, возникающее из-за фактора, по которому производилось выделение признаков в группы. Поэтому также называется «факторной».
Как найти данную дисперсию? По формуле:
где k – количество групп;
nj – элементов в группе с индексом j.
Внутригрупповая дисперсия
Возникает по хаотичной причине, не связанной с причиной сделанной выборки. Неучтенный фактор. Еще обозначается как «остаточная».
Например, рассматривается количество выпущенных деталей за месяц каждым фрезеровщиком цеха.
В качестве критерия отбора в группу выбираем возраст оборудования. Он-то и не будет влиять на производительность внутри подборки: там станки у всех практически одинаковые.
Если вычислить среднюю величину от всех групповых,
то получим характеристику случайного разброса. Иными словами, составляющую вариации, зависящую от чего угодно, кроме фактора отбора.
Взаимосвязь
В соответствии с правилом сложения, общая D[X] включает средние выражения остаточной и факторной. И это логично, поскольку учитывает и случайное изменение в группе, и систематическое в факторной.
Свойства дисперсии
Опишем основные:
Если последовательность состоит из одинаковых чисел, то D[X] будет нулевой.
Уменьшение всех значений на постоянную величину на дисперсию не влияет. Иначе говоря, рассчитать σ2 можно по отклонениям от фиксированного числа.
Уменьшение всех цифр в k раз приведет к падению D[X] в k2 раз. Можно, например, иметь в виду значения в метрах, а результат вычислить в футах. Достаточно учесть один раз то, на что следует умножить.
Средний квадрат отклонений от постоянной величины X отличается в большую сторону от того же с использованием среднего значения. Разница составит (Xcр – X)2.
Показатели вариаций
Кроме размаха (разницы максимального и минимального значений), среднего линейного и дисперсии, изменения описываются коэффициентом вариации:
Оценить масштаб разброса проще по относительной величине. Тем более, что измеряются в одних единицах.
Пример расчета дисперсии
Компания объявила конкурсный отбор для приема сотрудников. В качестве критерия принят стаж работы по специальности. Приведем исходные данные и расчеты.
Усредненный стаж:
Дисперсия:
По альтернативной формуле:
Среднеквадратическое:
Коэффициент вариации:
Заключение
Статистика оперирует значительными объемами данных. Вариация, как одно из основных понятий – не исключение. И дисперсия в качестве основной характеристики.
Для упрощения расчетов существует масса онлайн калькуляторов. Имеется упомянутый инструмент в MS Excel.
Источник