Варијанса

Извор: testwiki
Пређи на навигацију Пређи на претрагу
Пример узорака из две популације са истом средњом вредношћу, али различитим варијацијама. Црвена популација има средњу вредност 100 и варијансу 100 (-{SD=10}-), док плава популација има средњу вредност 100 и варијансу 2500 (-{SD=50}-).

Дисперзија или варијанса је појам из теорије вероватноће и статистике. Она представља математичко очекивање одступања случајне променљиве од њене средње вредности. Варијанса је мера дисперзије, што значи да изражава колико је скуп бројева раширен од њихове просечне вредности. Варијанса има централну улогу у статистици, где неке идеје које је користе укључују дескриптивну статистику, статистичко закључивање, тестирање хипотезе, адекватност уклапања и Монте Карло узорковање. Варијанца је важан алат у науци, где је уобичајена примена статистичке анализе података. Варијанца је квадрат стандардне девијације, други централни моменат дистрибуције и коваријанса случајне променљиве са самом собом, а често се представља са σ2, s2, Var(X), V(X), или 𝕍(X).[1]

На пример, савршена коцка за игру може да да један од 6 исхода. Очекивана вредност броја којег ће коцка да покаже је (1 + 2 + 3 + 4 + 5 + 6)/6 = 3,5, очекивана стандардна девијација је σ ≈ 1.71 (квадратни корен аритметичке средине једнаковероватних квадрата апсолутних одступања: 3,5 − 1, 3,5 − 2, 3,5 − 3, 4 − 3,5, 5 − 3,5, 6 − 3,5, што даје 2,5, 1,5, 0,5, 0,5, 1,5, 2,5), очекивано квадратно одступање или варијанса је  17,5/6 ≈ 2,9 (средња вредност једнаковероватних квадрата одступања: 2,52, 1,52, 0,52, 0,52, 1,52, 2,52).

Дефиниција

Нека је μ=E(X) математичко очекивање реалног случајног вектора X за који постоји интеграл квадрата његових вредности. Тада је варијанса случајне променљиве:

Var(X):=V(X):=E((Xμ)(Xμ)T).

Ако је вектор X једнодимензионалан, услови за X могу да се упросте. Ако је E(X)<, онда важи:

Var(X)=E((Xμ)2).

Ова дефиниција обухвата случајне варијабле које су генерисане процесима који су дискретни, континуирани, ни једно ни друго или мешовити. Варијанса се такође може сматрати коваријансом случајне променљиве са самом собом:

Var(X)=Cov(X,X).

Варијанса је такође еквивалентна другом кумуланту дистрибуције вероватноће која генерише X. Варијанса се обично означава као Var(X), или понекад као V(X) или 𝕍(X), или симболично као σX2 или једноставно σ2 (изговара се „сигма на квадрат”). Израз за варијансу се може проширити на следећи начин:

Var(X)=E[(XE[X])2]=E[X22XE[X]+E[X]2]=E[X2]2E[X]E[X]+E[X]2=E[X2]E[X]2

Другим речима, варијанса Шаблон:Mvar је једнака средњој вредности квадрата Шаблон:Mvar минус квадрат средње вредности Шаблон:Mvar. Ова једначина не би требало да се користи за прорачуне коришћењем аритметике са плутајућим зарезом, јер пати од катастрофалног поништавања ако су две компоненте једначине сличне по величини. За друге нумерички стабилне алтернативе погледајте алгоритме за израчунавање варијансе.

Дискретна случајна променљива

Ако је генератор случајне променљиве X дискретан са функцијом вероватноће x1p1,x2p2,,xnpn, онда је

Var(X)=i=1npi(xiμ)2,

где је μ очекивана вредност. То је,

μ=i=1npixi.

(Када је таква дискретна пондерисана варијанса одређена пондерима чији збир није 1, тада се дели збиром пондера.)

Варијанца колекције од n једнако вероватних вредности може се написати као

Var(X)=1ni=1n(xiμ)2

где је μ просечна вредност. То је,

μ=1ni=1nxi.

Варијанца скупа од n једнако вероватних вредности може бити еквивалентно изражена, без директног позивања на средњу вредност, у смислу квадрата одступања свих тачака једне од друге:[2]

Var(X)=1n2i=1nj=1n12(xixj)2=1n2ij>i(xixj)2.

Апсолутно континуирана случајна променљива

Ако рандомна променљива X има функцију густине вероватноће f(x), и F(x) је кореспондирајућа кумулативна функција расподеле, онда је

Var(X)=σ2=(xμ)2f(x)dx=x2f(x)dx2μxf(x)dx+μ2f(x)dx=x2dF(x)2μxdF(x)+μ2dF(x)=x2dF(x)2μμ+μ21=x2dF(x)μ2,

или еквивалентно,

Var(X)=x2f(x)dxμ2,

где је μ очекивана вредност од X дата са

μ=xf(x)dx=xdF(x).

У овим формулама, интеграли у односу на dx и dF(x) су Лебесгов и Лебесг–Стилтјеов интеграл, респетивно.

Ако је функција x2f(x) интеграбилна по Риману на сваком коначном интервалу [a,b], онда је

Var(X)=+x2f(x)dxμ2,

при чему је овај интеграл неправилан Риманов интеграл.

Примери

Експоненцијална дистрибуција

Експоненцијална расподела са параметром Шаблон:Mvar је континуирана расподела чија је функција густине вероватноће дата са

f(x)=λeλx

на интервалу Шаблон:Math. Може се показати да је његова средња вредност

E[X]=0λxeλxdx=1λ.

Користећи интеграцију по деловима и употребљавајући очекивану вредност која је већ израчуната, добија се:

E[X2]=0λx2eλxdx=[x2eλx]0+02xeλxdx=0+2λE[X]=2λ2.

Стога је варијанса од Шаблон:Mvar дата изразом

Var(X)=E[X2]E[X]2=2λ2(1λ)2=1λ2.

Бацање коцке

Шестострана коца се може моделовати као дискретна рандомна променљива, Шаблон:Mvar, са исходима од 1 до 6, сваки са једнаком вероватноћом 1/6. Очекивана вредност Шаблон:Mvar је (1+2+3+4+5+6)/6=7/2. Дакле, варијанса Шаблон:Mvar је

Var(X)=i=1616(i72)2=16((5/2)2+(3/2)2+(1/2)2+(1/2)2+(3/2)2+(5/2)2)=35122.92.

Општа формула за варијансу исхода, Шаблон:Mvar, Шаблон:Nowrap коцке је

Var(X)=E(X2)(E(X))2=1ni=1ni2(1ni=1ni)2=(n+1)(2n+1)6(n+12)2=n2112.

Често коришћене дистрибуције вероватноће

Следећа табела наводи варијансу за неке често коришћене дистрибуције вероватноће.

Назив расподеле вероватноће Функција расподеле вероватноће Аритметичка средина Варијанса
Биномна расподела Pr(X=k)=(nk)pk(1p)nk np np(1p)
Геометријска расподела Pr(X=k)=(1p)k1p 1p (1p)p2
Нормална расподела f(xμ,σ2)=12πσ2e(xμ)22σ2 μ σ2
Униформна расподела (континуирана) f(xa,b)={1bafor axb,0for x<a or x>b a+b2 (ba)212
Експоненцијална расподела f(xλ)=λeλx 1λ 1λ2
Поасонова расподела f(kλ)=eλλkk! λ λ

Референце

Шаблон:Reflist

Литература

Шаблон:Литература

Шаблон:Литература крај

Спољашње везе

Шаблон:Commons category

Шаблон:Статистика Шаблон:Нормативна контрола