Studentova t-raspodela

Извор: testwiki
Пређи на навигацију Пређи на претрагу

Шаблон:Probability distribution-lat

U verovatnoći i statistici, Studentova t-raspodela (ili jednostavno t-raspodela) je bilo koji član familije kontinuarnih raspodela verovatnoće koje nastaju iz procenjivanja srednje vrednosti normalne raspodele populacije u situacijama gde je veličina uzorka mala i populaciona standardna devijacija nije poznata. Ovu raspodelu je razvio Vilijam Goset pod pseudonimom Student.

t-Raspodela igra ulogu u velikom broju široko korištenih statističkih analiza, uključujući Studentov t-test za procenu statističke važnosti razlike između dve srednje vrednosti uzorka, izgradnju intervala pouzdanosti za razliku između dve populacijske sredine, i u linearnoj regresionoj analizi. Studentova t-distribucija se takođe pojavljuje u Bajesovoj analizi podataka iz normalne porodice.

Ako se uzme uzorak sa -{n}- opažanja iz normalne raspodele, onda se t-raspodela sa ν=n1 stepeni slobode može definisati kao raspodela lokacija srednje vrednosti uzorka u odnosu na pravu sredinu, podeljena sa standardnom devijacijom uzorka, nakon što se pomnoži sa standardizacionim članom n. Na taj se način, t-raspodela se može koristiti za izgradnju intervala pouzdanosti za pravu sredinu.

t-Raspodela je simetrična i zvonastog oblika, poput normalne raspodele, ali ima teže repove, što znači da je sklonija stvaranju vrednosti koje padaju daleko od srednje vrednosti. Ovo je korisno za razumevanje statističkog ponašanja određenih vrsta odnosa slučajnih veličina, u kojima je varijacija u deliocu pojačana i može da proizvede udaljene vrednosti kada brojilac odnosa padne blizu nule. Studentova t-raspodela je poseban slučaj generalizovane hiperbolične raspodele.

Istorija i etimologija

Statističar Wilijam Sili Goset, poznat kao „Student”

U statistici, t-raspodelu su prvi izveli kao posteriornu raspodelu Helmert[1][2][3] i Lirot 1876. godine.[4][5][6] t-Raspodela se isto tako pojavila u opštijoj formi kao Pirsonova raspodela tipa -{IV}- u publikaciji Karla Pirsona iz 1895. godine.

U litiraturi na engleskom jeziku ova raspodela nosi ime iz publikacije Vilijama Goseta iz 1908. godine u časopisu Biometrika objavljene pod pseudonimom „Student”.[7] Goset je radio u Ginisovoj pivari u Dablinu u Irskoj, i bio je zainteresovan za probleme malih uzoraka – na primer, hemijskih svojstva ječma gde veličina uzorka može da bude samo 3. Jedna verzija porekla pseudonima je da je Gosetov poslodavac preferirao da zaposleni koriste književne pseudonime kad objavljuju naučne radove umesto svojih stvarnih imena, tako da je on koristio ime „Student” da bi prikrio svoj identitet. Druga verzija je da Ginis nije želeo da njegovi konkurenti znaju da oni koriste t-test za određivanje kvaliteta sirovina.[8][9]

Gosetova publikacija naziva ovu raspodelu „frekvencija distribucije standardnih devijacija uzoraka uzetih iz normalne populacije”. Ona je postala dobro poznata zahvaljujući radu Ronalda Fišera, koji je nazivao ovu raspodelu „Studentova raspodela” i predstavljao testne vrednosti slovom t.[10][11]

Nastanak Studentove raspodele iz uzorkovanja

Neka je X1,,Xn nezavisno i identično raspodeljeni kao N(μ,σ2), i.e. ovo je uzorak veličine n iz normalno raspodeljene populacije sa očekivanom srednjom vrednošću μ i varijansom σ2.

Neka je

X¯=1ni=1nXi

srednja vrednosti uzorka i neka je

S2=1n1i=1n(XiX¯)2

(korigovana po Beselu) varijansa uzorka. Onda randomna promenljiva

X¯μσ/n

ima standardnu normalnu raspodelu (i.e. normalnu sa očekivanom vrednosti 0 i varijansom 1), i randomna promenjiva

X¯μS/n,

gde je S supstituisano za σ, ima Studentovu t-raspodelu sa n1 stepeni slobode. Brojilac i delilac u prethodnom izrazu su nezavisne randmne promenljive uprkos toga što se zasnivaju na istom uzorku X1,,Xn.

Definicija

Funkcija gustine verovatnoće

Studentova t-raspodela ima funkciju raspodele datu sa

f(t)=Γ(ν+12)νπΓ(ν2)(1+t2ν)ν+12,

gde je ν broj stepeni slobode i Γ je gama funkcija. Ovo se isto tako može napisati kao

f(t)=1νB(12,ν2)(1+t2ν)ν+12,

gde je B Beta funkcija. Za celobrojne vrednosti stepena slobode ν važi:

Za ν>1 parno,

Γ(ν+12)νπΓ(ν2)=(ν1)(ν3)532ν(ν2)(ν4)42

Za ν>1 neparno,

Γ(ν+12)νπΓ(ν2)=(ν1)(ν3)42πν(ν2)(ν4)53

Funkcija gustine verovatnoće je simetrična, i njen sveukupni oblik podseća na zvonasti oblik promenljive sa normalnom raspodelom sa srednjom vrednosti od 0 i varijansom od 1, izuzev što je nešto niža i šira. Sa porastom broja stepeni slobode, t-raspodela prilazi normalnoj raspodeli sa srednjom vrednosti 0 i varijansom 1. Iz tog razloga ν je isto tako poznato kao parametar normalnosti.[12]

Sledeće slike prikazuju gustinu t-raspodele za povećane vrednosti od ν. Normalna raspodela je prikazana plavom linijom radi poređenja. Treba uočiti da t-raspodela (crvena linija) postaje bliža normalnoj raspodeli sa povećanjem ν.

Gustina t-raspodele (crveno) za 1, 2, 3, 5, 10, i 30 stepeni slobode u poređenju sa standardnom normalnom distribucijom (plavo).
Prethodni grafikoni su prikazani zeleno.
1df
1 stepen slobode
2df
2 stepena slobode
3df
3 stepena slobode
5df
5 stepeni slobode
10df
10 stepeni slobode
30df
30 stepeni slobode

Funkcija kumulativne raspodele

Funkcija kumulativne raspodele se može napisati u smislu I, regulisane nekompletne beta funkcija. Za t > 0,[13][14]

F(t)=tf(u)du=112Ix(t)(ν2,12),

gde je

x(t)=νt2+ν.

Druge vrednosti se mogu dobiti simetrijom. Jedna alternativna formula, validna za t2<ν, je[13]

tf(u)du=12+tΓ(12(ν+1))πνΓ(ν2)2F1(12,12(ν+1);32;t2ν),

gde je 2F1 poseban slučaj hipergeometrijske funkcije.

Za informacije o njenoj inverznoj funkciji kumulativne distribucije, pogledajte Шаблон:Slink.

Specijalni slučajevi

Određene vrednosti ν daju posebno jednostavnu formu.

  • ν=1
Funkcija raspodele:
F(t)=12+1πarctan(t).
Funkcija gustine:
f(t)=1π(1+t2).
Pogledajte Košijevu raspodelu
  • ν=2
Funkcija raspodele:
F(t)=12+t221+t22.
Funkcija gustine:
f(t)=122(1+t22)32.
  • ν=3
Funkcija raspodele:
F(t)=12+1π[13t1+t23+arctan(t3)].
Funkcija gustine:
f(t)=2π3(1+t23)2.
  • ν=4
Funkcija raspodele:
F(t)=12+38t1+t24[1112t21+t24].
Funkcija gustine:
f(t)=38(1+t24)52.
  • ν=5
Funkcija raspodele:
F(t)=12+1π[t5(1+t25)(1+23(1+t25))+arctan(t5)].
Funkcija gustine:
f(t)=83π5(1+t25)3.
  • ν=
Funkcija raspodele:
F(t)=12[1+erf(t2)].
Pogledajte funkciju greške
Funkcija gustine:
f(t)=12πet22.
Pogledajte normalnu raspodelu.

Reference

Шаблон:Reflist

Literatura

Шаблон:Литература

Шаблон:Литература крај

Spoljašnje veze

Шаблон:Commons category-lat

Шаблон:Authority control-lat