Diskretna uniformna raspodela

Извор: testwiki
Пређи на навигацију Пређи на претрагу

Шаблон:Probability distribution-lat

U teoriji verovatnoće i statistici, diskretna uniformna raspodela je simetrična raspodela verovatnoće pri čemu je za konačni broj vrednosti podjednako verovatno da budu uočene; svaka od -{n}- vrednosti ima jednaku verovatnoću 1/-{n}-. Drugim rečima „diskretna uniformna distribucija” je „poznati, konačni broj ishoda koji su podjednako verovatni da se dogode”.

Jednostavan primer diskretne uniformne distribucije je bacanje kocke. Moguće vrednosti su 1, 2, 3, 4, 5, 6, i svaki put kada se baci kocka verovatnoća datih rezultata je 1/6. Ako se bacaju dve kocke i dodaju njihove vrednosti, rezultirajuća raspodjela više nije uniformna, jer svi zbirovi nemaju jednaku verovatnoću.

Sama diskretna uniformna raspodela je inherentno neparametarska. Prikladno je, međutim, prikazati njene vrednosti generalno svim celim brojevima u intervalu [-{a}-,-{b}-], tako da -{a}- i -{b}- postaju glavni parametri distribucije (često se jednostavno razmatra interval [1, -{n}-] sa jednim parametrom -{n}-). Ovim konvencijama može se izraziti funkcija kumulativne distribucije (Шаблон:Jez-eng-lat) diskretne uniformne distribucije za bilo koje -{k ∈ [a,b]}-, kao

F(k;a,b)=ka+1ba+1

Procena maksimuma

Шаблон:Main article-lat

Uzorak -{k}- opažanja dobijen je iz uniformne distribucije celih brojeva 1,2,,N, s ciljem procene nepoznatog maksimuma -{N}-. Ovaj problem je opšte poznat kao nemački tenkovski problem, po primeni maksimalne procene na procenu nemačke proizvodnje tenkova tokom Drugog svetskog rata.[1][2][3][4][5]

Nepristrasni procenjivač uniformne minimalne varijanse (Шаблон:Jez-eng-lat) za maksimum je dat sa[6][7]

N^=k+1km1=m+mk1

gde je -{m}- maksimum uzorka i -{k}- je veličina uzorka, uzorkovanog bez zamene.[8] Ovo se može smatrati veoma jednostavnim slučajem procenе maksimalnog razmaka.

To ima varijansu od[8]

1k(Nk)(N+1)(k+2)N2k2 za male uzorke kN

tako da je standardna devijacija približno Nk, (populaciona) prosečna veličina razmaka između uzoraka; uporedite sa mk iznad.

Maksimum uzorka je procenjivač maksimalne verovatnoće za populacioni maksimum, mada, kao što je gore diskutovano, on je pristrasan.

Ako uzorci nisu numerisani, već su prepoznatljivi ili markirani, umesto toga se može proceniti veličina populacije metodom označavanja i ponovnog hvatanja.[9][10]

Derivacija

Za neki ceo broj -{m}- takav da je -{k ≤ m ≤ N}-, verovatnoća da će maksimalni uzorak biti jednak -{m}- može se izračunati na sledeći način. Broj različitih grupa od -{k}- tenkova koji se mogu načiniti od ukupno -{N}- tenkova dat je binomnim koeficijentom (Nk). Pošto se u ovom načinu brojanja permutacija tenkova broji samo jednom, mogu se urediti serijski brojevi i uzeti u obzir maksimum svakog uzorka. Da bi se izračunala verovatnoća, mora se odrediti broj poređanih uzoraka koji se može formirati sa poslednjim elementom jednakim -{m}-, i svi ostali -{k}--1 tenkovi manji ili jednaki -{m}--1. Broj uzoraka sa -{k}--1 tenkova koji se mogu napraviti od ukupno -{m}--1 tenkova dat je binomnim koeficijentom (m1k1), tako da je verovatnoća da je maksimum -{m}- jednaka P(m)=(m1k1)/(Nk).

Ako je dat ukupn broj -{N}- i veličina uzorka -{k}-, očekivana vrednost maksimuma uzorka je

μ=E[m]=m=kNm(m1k1)(Nk)=1(k1)!(Nk)m=kNm!(mk)!=k!(k1)!(Nk)m=kN(mk)=k(N+1k+1)(Nk)=k(N+1)k+1,

gde je korišten identitet hokejaškog štapa m=kN(mk)=(N+1k+1).

Iz ove jednačine, nepoznati kvantitet -{N}- se može izraziti u obliku očekivanja i veličine uzorka kao

N=μ(1+k1)1.

Iz linearnosti očekivanja se dobija da je

μ(1+k1)1=E[m(1+k1)1],

i stoga se nepristrasni procenjivač od -{N}- dobija zamenjivanjem očekivanja opservacijom,

N^=m(1+k1)1.

Osim što je nepristrasan ovaj procenjivač takođe dostiže minimalnu varijansu. Da bi se to pokazalo, prvo treba napomenuti da je maksimalan uzorak dovoljna statistička za maksimum populacije, jer je verovatnoća -{P(m;N)}- izražena samo kao funkcija od -{m}-. Zatim se mora pokazati da su statistike za -{m}- takođe kompletne statistike, i posebna vrsta dovoljne statistike. Zatim Lehman-Šefeova teorema implicira da je N^ minimalna procena nepristrasne varijanse od -{N}-.[11]

Varijansa procenjivača izračunava se iz varijance maksimuma uzorka

Var[N^]=(k+1)2k2Var[m].

Varijanse maksimuma se zatim izračunava iz očekivanih vrednosti od m i m2. Izračunavanje očekivane vrednosti od m2 je,

E[m2]=m=kNm2(m1k1)(Nk)=1(k1)!(Nk)m=kNmm!(mk)!=1(k1)!(Nk)m=kN(m+11)m!(mk)!=1(k1)!(Nk)m=kN(m+1)!(mk)!1(k1)!(Nk)m=kNm!(mk)!

gde je drugi član očekivana vrednost od m. Prvi član se može izraziti tako da zavisi od -{k}- i -{N}-,

1(k1)!(Nk)m=kN(m+1)!(mk)!=(k+1)!(k1)!(Nk)m=kN(m+1k+1)=k(k+1)(Nk)n=k+1N+1(nk+1)=k(k+1)(Nk)(N+2k+2)=k(N+2)(N+1)(k+2)

pri čemu je napravljena zamena n=m+1 i korišten je identitet hokejaškog štapa. Zamenjujući ovaj rezultat i očekivanje od m u jednačini od E[m2],

E[m2]=k(N+2)(N+1)(k+2)k(N+1)k+1=k(N+1)(N+2k+21k+1)=k(N+1)(kN+k+N)(k+1)(k+2)

Variansa od m se zatim dobija,

Var[m]=E[m2]E[m]2=k(N+1)(k+1)(kN+k+Nk+2k(N+1)k+1)=k(N+1)(k+1)(Nk)(k+2)(k+1)=k(N+1)(Nk)(k+1)2(k+2)

Konačno varijansa procenjivača N^ se može izračunati,

Var[N^]=(k+1)2k2Var[m]=(k+1)2k2k(N+1)(Nk)(k+1)2(k+2)=(N+1)(Nk)k(k+2).

Vidi još

Reference

Шаблон:Reflist

Literatura

Шаблон:Литература

Шаблон:Литература крај

Spoljašnje veze

Шаблон:Commons category-lat

Шаблон:Authority control-lat