Hi-kvadratni test

Hi-kvadratni test, takođe napisan kao Шаблон:Math test, jeste test statističke hipoteze gde je distribucija uzorka testirane statistike hi-kvadratna distribucija kad je nulta hipoteza istinita. Bez druge kvalifikacije, hi-kvadratni test često se koristi kao zamena za Pirsonov hi-kvadratni test.[2] Hi-kvadratni test se koristi da se utvrdi da li postoji značajna razlika između očekivanih frekvencija i posmatranih frekvencija u jednoj ili više kategorija.
U standardnim primenama ovog testa, zapažanja su svrstana u međusobno isključive klase, i postoji neka teorija, ili nulta hipoteza, koja daje verovatnoću da bilo koje opažanje padne u odgovarajuću klasu. Svrha testa je da se proceni koliko su verovatne opservacije, pod pretpostavkom da je nulta hipoteza tačna.
Hi-kvadratni testovi se obično konstruišu iz sume kvadriranih grešaka, ili pomoću varijanse uzorka. Statistika testa koja sledi hi-kvadratnu distribuciju proizilazi iz pretpostavke nezavisnih normalno distribuiranih podataka,[3][4][5][6] koja je u mnogim slučajevima validna zbog centralne granične teoreme. Hi-kvadratni test može se koristiti za pokušaj odbacivanja nulte hipoteze da su podaci nezavisni.
Istorija
U 19. veku, statističke analitičke metode uglavnom su primenjivane u analizi bioloških podataka i bilo je uobičajeno da istraživači pretpostavljaju da su zapažanja pratila normalnu distribuciju, kao što su to činili Ser Džordž Eri i profesor Meriman, čije je radove kritikovao Karl Pirson u svom radu iz 1900. godine.[7]
Do kraja 19. veka, Pirson je uočio postojanje značajne asimetrije unutar nekih bioloških posmatranja. Da bi modelovao zapažanja nezavisno od toga da li su normalna ili asimetrična, Pirson je u nizu članaka objavljenih od 1893 do 1916,[8][9][10][11] osmislio Pirsonovu distribuciju, porodicu neprekidnih raspodela verovatnoće, koja uključuje normalnu distribuciju i mnoge asimetrične distribucije. On je predložio metod statističke analize koji se sastoji od upotrebe Pirsonove distribucije za modelovanje posmatranja i vršenja testa dobrog uklapanja kako bi se utvrdilo koliko se model i posmatranje zaista uklapaju.
Pirsonov hi-kvadratni test
Godine 1900, Pirson je objavio publikaciju[7] o Шаблон:Math testu, koja se smatra jednim od fundamentalnih radova u modernoj statistici.[12] U tom radu, Pirson je istražio test adekvatnosti uklapanja.
Ako se pretpostavi da je Шаблон:Mvar opažanja slučajnog uzorka iz populacije klasifikovano u Шаблон:Mvar međusobno isključujućih klasa sa odgovarajućim posmatranim brojevima Шаблон:Mvar (za Шаблон:Math), a da nulta hipoteza daje verovatnoću Шаблон:Mvar da će opažanje pasti u Шаблон:Mvar-tu klasu. Dakle, dostupni su očekivani brojevi Шаблон:Math za svako Шаблон:Mvar, gde
Pirson je predložio da u slučaju da je nulta hipoteza tačna kao Шаблон:Math, ograničavajuća distribucija navedene količine je raspodela Шаблон:Math.
Pirson se prvo bavio slučajem u kojem su očekivani brojevi Шаблон:Mvar dovoljno veliki poznati brojevi u svim ćelijama pod pretpostavkom da se svaki Шаблон:Mvar može uzeti kao normalno raspodeljen, i postigao je rezultat da, na granici kada Шаблон:Mvar postane veliko, Шаблон:Math sledi Шаблон:Math raspodelu sa Шаблон:Math stepeni slobode.
Pirson je zatim razmotrio slučaj u kojem očekivani brojevi zavise od parametara koji se moraju proceniti iz uzorka. On je predložio da kad Шаблон:Mvar označava prave očekivane brojeve, a Шаблон:Math procenjene očekivane brojeva, razlika
obično biva pozitivna i dovoljno mala da se može zanemariti. U zaključku, Pirson je tvrdio da ako se smatra da je Шаблон:Math takođe raspodeljena kao Шаблон:Math distribucija sa Шаблон:Math stepeni slobode, greška u ovoj aproksimaciji neće uticati na praktične odluke. Ovaj zaključak izazvao je određene kontroverze u praktičnim primenama i to nije bilo rarešeno tokom 20 godina, do objavljivanja Fišerovih publikacija iz 1922. i 1924. godine.[13][14]
Aplikacije
U kriptoanalizi, hi-kvadratni test se koristi za upoređivanje distribucije otvorenog teksta i (mogućeg) dekriptovanja šifroteksta. Najniža vrednost testa znači da je dešifrovanje bilo uspešno sa velikom verovatnoćom.[15][16] Ova metoda se može generalizovati za rešavanje savremenih kriptografskih problema.[17]
U bioinformatici, hi-kvadratni test se koristi za upoređivanje raspodele određenih svojstava gena (npr. genomskog sadržaja, brzine mutacije, interakcione mreže klasterovanja itd.) koje pripadaju različitim kategorijama (npr. geni bolesti, osnovni geni, geni na određenom hromozomu itd.).[18][19]
Reference
Literatura
- Шаблон:MathWorld
- Шаблон:Citation
- Шаблон:Citation
- Шаблон:Citation
- Шаблон:CitationШаблон:Full citation needed
- Шаблон:Cite book
- Шаблон:Cite journal
- Шаблон:Springer
- Шаблон:Cite journal
- Шаблон:Citation
- Шаблон:Cite journal
- M. K. Simon, Probability Distributions Involving Gaussian Random Variables, New York: Springer, 2002, eq. (2.35), Шаблон:ISBN
- Шаблон:Cite book
- Шаблон:Cite journal
- Шаблон:Cite journal
Spoljašnje veze
- ↑ Шаблон:Cite web
- ↑ Шаблон:Cite journal
- ↑ Шаблон:Abramowitz Stegun ref
- ↑ NIST (2006). Engineering Statistics Handbook – Chi-Squared Distribution
- ↑ Шаблон:Cite book
- ↑ Шаблон:Cite book
- ↑ 7,0 7,1 Шаблон:Cite journal
- ↑ Шаблон:Cite journal
- ↑ Шаблон:Cite journal
- ↑ Шаблон:Cite journal
- ↑ Шаблон:Cite journal
- ↑ Шаблон:Cite journal
- ↑ Шаблон:Cite journal
- ↑ Шаблон:Cite journal
- ↑ Шаблон:Cite web
- ↑ Шаблон:Cite web
- ↑ Шаблон:Cite journal
- ↑ Шаблон:Cite journal
- ↑ Шаблон:Cite web