Procena maksimalne verodostojnosti

Извор: testwiki
Пређи на навигацију Пређи на претрагу

Procena maksimalne verodostojnosti (Шаблон:Jez-eng-lat) je metod procenjivanja parametara raspodele verovatnoće maksimizovanjem funkcije verodostojnosti, tako da su po pretpostavljenom statističkom modelu uočeni podaci najverovatniji. Tačka u parametarskom prostoru koja maksimizira funkciju verodostojnosti naziva se procenom maksimalne verodostojnosti.[1] Logika maksimalne verodostojnosti je intuitivna i fleksibilna, i kao takva metoda je postala dominantno sredstvo statističkog zaključivanja.[2][3][4]

Ako je funkcija verovatnoće diferencijabilna, može se primeniti derivatni test za određivanje maksima. U nekim slučajevima se uslovi prvog reda funkcije verodostojnosti mogu eksplicitno rešiti; na primer, procenjivač običnih najmanjih kvadrata maksimizira verovatnoću linearnog regresionog modela.[5] Međutim, u većini okolnosti, numeričke metode su neophodne da bi se pronašao maksimum funkcije verodostojnosti.

Sa stanovišta Bajesovog zaključivanja, MLE je poseban slučaj maksimalne posteriorne procene (MAP) koji pretpostavlja uniformnu priornu raspodelu parametara. U frekvencionističkom zaključivanju, MLE je poseban slučaj procenjivača ekstrema, čija je objektivna funkcija verovatnoća.

Principi

Sa statističkog stanovišta, dati skup zapažanja je slučajni uzorak iz nepoznate populacije. Cilj procene maksimalne verodostojnosti je da se izvedu zaključci o populaciji iz koje je uzorak najverovatnije generisn,[6] specifično o zajedničkoj raspodeli verovatnoće slučajnih promenljivih {y1,y2,}, koje nisu nužno nezavisno i identično distribuirane. Sa svakom distribucijom verovatnoće povezan je jedinstveni vektor θ=[θ1,θ2,,θk]𝖳 parametara koji indeksiraju raspodelu verovatnoće unutar porodice parametara {f(;θ)θΘ}, gde se Θ naziva prostorom parametara, koji je konačno dimenzionalni podskup Euklidskog prostora. Procena zajedničke gustine na posmatranom uzorku podataka 𝐲=(y1,y2,,yn) daje realno-vrednosnu funkciju,

Ln(θ)=Ln(θ;𝐲)=fn(𝐲;θ)

koja se naziva funkcijom verodostojnosti. Za nezavisne i identično raspodeljene slučajne promenljive, fn(𝐲;θ) će biti proizvod univarijantnih funkcija gustine.

Cilj procene maksimalne verodostojnosti je da se pronađu vrednosti parametara modela koje maksimiziraju funkciju verodostojnosti u prostoru parametara,[6] to jest

θ^=argmaxθΘ L^n(θ;𝐲)

Intuitivno, ovim se biraju vrednosti parametara koje čine posmatrane podatke najverovatnijim. Specifična vrednost θ^=θ^n(𝐲)Θ koja maksimizuje funkciju verodostojnosti Ln se zove procena maksimalne verodostojnosti. Dalje, ako je funkcija θ^n:nΘ tako definisana da je merljiva, onda se ona naziva procenjivačem maksimalne verodostojnosti. To je generalno funkcija definisana nad prostorom uzorka, tj. ona uzima određeni uzorаk kao svoj argument. Dovoljan ali ne i neophodan uslov za njeno postojanje je da funkcija verodostojnosti bude kontinuirana na parametarskom prostoru Θ koji je kompaktan.[7] Za otvoreno Θ funkcija verodostojnosti se može povećati bez premašivanja supremumske vrednosti.

U praksi je često prikladno raditi s prirodnim logaritamom funkcije verodostojnosti, zvanim logaritamska verodostojnost[8]:

(θ;𝐲)=lnLn(θ;𝐲).

Pošto je logaritam monotona funkcija, maksimum od (θ;𝐲) se javlja na istoj vrednosti θ kao i maksimum od Ln.[9] Ako je (θ;𝐲) diferencijabilno u θ, potrebni uslovi za pojavljivanje maksimuma (ili minimuma) su

θ1=0,θ2=0,,θk=0,

što je poznato kao jednačina verovatnoće. Za neke modele, ove jednačine mogu se eksplicitno rešiti za θ^, ali generalno rešenja zatvorenog oblika za probleme maksimizacije nisu poznata ili dostupna, a MLE se može pronaći samo numeričkom optimizacijom. Još jedan problem je što u konačnim uzorcima može postojati više korena za jednačine verovatnoće.[10] Da li je identifikovani koren θ^ jednačine verovatnoće zaista (lokalni) maksimum, zavisi od toga da li je matrica drugog reda parcijalnih i unakrsno parcijalnih derivata,

𝐇(θ^)=[2θ12|θ=θ^2θ1θ2|θ=θ^2θ1θk|θ=θ^2θ2θ1|θ=θ^2θ22|θ=θ^2θ2θk|θ=θ^2θkθ1|θ=θ^2θkθ2|θ=θ^2θk2|θ=θ^],

poznata kao Hesijan negativno poludefinitivna u θ^, što daje indikaciju o postojanju lokalne konkavnosti. Povoljno je da su najčešće raspodele verovatnoće - naročito eksponencijalna porodica - logaritamski konkavne.[11][12]

Reference

Шаблон:Reflist

Literatura

Шаблон:Литература

Шаблон:Литература крај

Spoljašnje veze

Шаблон:Statistika-lat Шаблон:Podnožje