Paretova raspodela

Извор: testwiki
Пређи на навигацију Пређи на претрагу

Шаблон:Probability distribution-lat

Paretova raspodela je imenovana po italijanskom građevinskom inženjeru, ekonomisti, i sociologu Vilfredu Paretu. Ona je raspodela verovatnoće stepenog zakona koja se koristi za opisivanje društvenih, naučnih, geofizičkih, aktuarskih, i mnogih drugih tipova uočljivih pojava. Prvobitno primenjena na opisivanje raspodele bogatstva u društvu, ona opisuje trend da veliki deo bogatstva poseduje mali deo stanovništva. Paretova distribucija je kolokvijalno postala poznata i naziva se Paretov princip, ili „80-20 pravilo”, a ponekad se naziva i „Matejev princip”. Ovo pravilo postulira da, na primer, 80% bogatstva društva drži 20% njegovog stanovništva. Međutim, ne treba poistovećivati Paretovu distribuciju i Paretov princip, jer distribucija daje ovaj rezultat samo za određenu vrednost stepena, α (α = log45 ≈ 1.16). Iako je α varijabilno, empirijskim opažanjima je ustanovljeno da 80-20 distribucija odgovara širokom rasponu slučajeva, uključujući prirodne pojave i ljudske aktivnosti.

Definicija

Ako je X randoman promenljiva sa Paretovom distribucijom (tip -{I}-),[1] onda je verovatnoća da je X veće od nekog broja x, i.e. the funkcija preživljavanja (takođe zvana funkcija repa), data sa

F(x)=Pr(X>x)={(xmx)αxxm,1x<xm,

gde je xm (neophodno pozitivni) minimum moguće vrednosti od X, i α je pozitivni parameter. Paretova raspodela tipa -{I}- je karakterisana parametrom skaliranja xm i parametrom oblika α, koji je poznat kao indeks repa. Kada se ova raspodela koristi za modelovanje raspodele bogatstva, onda se parameter α naziva Paretov indeks.

Svojstva

Funkcija kumulativne distribucije

Po definiciji, kumulativna funkcija raspodele Paretove randomne promenljive sa parametrima α i -{xm}- je

FX(x)={1(xmx)αxxm,0x<xm.

Funkcija gustine verovatnoće

Po diferencijaciji sledi da je funkcija gustine verovatnoće

fX(x)={αxmαxα+1xxm,0x<xm.

Kada se prikaže na linearnim osama, distribucija pretpostavlja poznatu krivu u obliku slova J koja se asimptotski približava svakoj od ortogonalnih osa. Svi segmenti krive su slični (podložni odgovarajućim faktorima skaliranja). Kada je prikaže na log-log grafu, distribucija je predstavljena pravom linijom.

Momenti i karakteristična funkcija

E(X)={α1,αxmα1α>1.
Var(X)={α(1,2],(xmα1)2αα2α>2.
(Ako je α ≤ 1, varijansa ne postoji.)
μn={αn,αxmnαnα>n.
M(t;α,xm)=E[etX]=α(xmt)αΓ(α,xmt)
M(0,α,xm)=1.
φ(t;α,xm)=α(ixmt)αΓ(α,ixmt),
gde je Γ(ax) nekompletna gama funkcija.

Uslovne distribucije

Distribucija uslovne verovatnoće Pareto-raspodeljene randomne promenljive, datog događaja koji je veći ili jednak od zadatog broja x1 do xm, je Paretova distribucija sa istim Paretovim indeksom α ali sa minimumom x1 umesto xm.

Karakterizaciona teorema

Neka su X1,X2,X3, nezavisne identično raspoređene randomne promenljive čija je raspodela verovatnoće podržana na intervalu [xm,) za neko xm>0. Neka su za svako n, dve randomne promenljive min{X1,,Xn} i (X1++Xn)/min{X1,,Xn} nezavisne. Onda je zajednička distribucija Paretova distribucija.

Geometrijska sredina

Geometrijska sredina (-{G}-) je[2]

G=xmexp(1α).

Harmonijska sredina

Harmonijska sredina (-{H}-) je[2]

H=xm(1+1α).

Primene

Vilfredo Pareto je izvorno koristio ovu distribuciju kako bi opisao raspodelu bogatstva među pojedincima, jer se činilo da prilično dobro pokazuje način na koji veći deo bogatstva bilo kog društva poseduje manji procenat ljudi u tom društvu. Takođe je koristio ovu distribuciju da opiše raspodelu dohotka.[3] Ta se ideja ponekad izražava jednostavnije kao Paretov princip ili „pravilo 80-20”, što govori da 20% stanovništva kontroliše 80% bogatstva.[4] Međutim, pravilo 80-20 odgovara određenoj vrednosti α, i zapravo, Paretovi podaci o britanskim porezima na dohodak u njegovom radu -{Cours d'économie politique}- pokazuju da je oko 30% stanovništva imalo oko 70% prihoda. Graf funkcije gustine verovatnoće (PDF) na početku ovog članka pokazuje da je „verovatnoća” ili deo populacije koja poseduje malu količinu bogatstva po osobi prilično visoka, a zatim se stalno smanjuje kako bogatstvo raste. (Paretova raspodela nije realistična za bogatstvo pri donjem kraju. Zapravo neto vrednost može čak da bude i negativna.) Ova distribucija nije ograničena na opisivanje bogatstva ili prihoda, već se susreće u mnogim situacijama u kojima je ravnoteža pronađena u distribuciji „malog” na „veliko”. Sledeći primeri se ponekad smatraju približno raspodeljenim po Paretovoj distribuciji:

Kumulativna Paretova (Lomaksova) distribucija do maksimalnih jednodnevnih padavina prikazana koristeći -{CumFreq}-
  • Veličine ljudskih naselja (nekoliko gradova, mnogo zaseoka/sela)[5]
  • Raspodela veličina datoteka u Internet prometu koji koristi TCP protokol (mnogo manjih datoteka, nekoliko većih)[5]
  • Stope grešaka tvrdih diskova[6]
  • Klasteri Boze–Ajnštajnovog kondenzata u blizini apsolutne nule[7]
  • Vrednosti naftnih rezerivi u naftnim poljima (nekoliko velikih polja, mnogo malih polja)[5]
  • Рaspodela dužine poslova zadatih superračunarima (nekoliko velikih, puno malih)[8]
  • Standardizovane cene povraćaja na individualnim deonicama[5]
  • Veličine čestica peska [5]
  • Veličina meteorita
  • Ozbiljnost velikih gubitaka od nesreće za pojedine delatnosti kao što su opšta odgovornost, komercijalna vozila i naknade radnika.[9][10]
  • Količina vremena koju će korisnik na stimu provesti igrajući razne igre. (Neke igre se puno igraju, dok se većina njih skoro nikad ne igra.)[11]
  • U hidrologiji Paretova distribucija se koristi za ekstremne događaje kao što su godišnje maksimalne jednodnevne padavine i rečni ispusti.[12] Plava slika ilustruje uklapanje Paretove distribucije u rangirane godišnje maksimume jednodnevnih padavina. Takođe je prikazan 90% pojas pouzdanosti baziran na binomnoj distribuciji. Podaci o padavinama su predstavljeni pomoću Q–Q grafika kao dela analize kumulativne frekvencije.

Reference

Шаблон:Reflist

Literatura

Шаблон:Литература

Шаблон:Литература крај

Spoljašnje veze

Шаблон:Commons category-lat

Шаблон:Authority control-lat

  1. Шаблон:Cite book
  2. 2,0 2,1 Johnson NL, Kotz S, Balakrishnan N (1994) Continuous univariate distributions Vol 1. Wiley Series in Probability and Statistics.
  3. Pareto, Vilfredo, Cours d'Économie Politique: Nouvelle édition par G.-H. Bousquet et G. Busino, Librairie Droz, Geneva, 1964, pp. 299–345.
  4. For a two-quantile population, where approximately 18% of the population owns 82% of the wealth, the Theil index takes the value 1.
  5. 5,0 5,1 5,2 5,3 5,4 Шаблон:Cite journal
  6. Шаблон:Cite journal
  7. Шаблон:Cite journal
  8. Шаблон:Cite journal
  9. Kleiber and Kotz (2003): p. 94.
  10. Шаблон:Cite journal
  11. Шаблон:Cite web
  12. CumFreq, software for cumulative frequency analysis and probability distribution fitting [1]