Paretova raspodela
Шаблон:Probability distribution-lat
Paretova raspodela je imenovana po italijanskom građevinskom inženjeru, ekonomisti, i sociologu Vilfredu Paretu. Ona je raspodela verovatnoće stepenog zakona koja se koristi za opisivanje društvenih, naučnih, geofizičkih, aktuarskih, i mnogih drugih tipova uočljivih pojava. Prvobitno primenjena na opisivanje raspodele bogatstva u društvu, ona opisuje trend da veliki deo bogatstva poseduje mali deo stanovništva. Paretova distribucija je kolokvijalno postala poznata i naziva se Paretov princip, ili „80-20 pravilo”, a ponekad se naziva i „Matejev princip”. Ovo pravilo postulira da, na primer, 80% bogatstva društva drži 20% njegovog stanovništva. Međutim, ne treba poistovećivati Paretovu distribuciju i Paretov princip, jer distribucija daje ovaj rezultat samo za određenu vrednost stepena, (α = log45 ≈ 1.16). Iako je varijabilno, empirijskim opažanjima je ustanovljeno da 80-20 distribucija odgovara širokom rasponu slučajeva, uključujući prirodne pojave i ljudske aktivnosti.
Definicija
Ako je X randoman promenljiva sa Paretovom distribucijom (tip -{I}-),[1] onda je verovatnoća da je X veće od nekog broja x, i.e. the funkcija preživljavanja (takođe zvana funkcija repa), data sa
gde je xm (neophodno pozitivni) minimum moguće vrednosti od X, i α je pozitivni parameter. Paretova raspodela tipa -{I}- je karakterisana parametrom skaliranja xm i parametrom oblika α, koji je poznat kao indeks repa. Kada se ova raspodela koristi za modelovanje raspodele bogatstva, onda se parameter α naziva Paretov indeks.
Svojstva
Funkcija kumulativne distribucije
Po definiciji, kumulativna funkcija raspodele Paretove randomne promenljive sa parametrima α i -{xm}- je
Funkcija gustine verovatnoće
Po diferencijaciji sledi da je funkcija gustine verovatnoće
Kada se prikaže na linearnim osama, distribucija pretpostavlja poznatu krivu u obliku slova J koja se asimptotski približava svakoj od ortogonalnih osa. Svi segmenti krive su slični (podložni odgovarajućim faktorima skaliranja). Kada je prikaže na log-log grafu, distribucija je predstavljena pravom linijom.
Momenti i karakteristična funkcija
- Očekivana vrednost randomne promenljive koja sledi Paretovu distribuciju je
- Varijansa randomne promenljive koja sledi Paretovu distribuciju je
- (Ako je α ≤ 1, varijansa ne postoji.)
- Momenti su
- Momenat generisanja funkcije je definisan samo za nepozitivne vrednosti -{t}- ≤ 0
- Karakteristična funkcija je data izrazom
- gde je Γ(a, x) nekompletna gama funkcija.
Uslovne distribucije
Distribucija uslovne verovatnoće Pareto-raspodeljene randomne promenljive, datog događaja koji je veći ili jednak od zadatog broja do , je Paretova distribucija sa istim Paretovim indeksom ali sa minimumom umesto .
Karakterizaciona teorema
Neka su nezavisne identično raspoređene randomne promenljive čija je raspodela verovatnoće podržana na intervalu za neko . Neka su za svako , dve randomne promenljive i nezavisne. Onda je zajednička distribucija Paretova distribucija.
Geometrijska sredina
Geometrijska sredina (-{G}-) je[2]
Harmonijska sredina
Harmonijska sredina (-{H}-) je[2]
Primene
Vilfredo Pareto je izvorno koristio ovu distribuciju kako bi opisao raspodelu bogatstva među pojedincima, jer se činilo da prilično dobro pokazuje način na koji veći deo bogatstva bilo kog društva poseduje manji procenat ljudi u tom društvu. Takođe je koristio ovu distribuciju da opiše raspodelu dohotka.[3] Ta se ideja ponekad izražava jednostavnije kao Paretov princip ili „pravilo 80-20”, što govori da 20% stanovništva kontroliše 80% bogatstva.[4] Međutim, pravilo 80-20 odgovara određenoj vrednosti α, i zapravo, Paretovi podaci o britanskim porezima na dohodak u njegovom radu -{Cours d'économie politique}- pokazuju da je oko 30% stanovništva imalo oko 70% prihoda. Graf funkcije gustine verovatnoće (PDF) na početku ovog članka pokazuje da je „verovatnoća” ili deo populacije koja poseduje malu količinu bogatstva po osobi prilično visoka, a zatim se stalno smanjuje kako bogatstvo raste. (Paretova raspodela nije realistična za bogatstvo pri donjem kraju. Zapravo neto vrednost može čak da bude i negativna.) Ova distribucija nije ograničena na opisivanje bogatstva ili prihoda, već se susreće u mnogim situacijama u kojima je ravnoteža pronađena u distribuciji „malog” na „veliko”. Sledeći primeri se ponekad smatraju približno raspodeljenim po Paretovoj distribuciji:

- Veličine ljudskih naselja (nekoliko gradova, mnogo zaseoka/sela)[5]
- Raspodela veličina datoteka u Internet prometu koji koristi TCP protokol (mnogo manjih datoteka, nekoliko većih)[5]
- Stope grešaka tvrdih diskova[6]
- Klasteri Boze–Ajnštajnovog kondenzata u blizini apsolutne nule[7]
- Vrednosti naftnih rezerivi u naftnim poljima (nekoliko velikih polja, mnogo malih polja)[5]
- Рaspodela dužine poslova zadatih superračunarima (nekoliko velikih, puno malih)[8]
- Standardizovane cene povraćaja na individualnim deonicama[5]
- Veličine čestica peska [5]
- Veličina meteorita
- Ozbiljnost velikih gubitaka od nesreće za pojedine delatnosti kao što su opšta odgovornost, komercijalna vozila i naknade radnika.[9][10]
- Količina vremena koju će korisnik na stimu provesti igrajući razne igre. (Neke igre se puno igraju, dok se većina njih skoro nikad ne igra.)[11]
- U hidrologiji Paretova distribucija se koristi za ekstremne događaje kao što su godišnje maksimalne jednodnevne padavine i rečni ispusti.[12] Plava slika ilustruje uklapanje Paretove distribucije u rangirane godišnje maksimume jednodnevnih padavina. Takođe je prikazan 90% pojas pouzdanosti baziran na binomnoj distribuciji. Podaci o padavinama su predstavljeni pomoću Q–Q grafika kao dela analize kumulativne frekvencije.
Reference
Literatura
Spoljašnje veze
- Шаблон:Springer
- Шаблон:MathWorld
- Шаблон:Citation
- Шаблон:Cite conference
- -{syntraf1.c Шаблон:Wayback is a C program to generate synthetic packet traffic with bounded Pareto burst size and exponential interburst time.}-
- ↑ Шаблон:Cite book
- ↑ 2,0 2,1 Johnson NL, Kotz S, Balakrishnan N (1994) Continuous univariate distributions Vol 1. Wiley Series in Probability and Statistics.
- ↑ Pareto, Vilfredo, Cours d'Économie Politique: Nouvelle édition par G.-H. Bousquet et G. Busino, Librairie Droz, Geneva, 1964, pp. 299–345.
- ↑ For a two-quantile population, where approximately 18% of the population owns 82% of the wealth, the Theil index takes the value 1.
- ↑ 5,0 5,1 5,2 5,3 5,4 Шаблон:Cite journal
- ↑ Шаблон:Cite journal
- ↑ Шаблон:Cite journal
- ↑ Шаблон:Cite journal
- ↑ Kleiber and Kotz (2003): p. 94.
- ↑ Шаблон:Cite journal
- ↑ Шаблон:Cite web
- ↑ CumFreq, software for cumulative frequency analysis and probability distribution fitting [1]