Ланци Маркова

Извор: testwiki
Пређи на навигацију Пређи на претрагу

У математици ланац Маркова означава дискретни Марковљев случајни процес. Име је добио по Марков Андреју, руском математичару, који је глас стекао својим истраживањима у овој грани науке. Имати својство Маркова значи, укратко, да поред датог тренутног стања, будуће стање система не зависи од прошлих. Другим речима, то значи, да опис садашњости у потпуности садржи информацију која може утицати на будуће стање процеса.[1][2][3]

Дакле, поред дате садашњости, будућност не зависи од прошлости. Ништа што се догодило у прошлости, не утиче, не даје прогнозу у погледу будућности, у будућности је све могуће. Основни пример је бацање новчића – ако први пут добијемо главу, други пут с подједнаким шансама можемо добити главу или писмо. Ако пак добијамо главу 100 пута заредом, и тада је вероватноћа да ћемо 101. пут добити главу иста као и да ћемо добити писмо – другим речима, прошлост не предвиђа будући резултат. Тренутно стање је да имамо новчић са главом и писмом на своје две стране. Претпостављајући правилна извођења експеримента, ништа друго не може утицати на будући исход. Други пример може да буде случајна шетња по бројној оси, где се, при сваком кораку, позиција мења за 1 (у једном или другом смеру једнако вероватно). Са сваке позиције постоје два могућа прелаза: на следећи или на претходни цео број. Вероватноће прелаза тада зависе само од тренутног стања, а не од начина како се до њега дошло. На пример, ако је тренутна позиција −3, прелаз у −2 има вероватноћу 0,5, без обзира на претходне позиције. У сваком тренутку систем, на основу дате расподеле случајне променљиве, може променити стање, или остати у истом. Промене стања називамо прелазима, а вероватноће, које се односе на различите промене стања, називамо вероватноћама прелаза.

Ланци Маркова имају мноштво апликација као статистички модели процеса стварног света,[1][4][5][6] као што је изучавање контролних система темпомата у моторним возилима, утврђивање трендова редова или линија путника који долазе на аеродром, варијација девизних курсева и популационе динамике животиња.[7] Марковљеви процеси су основа за општи стохастички метод симулација, познат као Марковљев ланац Монте Карло, који се користи за симулацију узорковања из сложених дистрибуција вероватноће и који је нашао примену у Бајесовој статистици и вештачкој интелигенцији.[7][8][9]

Формална дефиниција

Ланци Маркова представљају значајну класу зависних случајних променљивих. Низ случајних променљивих X1, X2, X3, … називамо ланцем Маркова, ако важи својство Маркова, тј.:

Pr(Xn+1=x|Xn=xn,,X1=x1)=Pr(Xn+1=x|Xn=xn).

Могуће вредности Xi су из пребројивог скупа S. Овај скуп назива се скуп стања. Ланце Маркова можемо приказати и усмереним графовима, где су чворови поједина стања, а вредности написане на гранама представљају вероватноће прелаза (у одговарајућем смеру).


Типови

Говоримо о ланцу Маркова са стационарним вероватноћама стања (хомогеном ланцу Маркова), ако вероватноће прелаза не зависе од времена, то јест:

Pr(Xn+1=jXn=i)=pij

независно од n.

Ланци Маркова реда m (са меморијом m) су они за које важи (за коначно m):

Pr(Xn=xn|Xn1=xn1,Xn2=xn2,,X1=x1)
=Pr(Xn=xn|Xn1=xn1,Xn2=xn2,,Xnm=xnm)

за свако n. Другим речима, будуће стање зависи од m пређашњих. У случају m=1 ради се о простом ланцу Маркова.

Особине ланаца Маркова

Прво је потребно да уведемо појам вероватноће прелаза за један корак:

pij=Pr(X1=jX0=i).

и појам вероватноће прелаза за n корака:

pij(n)=Pr(Xn=jX0=i)

Прво означава вероватноћу прелаза из стања i у стање j из једног корака, а потоње из n корака, под претпоставком да је Pr(X0=i)>0.

За хомогене ланце Маркова:

pij=Pr(Xk+1=jXk=i).

и

pij(n)=Pr(Xn+k=jXk=i)

па прелазак из n корака задовољава једначину Чепман-Колмогорова, да за свако k за које важи 0 < k < n,

pij(n)=rSpir(k)prj(nk)

где је S скуп стања ланца Маркова.

Доказ

Применом својства Маркова и уопштене формуле тоталне вероватноће, важи следеће:

pij(n)=Pr(Xn=jX0=i)=rSPr(Xn=jXk=r,X0=i)Pr(Xk=rX0=i)=rSPr(Xn=jXk=r)Pr(Xk=rX0=i)=rSpir(k)prj(nk)

што је требало доказати.

Маргинална расподела Pr(Xn = x) је расподела над стањима у тренутку n. Почетна расподела је Pr(X0 = x).

Ергодичност

Ланац Маркова се назива ергодичан ако је могуће прећи из било ког стања у било које стање (не обавезно у једном кораку).

Регуларност

Ланац Маркова је регуларан ако неки степен матрице прелаза има само позитивне елементе. Другим речима, за неко n, могуће је прећи из било ког стања у било које друго стање у тачно n корака. Из дефиниције се види да је сваки регуларан ланац и ергодичан, обрнуто не мора да важи.

Матрица прелаза је матрица чији је (i, j)-ти елемент једнак

pij=Pr(Xn+1=jXn=i).

и она показује како су распоређене вероватноће прелаза.

Фундаментална гранична теорема за регуларне ланце Маркова

Нека је P матрица прелаза за регуларан ланац. Тада limn𝐏n=𝐏*, где је P* матрица чије су све врсте једнаке p*. Све компоненте вектора p* су позитивне, и збир им је 1.

Доказ

Треба, у суштини, доказати да елементи сваке колоне матрице 𝐏n теже да буду једнаки (тј. да су све врсте те матрице једнаке). Напоменимо да ј-та колона од 𝐏n је 𝐏n𝐲 где је 𝐲 вектор колона са јединицом на ј-том месту, и нулама на осталим местима. Према томе, практично треба доказати да за сваки вектор колону 𝐲, 𝐏n𝐲 тежи константном вектору кад n тежи бесконачности. Како је свака врста матрице P вектор вероватноћа, 𝐏n𝐲 замењује 𝐲 са математичким очекивањима његових компоненти (врши неку врсту упросечавања). Компоненте вектора 𝐏n𝐲 су ближе једна другој него компоненте вектора 𝐲. Показаћемо да разлика између максималне и минималне компоненте тежи нули кад n тежи бесконачности. То у суштини значи да вероватноћа да ће се систем наћи у неком стању после великог броја корака не зависи од почетног стања. Нека је P матрица прелаза димензија r×r, без нултих елемената. Узмимо да је l најмања вредност у тој матрици. Нека је 𝐲 вектор колона са r елемената, од којих је највећи M0, а најмањи m0. Нека су M1 и m1 највећа и најмања компонента (респективно) вектора 𝐏n𝐲. Пошто је сваки елемент матрице 𝐏n𝐲 математичко очекивање елемената из 𝐲, највеће могуће очекивање се може добити ако сви (осим једног) елементи вектора 𝐲 имају вредност M0, а један има вредност m0, и он се множи са l, да би најмање доприносио. У том случају математичко очекивање износи

lm0+(1l)M0.

Слично, најмање могуће очекивање је једнако

lM0+(1l)m0.

Тако,

M1m1(lm0+(1l)M0)(lM0+(1l)m0)=(12l)(M0m0).

Ово ће нам помоћи у доказу фундаменталне граничне теореме за регуларне ланце Маркова. Доказаћемо теорему за специјалан случај да је P без елемената који су једнаки нули, а после ћемо уопштити. Нека је 𝐲 вектор колона са r елемената, где је r број стања у ланцу. Претпоставићемо да је r>1 (јер се иначе своди на тривијално). Нека су Mn и mn, максимална и минимална компонента вектора 𝐏n𝐲. Вектор 𝐏n𝐲 се добија множењем (слева) вектора 𝐏n1𝐲 вектором P. Према томе, свака компонента вектора 𝐏n𝐲 представља средњу вредност компоненти из 𝐏n1𝐲. Тако је M0M1M2... и m0m1m2.... Оба ова низа су монотона и ограничена, m0mnMnM0. Према томе, оба низа ће имати граничну вредност кад n тежи бесконачности (низови су конвергентни). Нека је M гранична вредност од Mn, а m од mn. Знамо да је mM. Треба да докажемо да је M-m=0. Показали смо да важи Mnmn(12l)(Mn1mn1). Из овога је очигледно Mnmn(12l)n(M0m0). Како је r2, тако мора бити и l1/2, тј. 012l1, а пошто се број између 0 и 1 диже на експонент који тежи бесконачности, јасно је да ће разлика Mnmn тежити тада нули. Према томе, сви елементи 𝐏n𝐲 ће тежити неком броју u. Нека је сада 𝐲 вектор чија је ј-та компонента једнака 1, а све остале су једнаке нули. Тада је 𝐏n𝐲 ј-та колона од 𝐏n. Понављајући поступак за свако ј доказује се да колоне 𝐏n теже константим векторима колонама. Може се рећи да врсте матрице 𝐏n теже заједничком вектору врсти p*, tj. limn𝐏n=𝐏*. Остало је да се докаже да су сви елементи матрице P* строго позитивни. Ако узмемо исти вектор колону 𝐲 (са једном јединицом и свим нулама), 𝐏𝐲 је ј-та колона од 𝐏, а сви њени елементи су позитивни (по нашој почетној претпоставци). Најмањи елемент вектора 𝐏𝐲 је дефинисан као m1 , па је m1>0. Како је m1m, имамо да је и m>0, а ова вредност m је заправо ј-та компонента од p*, па су према томе све компоненте p* строго позитивне.

Овај доказ се, међутим, односио на случај да P нема нултих елемената (нисмо претпоставили да је P регуларна). Претпоставимо да је P регуларна. Тада, за неко N, 𝐏N𝐲 нема нула. Дати доказ показује да MnN-mnN тежи нули кад n тежи бесконачности. Али, разлика MnN-mnN се не може повећавати (кад је l=0, у најгорем случају разлика може остати иста). Ако знамо да разлике које се добију посматрањем сваких N пута теже нули, тада и цео низ мора тежити нули. Тиме је доказ завршен.

Референце

Шаблон:Reflist

Литература

Шаблон:Литература

  • A. A. Markov (1906) "Rasprostranenie zakona bol'shih chisel na velichiny, zavisyaschie drug ot druga". Izvestiya Fiziko-matematicheskogo obschestva pri Kazanskom universitete, 2-ya seriya, tom 15, pp. 135–156.
  • A. A. Markov. "Extension of the limit theorems of probability theory to a sum of variables connected in a chain". reprinted in Appendix B of: R. Howard. Dynamic Probabilistic Systems, volume 1: Markov Chains. John Wiley and Sons, 1971.
  • Classical Text in Translation: Шаблон:Cite journal
  • Leo Breiman (1992) [1968] Probability. Original edition published by Addison-Wesley; reprinted by Society for Industrial and Applied Mathematics Шаблон:ISBN. (See Chapter 7)
  • J. L. Doob (1953) Stochastic Processes. New York: John Wiley and Sons Шаблон:ISBN.
  • S. P. Meyn and R. L. Tweedie (1993) Markov Chains and Stochastic Stability. London: Springer-Verlag Шаблон:ISBN. online: MCSS . Second edition to appear, Cambridge University Press, 2009.
  • S. P. Meyn. Control Techniques for Complex Networks. Cambridge University Press, 2007. Шаблон:ISBN. Appendix contains abridged Meyn & Tweedie. online: Шаблон:Cite book Extensive, wide-ranging book meant for specialists, written for both theoretical computer scientists as well as electrical engineers. With detailed explanations of state minimization techniques, FSMs, Turing machines, Markov processes, and undecidability. Excellent treatment of Markov processes pp. 449ff. Discusses Z-transforms, D transforms in their context.
  • Шаблон:Cite book Classical text. cf Chapter 6 Finite Markov Chains pp. 384ff.
  • John G. Kemeny & J. Laurie Snell (1960) Finite Markov Chains, D. van Nostrand Company Шаблон:ISBN
  • E. Nummelin. "General irreducible Markov chains and non-negative operators". Cambridge University Press, 1984, 2004. Шаблон:ISBN
  • Seneta, E. Non-negative matrices and Markov chains. 2nd rev. ed., 1981, XVI, 288 p., Softcover Springer Series in Statistics. (Originally published by Allen & Unwin Ltd., London, 1973) Шаблон:ISBN
  • Kishor S. Trivedi, Probability and Statistics with Reliability, Queueing, and Computer Science Applications, John Wiley & Sons, Inc. New York, 2002. Шаблон:ISBN.
  • K. S. Trivedi and R.A.Sahner, SHARPE at the age of twenty-two, vol. 36, no. 4, pp. 52–57, ACM SIGMETRICS Performance Evaluation Review, 2009.
  • R. A. Sahner, K. S. Trivedi and A. Puliafito, Performance and reliability analysis of computer systems: an example-based approach using the SHARPE software package, Kluwer Academic Publishers, 1996. Шаблон:ISBN.
  • G. Bolch, S. Greiner, H. de Meer and K. S. Trivedi, Queueing Networks and Markov Chains, John Wiley, 2nd edition, 2006. Шаблон:ISBN.

Шаблон:Литература крај

Спољашње везе

Шаблон:Commons category Шаблон:Литература

Шаблон:Литература крај

Шаблон:Нормативна контрола