Loading [MathJax]/jax/output/HTML-CSS/jax.js

2017年8月22日火曜日

MIT OCW, Fundamentals of Probability 24日目 Markov Chain III

David Gamarnik, and John Tsitsiklis. 6.436J Fundamentals of Probability. Fall 2008. Massachusetts Institute of Technology: MIT OpenCourseWare, https://ocw.mit.edu. License: Creative Commons BY-NC-SA.

Lecture 25. Markov Chain III. Periodicity, Mixing, Absorption

25.1 Periodicity

xXがrecurrentであるとき,xがそれ自身からaccessibleである時刻,すなわちIx={n1:p(n)xx>0}を考える. Ixは和に対して閉じている(i.e. m,nIxm+nIx). dxIxの元の最大公約数として,xperiodという. periodの諸性質を論じる.

Lemma 25-1

x,yが同じrecurrentにあるとき,dx=dyである.

proof.

p(m)xy,p(n)yx>0であるm,nを選ぶ(同じrecurrentだから存在する). p(m+n)yyp(m)xyp(n)yx>0だからdym+nを割り切る. またlp(l)xx>0なるlNとすると,pm+n+lyyp(n)yxp(l)xxp(m)xy>0だから,dym+n+lを割り切り,故にlを割り切る. したがってdydxを割り切る. 同じ論法でdxdyを割り切ることも言えて,以上よりdx=dy

d>1であるようなrecurrent classをperiodicといい,d=1であるときにはaperidicという. periodicityはp(n)xyπyに収束することを妨げている. yがperiodicなrecurrent classの元とすると,p(n)yy=0が,ndの倍数でない限り成立するが,πy>0である. 一方d=1(aperiodic)であれば,十分大きな全てのnに,markov chainがyに戻ってくる確率が正になる.

Lemma 25-2 (証明略)

dy=1であれば,N1があって,nNp(n)yy>0である.

Markov chainがただ一つのrecurrent classをもち(irreducible),かつaperiodicであるとき,steady stateの振る舞いはstationary distributionによって与えられる.この事実をmixingという.

Theorem 25-3 (証明略)

irreduibleかつaperiodicなMarkov chainがあるとき,任意のstateの組x,yについてlimnp(n)xy=πy

periodicな場合には,p(n)xyの部分列の収束に関する定理が有るがここでは扱わない.
πxpxy=πypyxが任意のx,yXに成り立つとき,そのMarkov chainはreversibleであるという. Theorem 25-3の仮定にreversible性を加ええ場合の重要な定理が知られている.

Theorem 25-4 (証明略)

irreducible, aperiodic, reversibleなMarkov chainについて,任意のx,yX|p(n)xyπy|C|λ2|nが成り立つような定数Cが存在する.ただしλ2Pの二番目に絶対値が大きいeigenvalueとする.

|λ2|<1だから,これはp(n)xypiyへの収束の速さを与える.

25.2 Absorption Probabilities and Expected Time to Absorption

Markov chainの長期的な振る舞いを見てきたが,今度は短期的な振る舞いを議論する. 特にtransientなstateから始まったchainの振る舞いを考える. 簡単のため,recurrent state iabsorbingであるとする.すなわちpii=1である. これから考察するMarkov chainはtransient classのほかは全てabsorbingとする.
absorbing state iがただ一つであるときにはπi=1であって,必ずiに到達する. 一方absorbing stateが複数存在するときには,どのabsorbing stateに至るかは確率的に決まる.
aki=P(Xneventually equals i|X0=k)
をabsorbing probabilityという. jがabsorbingならajj=0,aji=0である.
kがtransientなら
aki=P(n:Xn=i|X0=k)=Nj=1P(n:Xn=i|X1=j)pkj=Nj=1ajipkj
だから,この線形連立方程式を解くことでabsorption probabilityを得られる.

Example: Gambbler’s Ruin

あるギャンブラーが一回の勝負ごとにpの確率で1ドルを得て,1pの確率で1ドルを失うとする. それぞれの勝負は独立であるとする. ギャンブラーはmドルを稼ぐか金を全て失うまで勝負を続ける. 彼が全財産を失う確率を求めよ

iはギャンブラーの持つ金額として,Markov chain X={0,1,...,m}を考える. i=0なるとき,彼は全財産を失うったということであり,i=mとなるとき,彼は目的を達成したということである. 0,mはabsorbing stateであると言える.
transition probabilityはpi,i+1=p,pi,i1=1pが全てのi=1,...,m1で成立する.またp00=pmm=1である. i=0のabsorbing probabilityは
a00=1am0=0amm=1ai0=(1p)ai1,0+p(ai+1,0)     for i=1,...,m1
によって計算できる.bi=ai0ai+1,0,ρ=(1p)/pとすると,上の方程式から
(1p)(ai1,0ai,0)=p(ai0ai+1,0)bi=ρbi1
であって,故にbi=ρib0である. b0+b1++bm1=a00am0=1であって, (1+ρ+...+rhom1)b0=1であって,
bi={ρi(1ρ)1ρm   ifρ11motherwise
さらにai,0ρ1ならばi=1,...,m1について
ai0=a00bi1...b0=ρiρm1ρm
ρ=1ならば
ai0=mim
したがってiがいかなる値でもmが大きくなると全財産を失う確率が1に近づく.

Discrete Stochastic Processesに続く

0 件のコメント:

コメントを投稿