David Gamarnik, and John Tsitsiklis. 6.436J Fundamentals of Probability. Fall 2008. Massachusetts Institute of Technology: MIT OpenCourseWare, https://ocw.mit.edu. License: Creative Commons BY-NC-SA.
Lecture 25. Markov Chain III. Periodicity, Mixing, Absorption
25.1 Periodicity
x∈Xがrecurrentであるとき,xがそれ自身からaccessibleである時刻,すなわちIx={n≥1:p(n)xx>0}を考える. Ixは和に対して閉じている(i.e. m,n∈Ix⇒m+n∈Ix). dxをIxの元の最大公約数として,xのperiodという. periodの諸性質を論じる.
Lemma 25-1
x,yが同じrecurrentにあるとき,dx=dyである.
proof.
p(m)xy,p(n)yx>0であるm,nを選ぶ(同じrecurrentだから存在する). p(m+n)yy≥p(m)xyp(n)yx>0だからdyはm+nを割り切る. またlをp(l)xx>0なるl∈Nとすると,pm+n+lyy≥p(n)yxp(l)xxp(m)xy>0だから,dyはm+n+lを割り切り,故にlを割り切る. したがってdyはdxを割り切る. 同じ論法でdxがdyを割り切ることも言えて,以上よりdx=dy
d>1であるようなrecurrent classをperiodicといい,d=1であるときにはaperidicという. periodicityはp(n)xyがπyに収束することを妨げている. yがperiodicなrecurrent classの元とすると,p(n)yy=0が,nがdの倍数でない限り成立するが,πy>0である. 一方d=1(aperiodic)であれば,十分大きな全てのnに,markov chainがyに戻ってくる確率が正になる.
Lemma 25-2 (証明略)
dy=1であれば,N≥1があって,n≥N⇒p(n)yy>0である.
Markov chainがただ一つのrecurrent classをもち(irreducible),かつaperiodicであるとき,steady stateの振る舞いはstationary distributionによって与えられる.この事実をmixingという.
Theorem 25-3 (証明略)
irreduibleかつaperiodicなMarkov chainがあるとき,任意のstateの組x,yについてlimn→∞p(n)xy=πy
periodicな場合には,p(n)xyの部分列の収束に関する定理が有るがここでは扱わない.
πxpxy=πypyxが任意のx,y∈Xに成り立つとき,そのMarkov chainはreversibleであるという. Theorem 25-3の仮定にreversible性を加ええ場合の重要な定理が知られている.
Theorem 25-4 (証明略)
irreducible, aperiodic, reversibleなMarkov chainについて,任意のx,y∈Xに|p(n)xy−πy|≤C|λ2|nが成り立つような定数Cが存在する.ただしλ2はPの二番目に絶対値が大きいeigenvalueとする.
|λ2|<1だから,これはp(n)xyのpiyへの収束の速さを与える.
25.2 Absorption Probabilities and Expected Time to Absorption
Markov chainの長期的な振る舞いを見てきたが,今度は短期的な振る舞いを議論する. 特にtransientなstateから始まったchainの振る舞いを考える. 簡単のため,recurrent state iはabsorbingであるとする.すなわちpii=1である. これから考察するMarkov chainはtransient classのほかは全てabsorbingとする.
absorbing state iがただ一つであるときにはπi=1であって,必ずiに到達する. 一方absorbing stateが複数存在するときには,どのabsorbing stateに至るかは確率的に決まる.
aki=P(Xneventually equals i|X0=k)
をabsorbing probabilityという. jがabsorbingならajj=0,aji=0である.
kがtransientなら
aki=P(∃n:Xn=i|X0=k)=N∑j=1P(∃n:Xn=i|X1=j)pkj=N∑j=1ajipkj
だから,この線形連立方程式を解くことでabsorption probabilityを得られる.
Example: Gambbler’s Ruin
あるギャンブラーが一回の勝負ごとにpの確率で1ドルを得て,1−pの確率で1ドルを失うとする. それぞれの勝負は独立であるとする. ギャンブラーはmドルを稼ぐか金を全て失うまで勝負を続ける. 彼が全財産を失う確率を求めよ
iはギャンブラーの持つ金額として,Markov chain X={0,1,...,m}を考える. i=0なるとき,彼は全財産を失うったということであり,i=mとなるとき,彼は目的を達成したということである. 0,mはabsorbing stateであると言える.
transition probabilityはpi,i+1=p,pi,i−1=1−pが全てのi=1,...,m−1で成立する.またp00=pmm=1である. i=0のabsorbing probabilityは
a00=1am0=0amm=1ai0=(1−p)ai−1,0+p(ai+1,0) for i=1,...,m−1
によって計算できる.bi=ai0−ai+1,0,ρ=(1−p)/pとすると,上の方程式から
(1−p)(ai−1,0−ai,0)=p(ai0−ai+1,0)bi=ρbi−1
であって,故にbi=ρib0である. b0+b1+⋯+bm−1=a00−am0=1であって, (1+ρ+...+rhom−1)b0=1であって,
bi={ρi(1−ρ)1−ρm ifρ≠11motherwise
さらにai,0はρ≠1ならばi=1,...,m−1について
ai0=a00−bi−1−...−b0=ρi−ρm1−ρm
ρ=1ならば
ai0=m−im
したがってiがいかなる値でもmが大きくなると全財産を失う確率が1に近づく.
0 件のコメント:
コメントを投稿