David Gamarnik, and John Tsitsiklis. 6.436J Fundamentals of Probability. Fall 2008. Massachusetts Institute of Technology: MIT OpenCourseWare, https://ocw.mit.edu. License: Creative Commons BY-NC-SA.
Lecture 24. Markov Chains II. Mean Reccurence Time
24.1 Markov Chains with a Single Recurrence Class
前章でrecurrenceの関係↔は同値関係であり,Tをtransientの集合とすると,X∖Tは↔によって同値類別できることを見た.また同値類はR1,...,Rrとする.↔でできた同値類のそれぞれをclassとよぶことにする
Lemma 24.1
任意の同値類Rkにおいて,i∈Rkかつj∉Rkならばpi,j=0
すなわち,一旦ある同値類Rkに入ったら,その後どう遷移しようとRkからは抜け出せない.
proof.
pi,j>0⇒i→j. iはrecurrentだからj→iであり,j∈Rk. これは矛盾.
Ti=min{n≥1:Xn=i|X0=i}
というrandom variableを,∞を許して導入する.これをthe first passage timeという.
Lemma 24.2
任意のi∈Tに, P(Xn=i,i.o.)=0である. すなわち,有限時間ステップの経過後にchainがiに戻ってくることは殆ど全く無く,またE[Ti]=∞である.
proof.
定義よりi→j,j↛iなるj∉Tがある. ゆえにP(Ti=∞)>0であって,Ti≥0だからE[Ti]=∞が成立する.
Ii,mを, chainが少なくともm回iに戻ってくるというeventとする. P(Ii,1)=P(Ti<∞)である.またLemma24.1からP(Ii,1)<1.
state iにm−1回目に到達したときから見て,次にiに到達する確率というのは,iからiに1回推移する確率に等しいというのがMarkov性から言えるので,(Ii,m|Ii,m−1)=P(Ti<∞)が成り立ち,また明らかにIi,m⊂Ii,m−1であって, P(Ii,m)=P(Ii,m|Ii,m−1)P(Ii,m−1)=P(Ti<∞)P(Ii,m−1)=⋯=P(Ti<∞)m. P(Ti<∞)<1だから,probabilityの連続性を使って,P(∩mIi,m)=limP(Ii,m)=limmP(Ti<∞)m=0.Xn=i, i.o.は∩mIi,mと一致するから,補題が示せた.
Exercise 1.
T≠Xを示せ.
答案.
X=Tを仮定する. P(Xn=i, i.o.)=0が任意のi∈X={1,...,N}に成立するから,P(Xn∈X, i.o.)=0つまり有限時間ステップの後,殆ど必ずこのMarkov chainはどのstateにも到達していない. これは不合理.
Exercise 2.
i∈Tで πは任意のstationary distributionとする. πi=0を示せ.
答案.
πi>0を仮定する.πi=∑1≤k≤Npk,iπkである.i∈Tなら,少なくともひとつのπk>0,pk,i>0なるkがある.k∈Rならばi↔kでk∈Tに反するからk∈Tである.πk>0なので,同じ論法でk←l∈Tなるlがあって,l≠i,k.繰り返して,i←k←l←⋯←ln←⋯なる{ln}⊂Tがある. |T|<|X|<∞から,この列はいつか終わり,その終点lMでは0≠πlM=∑1≤j≤Npj,lMπj=∑0πj=0 これは矛盾.
Exercise 3.
M.c. {Xn}がrecurrent class Rをもち,i∈RならばP(Xn=i, i.o.)=1を示せ.また,P(Ti>t)≤Cqtが任意のt≥0になりたつような0<q<1,C>0が存在することを示し,最後にE[Ti]<∞を示せ.
答案.
あるj∈iがあってi→j→iだから,P(Ti<∞)=1. Lemma 24.2の証明と同じ論法でP(Xn=i i.o.)=P(∪mIi,m)=limmP(Ti<∞))m=1.
ビーンもうダメ
recurrent class がただ一つであるMarkov chainの例をいくつか挙げる. 特にT=ϕであるとき,このMarkov chainはirreducibleという.μi=E[Ti]を∞を許して定義するとき,これをiにおけるmean recurrence timeという.
24.2 Uniqueness of the Stationary Distibution
Theorem 24-3 (証明略)
recurrence class がただ一つしか無い有限Markov chainは固有のstationary distribution πをもち,πi=1/μiである.特にiがrecurrentであるとき,またそのときにのみπi>0となる.
24.3 Ergodic Theorem
Ni(t)を,0,1,...,tの間にi∈Xにchain が到達した回数とする. Ni(t)/t→πiである.このように,tに依存する確率変数をtで割った確率変数の極限のもつ性質をergodic properties(エルゴード性)という. これは,chaihの時間的な平均Ni(t)/tが,空間的な平均πiに近づくという著しい主張である.
Theorem 24-9 (証明略)
任意のk∈Xを初期状態X0=kとして, また任意のi∈Xに,limt→∞Ni(t)/t=πi a.s.であり, limt→∞E[Ni(t)]/t=πiである.
正直わからないのでなにかいい本を探してじっくり読みたい(願望)