Loading [MathJax]/jax/output/HTML-CSS/jax.js

2017年8月17日木曜日

MIT OCW, Fundamentals of Probability 23日目 Markov Chain II

David Gamarnik, and John Tsitsiklis. 6.436J Fundamentals of Probability. Fall 2008. Massachusetts Institute of Technology: MIT OpenCourseWare, https://ocw.mit.edu. License: Creative Commons BY-NC-SA.

Lecture 24. Markov Chains II. Mean Reccurence Time

24.1 Markov Chains with a Single Recurrence Class

前章でrecurrenceの関係は同値関係であり,Tをtransientの集合とすると,XTによって同値類別できることを見た.また同値類はR1,...,Rrとする.でできた同値類のそれぞれをclassとよぶことにする

Lemma 24.1

任意の同値類Rkにおいて,iRkかつjRkならばpi,j=0
すなわち,一旦ある同値類Rkに入ったら,その後どう遷移しようとRkからは抜け出せない.

proof.

pi,j>0ij. iはrecurrentだからjiであり,jRk. これは矛盾.

Ti=min{n1:Xn=i|X0=i}
というrandom variableを,を許して導入する.これをthe first passage timeという.

Lemma 24.2

任意のiTに, P(Xn=i,i.o.)=0である. すなわち,有限時間ステップの経過後にchainがiに戻ってくることは殆ど全く無く,またE[Ti]=である.

proof.

定義よりij,jiなるjTがある. ゆえにP(Ti=)>0であって,Ti0だからE[Ti]=が成立する.
Ii,mを, chainが少なくともmiに戻ってくるというeventとする. P(Ii,1)=P(Ti<)である.またLemma24.1からP(Ii,1)<1.
state im1回目に到達したときから見て,次にiに到達する確率というのは,iからiに1回推移する確率に等しいというのがMarkov性から言えるので,(Ii,m|Ii,m1)=P(Ti<)が成り立ち,また明らかにIi,mIi,m1であって, P(Ii,m)=P(Ii,m|Ii,m1)P(Ii,m1)=P(Ti<)P(Ii,m1)==P(Ti<)m. P(Ti<)<1だから,probabilityの連続性を使って,P(mIi,m)=limP(Ii,m)=limmP(Ti<)m=0.Xn=i, i.o.mIi,mと一致するから,補題が示せた.

Exercise 1.

TXを示せ.

答案.

X=Tを仮定する. P(Xn=i, i.o.)=0が任意のiX={1,...,N}に成立するから,P(XnX, i.o.)=0つまり有限時間ステップの後,殆ど必ずこのMarkov chainはどのstateにも到達していない. これは不合理.

Exercise 2.

iTπは任意のstationary distributionとする. πi=0を示せ.

答案.

πi>0を仮定する.πi=1kNpk,iπkである.iTなら,少なくともひとつのπk>0,pk,i>0なるkがある.kRならばikkTに反するからkTである.πk>0なので,同じ論法でklTなるlがあって,li,k.繰り返して,ikllnなる{ln}Tがある. |T|<|X|<から,この列はいつか終わり,その終点lMでは0πlM=1jNpj,lMπj=0πj=0 これは矛盾.

Exercise 3.

M.c. {Xn}がrecurrent class Rをもち,iRならばP(Xn=i, i.o.)=1を示せ.また,P(Ti>t)Cqtが任意のt0になりたつような0<q<1,C>0が存在することを示し,最後にE[Ti]<を示せ.

答案.

あるjiがあってijiだから,P(Ti<)=1. Lemma 24.2の証明と同じ論法でP(Xn=i i.o.)=P(mIi,m)=limmP(Ti<))m=1.
ビーンもうダメ

recurrent class がただ一つであるMarkov chainの例をいくつか挙げる. 特にT=ϕであるとき,このMarkov chainはirreducibleという.μi=E[Ti]を許して定義するとき,これをiにおけるmean recurrence timeという.

24.2 Uniqueness of the Stationary Distibution

Theorem 24-3 (証明略)

recurrence class がただ一つしか無い有限Markov chainは固有のstationary distribution πをもち,πi=1/μiである.特にiがrecurrentであるとき,またそのときにのみπi>0となる.

24.3 Ergodic Theorem

Ni(t)を,0,1,...,tの間にiXにchain が到達した回数とする. Ni(t)/tπiである.このように,tに依存する確率変数をtで割った確率変数の極限のもつ性質をergodic properties(エルゴード性)という. これは,chaihの時間的な平均Ni(t)/tが,空間的な平均πiに近づくという著しい主張である.

Theorem 24-9 (証明略)

任意のkXを初期状態X0=kとして, また任意のiXに,limtNi(t)/t=πi  a.s.であり, limtE[Ni(t)]/t=πiである.

正直わからないのでなにかいい本を探してじっくり読みたい(願望)

0 件のコメント:

コメントを投稿