Loading [MathJax]/jax/output/HTML-CSS/jax.js

2017年9月8日金曜日

Markov Chains and Monte Carlo Methods 09日目

Ioana A. Cosma and Ludger Evers, Markov Chains and Monte Carlo Methods
http://users.aims.ac.za/~ioana/notes.pdf
CC-by-nc-sa 2.5
http://creativecommons.org/licenses/by-nc-sa/2.5/za/legalcode

Gibbs samplerが終わったし後は流れで

Chapger 5. The Metropolis-Hastings algorithms

Gibbs samplerを使うにはfull conditionalsから効率よくサンプリングできなければならなかった. また,X1,..,Xpに強い相関が有るとき,収束が遅くなるという欠陥が有る. これを克服するのがMetropolis-Hastings法である. rejection samplingのように,新しいX(t+1)X(t)によって決まる局地的な分布に従って受理または棄却し,得られた{X(t)}をあるMarkov chainのpathと考える.

Algorithm 5.1 (Metropolis-Hastings)

X(0)=(X(0)1,...,X(0)p)を初期値として,t=1,2,...
1. Xq(|X(t1))をとる.
2. α(X|X(t1))=min{1,f(X)q(X(t1)|X)f(X(t1))q(X|X(t1))}
を計算する.
3. 確率α(X|X(t1))X(t)=Xとし,そうでなければX(t)=X(t1)とする.

Lemma 5.2

Metroplis-Hastingsのtransition kernelは
K(x(t1),x(t))=α(x(t)|x(t1))q(x(t)|x(t1))+(1a(x(t1)))δ[x(t1)(x(t))
ここでδx(t1)()はDirac-mass とする.

Proposition 5.3

Metropolis-Hastingsはdetailed balance
K(x(t1),x(t))f(x(t1))=K(x(t),x(t1))f(x(t))
をみたす.したがってf(x)は生成されるMarkov chainのstationary distributionであり,しかもMarkov chainはreversibleである.

さらに,chainがirreducibleかつaperiodicならばMarkov chainは任意のinitial distributionでstationary distributionに収束する.

Theorem 5.5 (Ergodic theorem)

Metropolis-Hastingsによって生成されるMarkov chainがirreducibleであるとき,可測なh
limnnt=1h(X(t))Ef[h(X)]
が任意の初期値に成立する.

5.3 The random walk Metropolis algorithm

Metropolis-Hastingsの特別な場合に,random walk Metropolisがある. Metropolis-Hastingsにおける提案分布qを,X=X(t1)+ϵ,ϵgに変えた場合である. ただしgは対称性をもつ分布とする(i.e. g(x)=g(x)). このとき,XX(t1)gX(t1)Xが対称性より言えるから,
α(X|X(t1))=min{1,f(X)q(X(t1)|X)f(X(t1))q(X|X(t1))}=min{1,f(X)f(X(t1))}
つまり
#### Algorithm 5.2 (Random walk Metropolis)

X(0)=(X(0)1,...,X(0)p)を初期値として,以下をt=1,2,...に繰り返す
1. ϵgをとって,X=X(t1)+ϵ
2. α(X|X(t1))=min{1,f(X)f(X(t1))}
3. 確率α(X|X(t1))X(t)=Xとし,そうでなければX(t)=X(t1)とする.

Example 5.2 (Bayesian probit model)

帝王切開による出産の際の感染の有無の調査(table 1)
enter image description here
ni人の患者のうちの感染数Yiを推測する.
YiBin(ni,πi),  π=Φ(ziβ)を仮定する.
ただしzi=(1,zi1,zi2,zi3), ΦN(0,1)のCDFとする.
βのprior distributionにはN(0,I/λ)を使う. βのposterior densityは
f(β|y1,...,yn)(ni=1Φ(zTiβ)yi(1Φ(zTiβ))niyi)exp(λ23j=0β2j)
random walk Metropolis を使ってこのposterior からサンプリングを行う. 初期値β(0)を適当に決めて,t=1,2,...
1. ϵN(0,Σ),β=β(t1)+ϵを計算する
2. α(β|β(t1))=min{1,f(β|Y1,...,Yn)/f(β(t1)|Y1,...,Yn)}を計算する
3. 確率αβ(t)=β, そうでなければβ(t)=β(t1)とする.

を繰り返す. Σ=0.08Iとする.
table 5.2 とfig. 5.3が50000サンプルを取ったときの一つの結果である. ただし最初の10000サンプルは排除している.

enter image description here

5.4 Choosing the proposal distribution

Metropolis-Hastingsの効率はproposal distribution qの選び方に強く依存している. q(|X(t1))X(t1)から離れたところに山をもっているのが望ましいし,またα(X|X(t1))が大きいことが望ましい. この二つは相反する要求である.
経験的に,1か2次元のモデルでは受理率は1/2程度がよく,3次元以上のモデルでは1/4程度が良いと知られている.

0 件のコメント:

コメントを投稿