Ioana A. Cosma and Ludger Evers, Markov Chains and Monte Carlo Methods
http://users.aims.ac.za/~ioana/notes.pdf
CC-by-nc-sa 2.5
http://creativecommons.org/licenses/by-nc-sa/2.5/za/legalcode
Gibbs samplerが終わったし後は流れで
Chapger 5. The Metropolis-Hastings algorithms
Gibbs samplerを使うにはfull conditionalsから効率よくサンプリングできなければならなかった. また,X1,..,Xpに強い相関が有るとき,収束が遅くなるという欠陥が有る. これを克服するのがMetropolis-Hastings法である. rejection samplingのように,新しいX(t+1)をX(t)によって決まる局地的な分布に従って受理または棄却し,得られた{X(t)}をあるMarkov chainのpathと考える.
Algorithm 5.1 (Metropolis-Hastings)
X(0)=(X(0)1,...,X(0)p)を初期値として,t=1,2,...に
1. X∼q(⋅|X(t−1))をとる.
2. α(X|X(t−1))=min{1,f(X)⋅q(X(t−1)|X)f(X(t−1))⋅q(X|X(t−1))}
を計算する.
3. 確率α(X|X(t−1))でX(t)=Xとし,そうでなければX(t)=X(t−1)とする.
Lemma 5.2
Metroplis-Hastingsのtransition kernelは
K(x(t−1),x(t))=α(x(t)|x(t−1))q(x(t)|x(t−1))+(1−a(x(t−1)))δ[x(t−1)(x(t))
ここでδx(t−1)(⋅)はDirac-mass とする.
Proposition 5.3
Metropolis-Hastingsはdetailed balance
K(x(t−1),x(t))f(x(t−1))=K(x(t),x(t−1))f(x(t))
をみたす.したがってf(x)は生成されるMarkov chainのstationary distributionであり,しかもMarkov chainはreversibleである.
さらに,chainがirreducibleかつaperiodicならばMarkov chainは任意のinitial distributionでstationary distributionに収束する.
Theorem 5.5 (Ergodic theorem)
Metropolis-Hastingsによって生成されるMarkov chainがirreducibleであるとき,可測なhに
limn→∞n∑t=1h(X(t))→Ef[h(X)]
が任意の初期値に成立する.
5.3 The random walk Metropolis algorithm
Metropolis-Hastingsの特別な場合に,random walk Metropolisがある. Metropolis-Hastingsにおける提案分布qを,X=X(t−1)+ϵ,ϵ∼gに変えた場合である. ただしgは対称性をもつ分布とする(i.e. g(x)=g(−x)). このとき,X−X(t−1)∼g∼X(t−1)−Xが対称性より言えるから,
α(X|X(t−1))=min{1,f(X)⋅q(X(t−1)|X)f(X(t−1))⋅q(X|X(t−1))}=min{1,f(X)f(X(t−1))}
つまり
#### Algorithm 5.2 (Random walk Metropolis)
X(0)=(X(0)1,...,X(0)p)を初期値として,以下をt=1,2,...に繰り返す
1. ϵ∼gをとって,X=X(t−1)+ϵ
2. α(X|X(t−1))=min{1,f(X)f(X(t−1))}
3. 確率α(X|X(t−1))でX(t)=Xとし,そうでなければX(t)=X(t−1)とする.
Example 5.2 (Bayesian probit model)
帝王切開による出産の際の感染の有無の調査(table 1)
![]()
ni人の患者のうちの感染数Yiを推測する.
Yi∼Bin(ni,πi), π=Φ(z′iβ)を仮定する.
ただしzi=(1,zi1,zi2,zi3), ΦはN(0,1)のCDFとする.
βのprior distributionにはN(0,I/λ)を使う. βのposterior densityは
f(β|y1,...,yn)∝(n∏i=1Φ(zTiβ)yi(1−Φ(zTiβ))ni−yi)exp(−λ23∑j=0β2j)
random walk Metropolis を使ってこのposterior からサンプリングを行う. 初期値β(0)を適当に決めて,t=1,2,...で
1. ϵ∼N(0,Σ),β=β(t−1)+ϵを計算する
2. α(β|β(t−1))=min{1,f(β|Y1,...,Yn)/f(β(t−1)|Y1,...,Yn)}を計算する
3. 確率αでβ(t)=β, そうでなければβ(t)=β(t−1)とする.を繰り返す. Σ=0.08Iとする.
table 5.2 とfig. 5.3が50000サンプルを取ったときの一つの結果である. ただし最初の10000サンプルは排除している.
5.4 Choosing the proposal distribution
Metropolis-Hastingsの効率はproposal distribution qの選び方に強く依存している. q(⋅|X(t−1))はX(t−1)から離れたところに山をもっているのが望ましいし,またα(X|X(t−1))が大きいことが望ましい. この二つは相反する要求である.
経験的に,1か2次元のモデルでは受理率は1/2程度がよく,3次元以上のモデルでは1/4程度が良いと知られている.
0 件のコメント:
コメントを投稿