Robert Gallager. 6.262 Discrete Stochastic Processes. Spring 2011. Massachusetts Institute of Technology: MIT OpenCourseWare, https://ocw.mit.edu. License: Creative Commons BY-NC-SA.
Lecture videoを要約していく.
Lecture 3. Laws of Large Numbers, Convergence
Markov, Chebychev, Chernoff bounds
Markov inequality
Y≥0,y>0なら
Pr(Y≥y)≤E[Y]y
Chebyshev inequality
ϵ>0に
Pr(|Z−E[Z]|≥ϵ)≤σ2Zϵ2=var[Z]ϵ2
Chernoff bound
任意のz>0,r>0にmoment generationg function gZ(r)=E[erZ]が定義されているなら,
Pr(Z≥z)≤gZ(r)exp(−rz)
proof.
Y=erZとする. E[Y]=gZ(r)で,y>0にMarkov inequalityを使って
Pr(Y≥y)≤gZ(r)/yすなわちPr(erZ≥y)≤gZ(r)/y
z=(logy)/r⇔y=erzとzを導入すると,Pr(Z≥z)≤gZ(r)exp(−rz)がたしかに成立.
Markov, Chebyshev, Chernoffを見比べると,Markovはy−1, Chebyshevはy−2に従って上限が小さくなるのに対し,Chernoffの上限は指数的に上限が小さくなる.これがChernoff boundの有用性の理由である.
Convergence
Weak Law of Large Numbers
X1,...,XnはIIDで,ˉX=E[X1],σ2=σ2X1とする.
Sn=X1+...+Xnとするとσ2Sn=nσ2である.
Sn/nの振る舞いを見る.
var[Sn/n]=nσ2/n2=σ2/n→0(n→∞)だから
limn→∞E[(Snn−X)2]=0. これをSn/n converges in mean square to ˉXという. 前者はIIDでないときには成り立たないし,分散が存在しないときにも成り立たないが,このようなときでも実は後者は成立する.
Definition
Y1,...,YnがYにconverges in mean square to Y
⇔limE[(Yn−Y)2]=0
ここでChebishev’s inequalityを使って
Pr(|Snn−ˉX|≥ϵ)≤σ2nϵ2→0
以上より,weak law of large numbers(WLLN, 大数の弱法則)
∀ϵ>0. limn→∞Pr(|Snn−ˉX|≥ϵ))=0
が示せた. (IIDの仮定に注意,varianceは存在しなくても良い)これはPr(Sn/n≤x)のdistributionがnの極限でx≤ˉXで0, x≥ˉXで1をとるステップ関数になるということである
Central Limit Theorem
limn→∞[Pr(Sn−nˉX√nσ≤y)]=∫y−∞1√2πexp(−x22)dx
0 件のコメント:
コメントを投稿