Loading [MathJax]/jax/output/HTML-CSS/jax.js

2017年8月9日水曜日

MIT OCW, Fundamentals of Probability 19日目 大数の法則と中心極限定理

David Gamarnik, and John Tsitsiklis. 6.436J Fundamentals of Probability. Fall 2008. Massachusetts Institute of Technology: MIT OpenCourseWare, https://ocw.mit.edu. License: Creative Commons BY-NC-SA.

Lecture 18. Laws Of Large Numbers

1. Useful Inequations

Markov Inequality

Xが非負なrandom variableなら
P(Xa)E[X]/a

proof.

I{Xa}X/a
が必ず成立する.両辺のexpectationを考えれば直ちに成立.

Chevbyshev Inequality

P(|XE[X]|ϵ)var[X]/ϵ2

proof.

Markov inequalityで,X=|XE[X]|, a=ϵ2とすれば直ちに成立.

2. The Weak Law of Large Numbers

expectationは無限回の試行の結果の平均と考えることが出来る. “有限回の試行の結果の平均(sample mean)はexpectationに近づく”ということの定式化がlaw of large numbers (大数の法則)である.
大数の弱法則と大数の強法則があり,後者は前者を導く.大数の強法則を僅かに弱くして証明し,弱法則をも導く.まずalmost sure convergenceの証明に使う補題を示す.

Proposition 19-1

{Xn}をrandom variableの列とする.独立性は仮定しない.
(i) E[|Xn|s]<,s>0Xna.s.0
(ii) ϵ>0,P(|Xn|>ϵ)<Xna.s.0

proof.

(i)
n=1E[|Xn|s]=E[n=1|Xn|s<がmonotone conergence theoremから成立し,ゆえにn=1|Xn|sというrandom variableは確率1で有限. したがって|Xn|sa.s.0であり,Xna.s.0.
(ii)
任意のkNを取ってϵ=1/kとする. Borel-Cantelli lemmaからP({|Xn|>1/k i.o.})=0すなわち{|Xn|>1/k}というeventは確率1で有限回のみ起こる. したがってP(lim supXn>1/k)=0が任意のkに成立する.{lim sup|Xn|>1/k}は単調でP({lim supXn>0})=0に収束する.よってXna.s.0

Theorem 18-1 The Weak Law of Large Numbers (証明略)

{Xn}がi.i.d.でE[|X1|]<ならば,Sn=ni=1Xiとすると
Snni.p.E[X1]

Theorem 19-1 The Strong Law of Large Numbers

Theorem 18-1の仮定のもとで
Snna.s.E[X1]

proof.

E[X4]<を前提に加える. このときE[|X|]<. |X|1+x4から
E[|X|]1+E[X4]<
E[X]=0を仮定し,E[(X1+Xn)4/n4]<を示す.
まず
E[(X1++Xn)4n4]=1n4ni1=1ni2=1ni3=1ni4=1E[Xi1Xi2Xi3Xi4]
であって,i.i.d.だから,random variableたちの少なくとも1つが他のすべてのrandom variableと異なるときE[Xi1Xi2Xi3Xi4]=0. したがって,上の式で0出ない項はE[X4i]あるいはE[X2iX2j] (ij)という形をしている. E[X4i]となるin通りで,E[X2iX2j] (ij)となるi,jの組み合わせは3n(n1)通りある.以上から
E[(X1++Xn)4n4]=nE[X41]+3n(n1)E[X21X22]n4
が成立する.xy(x2+y2)/2x=X21,y=X22を代入してX21X22X41+X42,expectationをとってE[X42]=E[X41]を考えればE[X21X22]E[X41]が成立する.ゆえに
E[(X1++Xn)4n4]3n2E[X41]n4=3E[X41]n2
したがって
E[n=1(X1++Xn)4n4]3E[X41]n=11n2<
ゆえに(X1++Xn)4/n4は確率1で0に収束し,(X1++Xn)/nもそうである.これがStrong law of large numbersの主張するところだった.
E[Xi]0である場合,(X1++XnnE[X1])/n0にa.s.収束することは(X1++Xn)/nE[X1]にa.s.収束することだから,成立.

E[X4]<の仮定を外した場合の証明は省略する.

18-3 The Central Limit Theorem (中心極限定理)

Theorem 18-2 Central Limit Theorem, CLT

X1,...がi.i.d.で,そのexpectationとvarianceをそれぞれμ<,σ2<とする.Sn=X1++Xnとすると,
Snnμσn
N(0,1)にdistribution convergenceする.

proof.

簡単のためμ=0,σ2=1とする. 1,2次のmomentが有限であることから,ϕX1(t)0において2回微分可能である.
ϕX(t)=1t2/2+o(t2)
と書ける.Sn/nのcharacteristic functionは
(ϕX(t/n))n=(1t2/2n+o(t2/n))n
という形をしていて,tを固定してnの極限はet2/2である.これはN(0,1)のcharacteristic functionϕZに等しい.ϕSn/n(t)ϕZ(t)tから,たしかにdistribution convergenceが言えた.

CLTはSn/のPDFはCDFについて何も言っていないが,以下の2つの命題が成り立つ.
(a)

|ϕX1(t)|rdt<が成立するrがあるとき,Snnrで連続で
(Snμn)/(σn)のPDFfnN(0,1)のPDFに一様収束(各点収束)する.すなわち
limnsupz|fn(z)12πez2/2|=0
である.

(b)

a,hを定数,kを整数として,Xia+hkという値を取り,E[X]=0,var[X]=1とする. z=(na+kh)/nという形のzに,
limnhP(Sn=z)=12πez2/2
である.

19-2. The Chernoff Bound

X,X1,...はi.i.d.で,Sn=X1+Xnとする.E[X]=0とする. (weak) law of large numbers から, P(Snna)0が任意のa>0で成立.この収束を上下から押さえる関数を与えたい.

19-2.1 Upper Bound

M(s)=E[esX]として,M(s)<s[0,c],c>0で成り立つとする.
MSn(s)=E[es(X1++Xn)]=(M(s))n. 任意のs>0にMarkov inequalityを使って,
P(Snna)=P(esSnensa)ensaE[esSn]=ensa(M(s))n
(c<sでは右辺がになってしまうが不等号自体は成立する)
P(Sna)nとともに指数的に減少することがわかったが,sを操作してより狭い境界を与える.

Theorem 19-2 (Chernooff Upper Bound) (証明略)

あるs>0,a>0E[esX]<ならば,
P(Snna)exp[nsups0(salogM(s))_ϕ(a)]

s=0ではsalogM(s)=0log1=0
また
dds(salogM(s))|s=0=a1M(s)ddsM(s)|s=0=a1E[X]=a>0
salogM(s)s=00をとり,微分係数は正だから,十分小さいs>で正の値を取る. ϕ(a)>0であって,a>0を固定するとP(Snna)nによって指数的に減少する.

Example

XN(0,1)について,M(s)=es2/2. したがってsalogM(s)=sas2/2 これの最小値はϕ(a)=a2/2.これは
P(Xa)ea2/2
を与える.

19-2.2 Lower Bound

Assumption 19-1.

(i) s M(s)=E[sX]<
(ii) random variable Xはcontinuous で, PDFはfX
(iii) Xは有限の上限,下限を持たない.すなわち0<FX(x)<1,xR

Theorem 19-3 (Chernoff Lower Bound)

Assumption 1のもとで,任意のa>0
limn1nlogP(Snna)=ϕ(a)

0 件のコメント:

コメントを投稿