David Gamarnik, and John Tsitsiklis. 6.436J Fundamentals of Probability. Fall 2008. Massachusetts Institute of Technology: MIT OpenCourseWare, https://ocw.mit.edu. License: Creative Commons BY-NC-SA.
Lecture 18. Laws Of Large Numbers
1. Useful Inequations
Markov Inequality
Xが非負なrandom variableなら
P(X≥a)≤E[X]/a
proof.
I{X≥a}≤X/a
が必ず成立する.両辺のexpectationを考えれば直ちに成立.
Chevbyshev Inequality
P(|X−E[X]|≥ϵ)≤var[X]/ϵ2
proof.
Markov inequalityで,X=|X−E[X]|, a=ϵ2とすれば直ちに成立.
2. The Weak Law of Large Numbers
expectationは無限回の試行の結果の平均と考えることが出来る. “有限回の試行の結果の平均(sample mean)はexpectationに近づく”ということの定式化がlaw of large numbers (大数の法則)である.
大数の弱法則と大数の強法則があり,後者は前者を導く.大数の強法則を僅かに弱くして証明し,弱法則をも導く.まずalmost sure convergenceの証明に使う補題を示す.
Proposition 19-1
{Xn}をrandom variableの列とする.独立性は仮定しない.
(i) ∑E[|Xn|s]<∞,s>0⇒Xn→a.s.0
(ii) ∀ϵ>0,∑P(|Xn|>ϵ)<∞⇒Xn→a.s.0
proof.
(i)
∑∞n=1E[|Xn|s]=E[∑∞n=1|Xn|s<∞がmonotone conergence theoremから成立し,ゆえに∑∞n=1|Xn|sというrandom variableは確率1で有限. したがって|Xn|s→a.s.0であり,Xn→a.s.0.
(ii)
任意のk∈Nを取ってϵ=1/kとする. Borel-Cantelli lemmaからP({|Xn|>1/k i.o.})=0すなわち{|Xn|>1/k}というeventは確率1で有限回のみ起こる. したがってP(lim supXn>1/k)=0が任意のkに成立する.{lim sup|Xn|>1/k}は単調でP({lim supXn>0})=0に収束する.よってXn→a.s.0
Theorem 18-1 The Weak Law of Large Numbers (証明略)
{Xn}がi.i.d.でE[|X1|]<∞ならば,Sn=∑ni=1Xiとすると
Snn→i.p.E[X1]
Theorem 19-1 The Strong Law of Large Numbers
Theorem 18-1の仮定のもとで
Snn→a.s.E[X1]
proof.
E[X4]<∞を前提に加える. このときE[|X|]<∞. |X|≤1+x4から
E[|X|]≤1+E[X4]<∞
E[X]=0を仮定し,E[∑(X1+⋯Xn)4/n4]<∞を示す.
まず
E[(X1+⋯+Xn)4n4]=1n4n∑i1=1n∑i2=1n∑i3=1n∑i4=1E[Xi1Xi2Xi3Xi4]
であって,i.i.d.だから,random variableたちの少なくとも1つが他のすべてのrandom variableと異なるときE[Xi1Xi2Xi3Xi4]=0. したがって,上の式で0出ない項はE[X4i]あるいはE[X2iX2j] (i≠j)という形をしている. E[X4i]となるiはn通りで,E[X2iX2j] (i≠j)となるi,jの組み合わせは3n(n−1)通りある.以上から
E[(X1+⋯+Xn)4n4]=nE[X41]+3n(n−1)E[X21X22]n4
が成立する.xy≤(x2+y2)/2にx=X21,y=X22を代入してX21X22≤X41+X42,expectationをとってE[X42]=E[X41]を考えればE[X21X22]≤E[X41]が成立する.ゆえに
E[(X1+⋯+Xn)4n4]≤3n2E[X41]n4=3E[X41]n2
したがって
E[∞∑n=1(X1+⋯+Xn)4n4]≤3E[X41]∞∑n=11n2<∞
ゆえに(X1+⋯+Xn)4/n4は確率1で0に収束し,(X1+⋯+Xn)/nもそうである.これがStrong law of large numbersの主張するところだった.
E[Xi]≠0である場合,(X1+⋯+Xn−nE[X1])/nが0にa.s.収束することは(X1+⋯+Xn)/nがE[X1]にa.s.収束することだから,成立.
E[X4]<∞の仮定を外した場合の証明は省略する.
18-3 The Central Limit Theorem (中心極限定理)
Theorem 18-2 Central Limit Theorem, CLT
X1,...がi.i.d.で,そのexpectationとvarianceをそれぞれμ<∞,σ2<∞とする.Sn=X1+⋯+Xnとすると,
Sn−nμσ√n
がN(0,1)にdistribution convergenceする.
proof.
簡単のためμ=0,σ2=1とする. 1,2次のmomentが有限であることから,ϕX1(t)は0において2回微分可能である.
ϕX(t)=1−t2/2+o(t2)
と書ける.Sn/√nのcharacteristic functionは
(ϕX(t/√n))n=(1−t2/2n+o(t2/n))n
という形をしていて,tを固定してn→∞の極限はe−t2/2である.これはN(0,1)のcharacteristic functionϕZに等しい.ϕSn/√n(t)→ϕZ(t)∀tから,たしかにdistribution convergenceが言えた.
CLTはSn/のPDFはCDFについて何も言っていないが,以下の2つの命題が成り立つ.
(a)
∫|ϕX1(t)|rdt<∞が成立するrがあるとき,Snはn≥rで連続で
(Sn−μn)/(σ√n)のPDFfnはN(0,1)のPDFに一様収束(⇒各点収束)する.すなわち
limnsupz|fn(z)−1√2πe−z2/2|=0
である.
(b)
a,hを定数,kを整数として,Xiがa+hkという値を取り,E[X]=0,var[X]=1とする. z=(na+kh)/√nという形のzに,
lim√nhP(Sn=z)=12πe−z2/2
である.
19-2. The Chernoff Bound
X,X1,...はi.i.d.で,Sn=X1+⋯Xnとする.E[X]=0とする. (weak) law of large numbers から, P(Sn≥na)→0が任意のa>0で成立.この収束を上下から押さえる関数を与えたい.
19-2.1 Upper Bound
M(s)=E[esX]として,M(s)<∞がs∈[0,c],c>0で成り立つとする.
MSn(s)=E[es(X1+⋯+Xn)]=(M(s))n. 任意のs>0にMarkov inequalityを使って,
P(Sn≥na)=P(esSn≥ensa)≤ensaE[esSn]=e−nsa(M(s))n
(c<sでは右辺が∞になってしまうが不等号自体は成立する)
P(Sn≥a)がnとともに指数的に減少することがわかったが,sを操作してより狭い境界を与える.
Theorem 19-2 (Chernooff Upper Bound) (証明略)
あるs>0,a>0でE[esX]<∞ならば,
P(Sn≥na)≤exp[nsups≥0(sa−logM(s))_ϕ(a)]
s=0ではsa−logM(s)=0−log1=0
また
dds(sa−logM(s))|s=0=a−1M(s)ddsM(s)|s=0=a−1E[X]=a>0
sa−logM(s)はs=0で0をとり,微分係数は正だから,十分小さいs>で正の値を取る. ϕ(a)>0であって,a>0を固定するとP(Sn≥na)はnによって指数的に減少する.
Example
X∼N(0,1)について,M(s)=es2/2. したがってsa−logM(s)=sa−s2/2 これの最小値はϕ(a)=a2/2.これは
P(X≥a)≤e−a2/2
を与える.
19-2.2 Lower Bound
Assumption 19-1.
(i) ∀s M(s)=E[sX]<∞
(ii) random variable Xはcontinuous で, PDFはfX
(iii) Xは有限の上限,下限を持たない.すなわち0<FX(x)<1,∀x∈R
Theorem 19-3 (Chernoff Lower Bound)
Assumption 1のもとで,任意のa>0に
limn→∞1nlogP(Sn≥na)=−ϕ(a)
0 件のコメント:
コメントを投稿