David Gamarnik, and John Tsitsiklis. 6.436J Fundamentals of Probability. Fall 2008. Massachusetts Institute of Technology: MIT OpenCourseWare, https://ocw.mit.edu. License: Creative Commons BY-NC-SA.
Lecture 10. Derived Distributions
random variable XとPDF fXが与えられ,measurable gがあるとき,Y=g(X)のdistribution(CDF, PDF or PMF)を知りたいことがよく有る.Xがdiscreteならば
pY(y)=∑{x|g(x)=y}pX(x)
でよいが、continuousな場合はより複雑になる.
1. Functions of a Single Random Variable
Calculation of the PDF of a Function Y=g(X) of a Continuous Random Variable X
(a) FY(y)=P(g(X)≤y)=∫{x|g(x)≤y}fX(x)dx
(b) fY(y)=dFYdy(y)
Example
Y=g(X)=X2とする.Xがcontinuousであって,fXをPDFとする.このとき
FY(y)=P(Y≤y)=P(X2≤y)=P(−√y≤X≤√y)=FX(√y)−FX(−√y)
よって
fY(y)=dFYdy(y)=12√y(fX(√y)+fX(−√y))
Example
Xは非負でY=exp(X2)とする.
FY(y)={0 (y<1)P(eX2≤y) (y≥1)
ここでP(eX2≤y)=P(X2≤logy)=P(X≤√logy)
よってfY(y)=fX(√logy)/(2y√logy)
1.1 The Case of Monotonic Functions
A⊂g(Ω)でg:R→Rが狭義単調増加かつ微分可能なとき,B={g(x)|x∈A}とする.g|Aは可逆でg−1|Aがある.y∈Bに,chain ruleによって
fY(y)=ddyP(g(X)≤y)=ddyP(X≤g−1|A(y))=ddyFX(g−1|A(y))=fX(g−1|A(y))dg−1|A(y)dy
dg−1|Ady(y)=1g′(g−1(y))
を代入して
fY(y)=fX(g−1(y))1g′(g−1|A(y))
gが狭義単調現象の場合にもほとんど同様に
fY(y)=fX(g−1(y))−1g′(g−1|A(y))
が成立して,
fY(y)=fX(g−1(y))1|g′(g−1(y))|
である.
fY(y)|dy|=fX(x)|dx|
で,y=g(x),dy=|g′(x)|⋅|dx|から
fY(y)|g′(x)|=fX(x)
と考えれば良い.
1.2 Linear Functions
g(x)=ax+bつまりY=aX+bとなる場合を考える.a≠0とする.このとき
g′(x)=a,g−1(y)=(y−b)/aであって,
fY(y)=1|a|fX((y−b)/a)
である.
Example (A linear function of a normal random variable is normal)
X=dN(0,1),Y=aX+bとする.
fY(y)=1√2π|a|exp(−(y−b)22a2)
すなわちY∼N(b,a2)である.
2. Multivariate Transformations
X=(X1,...,Xn)というjointly continousなrandom variableのベクトルを考えて,joint PDFはfX(x)=fX(x1,...,xn)とする.g:Rn→Rnがあって,Y=(y1,...,yn)=g(X)とする.g=(g1,...,gn)とするとYi=gi(X)である.
g が openなA⊂Rnで連続微分可能であるとき,B=g(A)でgが可逆とする.
このtきg−1|Bが存在する.
1次元の場合とほとんど同様の議論で多次元版に拡張できる.
2.1 Linear Functions
gは線形で,g=Mxとする.Mはn×n行列である.x∈Aを固定してδ>0とする.
x∈Aとδ>0を固定する.C=[x,x+δ]n⊂Aという超立方体を考えてD=MC=g(C)とする.Dの体積は|detM|⋅δnである.
y=Mxとして,fX(x)がxで連続なら
P(X∈C)=∫CfX(t)dt=fX(x)δn+o(δn)∼fX(x)δn
が成立する.したがって
fX(x)δn∼P(X∈C)=P(Y∈D)∼fY(y)⋅vol(D)=fY(y)|detM|δn
である.両辺をδnで割って,fX(x)=fY(y)⋅|detM|が言える.
Mが可逆であればM−1があって,さらにdet(M−1)=1/(detM)に注意すれば,
fY(y)=fX(M−1y)⋅1|detM|
が成立する.Mが非可逆ならYはS⊂Rでのみ値をとり,jointly continuousでない.SはあるRm,m<nに同型なので,YをRmのjoint PDFとして書ける.
2.2 The General Case
gがxrで連続微分可能な場合,M(x)をgのxにおけるJacobi行列とする.D=g(C)は直線で囲まれた図形ではないが,1つぎのTaylor展開によってgはxの周りで線形近似できる.Dが体積|detM(x)|⋅δn+o(δn)を持つから,線形の場合と同様に
fY(y)=fX(g−1(y))|M(g−1(y))=fX(g−1(y))⋅|M−1(g−1(y))|
である.ここでJ(y)をg−1(y)のJacobi行列とすれば,y=g(x)でJ(y)=M−1(x)であって,
fY(y)=fX(g−1(y))⋅|J(y)|
である.
3. A Single Function of Multiple Random Variables
X=(X1,...,Xn),g1:Rn→Rがあって,random variableY=g1(X)とする.
FY(y)=P(g(X)≤y)=∫{x|g(x)≤y}fX(x)dx
を微分すればPDFを得られる.
もう一つの方法に,g2,...,gn:Rn→R,Yi=gi(X)を,g=(g1,...,gn)が可逆であるように定義して2.2で述べた公式を用いてY=(Y1,...,Yn)のjoint PDFを求め,Y1のPDFを積分によって求めるというのが有る.
最も単純なYi,i≥2の定め方はYi=Xiであって,g(x)=(g1(x),x2,...,xn)として,h:Rn→Rをg−1の第一次元とする(y=g(x),x1=h(y)).
このときg−1(y)=(h(y),y2,..,yn),Jacobi 行列は
J(y)=(∂∂y1h(y)∂∂y2h(y)⋯∂∂ynh(y)01⋯0⋮00⋯1)
よって|detJ(y)|=|∂h∂y1(y)|
fY(y)=∫fX(h(y),y2,..,yn)|∂h∂y1(y)|dy2⋯dyn
Example
X1,X2は正でjointly continousで,Y1=g(X1,X2)=X1X2のPDFを求める.
x1=y1/x2からh(y1,y2)=y1/y2であって,hy1=1/y2
fY1(y1)=∫fX(y1/y2,y2)1y2dy2=∫fX(y1/y2,x2)1x2dx2
X1,X2=dU(0,1)とすると
fX(y1/x2,x2)=fX1(y1/x2)fX2(x2)=1 (x2≥y1)
から
fY1(y1)=∫1y11x2dx2=−logy
1−FY1(y1)=P(X1X2≥y1)=∫1y1∫1y1/x1dx2dx1=∫y1(1−y1/x1)dx1=(1−y1)+y1logy1
したがってfY1(y1)=−logy1
4. Maximum And Minimum of Random Variables
X1,...,Xnは独立とする.またX(1)≤X(2)≤⋯≤X(n)は{Xi}のorder statisticsとする.すなわちX(1)は{Xi}の最少, X(2)は{Xi}の二番目に小さい要素,… である.
このoder statistics のjoint distributionとminXj,maxXjのdistributionを求める.
P(maxXj≤x)=P(X1,...,Xn≤x)=P(X1≤x)⋯P(Xn≤x)=FX1(x)⋯FXn(x)
が成立し,また
P(minXj≤x)=1−P(minXj>x)=1−P(X1,...,Xn)>x)=1−(1−FX1(x))⋯(1−FXn(x))
である.
特に{Xj}がi.i.d.(独立だが同じdistribution)でそのCDFがF, PDFがfとするとき,
P(maxXj≤x)=Fn(x), P(minXj≤x)=1−(1−F(x))n
であって,
fmaxXj(x)=nFn−1(x)f(x), fminXj(x)=n(1−F(x))n−1f(x)
5. Sum of Independent Random Variables - Convolution
X,Yは独立なdiscrete random variableとする.X+YのPMFは
pX+Y(z)=P(X+Y=z)=∑{(z,y)|x+y=z}P(X=x,Y=y)=∑xpX(x)pY(z−x)
である.continuousでも,jointly continousなら
P(X+Y≤z)=∫{x,y|x+y≤z}fX,Y(x,y)dxdy=∫∞−∞∫z−x−∞fX,Y(x,y)dydx
ここでt=x+yとすると
P(X+Y≤z)=∫∫zfX,Y(x,t−x)dtdx
tで微分して
fX+Y(z)=∫fX,Y(z−x)dx
特にX,Yが独立なら
fX+Y(z)=∫∞−∞fX(x)fY(z−x)dx
である.