2017年6月29日木曜日

Basic Analysis (Jiri Lebl) 31日目

CC BY-NC-SA 3.0

8.3 The derivative

この節で,UURnで,開集合とする.

8.3.1 The derivative

f:RRにおいて,
limh0f(x+h)f(x)h


が存在するとき,それをfxにおける微分係数というのだった.微分係数aが存在すると仮定すると,
lim|f(x+h)f(x)ha|=lim|f(x+h)f(x)ah||h|=0

が成立する.aL(R1,R1)であることに着目すると,axの近くでfを近似する線形作用素と言える.この考えを多次元の場合に拡張する.

Definition 8.3.1

f:URmとする.
fxUdifferentiable(微分可能)
AL(Rn,Rm) s.t. limh0,hRn||f(x+h)f(x)Ah||||h||=0


Df(x):=Aとか,f(x)=Aと書き,Afxにおけるderivativeという(訳語は色々あるが,微分係数か,単に微分と呼ぶことにする).fxUで微分可能なとき,単にfUで微分可能であるという.

ffとする操作を微分するという.Aが存在するならそれは一意(Prop 8.3.2)だから,
f:UL(Rn,Rm)は関数と考えることができて,fの導関数と呼ぶ.

Proposition 8.3.2.

f:URmについて,xUで,A,Bがともにfxにおける微分係数なら,A=Bである.
proof.

||(AB)h||||h||=||f(x+h)f(x)Ah(f(x+h)f(x)Bh)||h||||f(x+h)f(x)Ah||||h||+||f(x+h)f(x)Bh||||h||0


ここで,y=h/||h||とすると||y||=1であり,,最左辺は,||(AB)y||と書ける.
(AB)の作用素ノルムが0だから,AB=0,したがってA=B.

Proposition 8.3.5.

f:URmpUで微分可能なら,fpで連続である.
proof.

Theorem 8.3.6 (Chain rule)

VRm, open. f:URm,g:VRmであって,
fpで,gf(p)で微分可能で,それぞれの微分係数をA,Bとするとき,
fgpで微分可能で,その微分係数はBAである.
proof. 略

8.3.2 Partial derivatives

Definition 8.3.7

f:URについて,
fxj(x):=limh0f(x1,...,xj1,xj+h,xj+1,...,xn)f(x)h=limh0f(x+hej)f(x)h


が存在するとき,fxj(x)fxにおけるxjに対するpartial derivative(偏微分係数)という.
f:URmであるとき,fkxにおけるxjに対する微分係数をfkxjと書く.

Proposition 8.3.8

f:URmpUで微分可能であるとき,
f(p)L(Rn,Rm)であるが,これをRn,Rmの標準基底を使って表現するとき,
f(p)=[f1x](p)f1x2(p)f1xn(p)f2x1(p)fmx1(p)fmx2(p)fmxn(p)]


と書ける. これは
f(p)ej=mk=1fkxj(p)ek

ということでもある.
v=nj=1cjej=(c1,c2,...,cn)であるとき,
f(p)v=nj=1mk=1cjfkxj(p)ek=mk=1(nj=1cjfkxj(p))ek

である.
proof.

jを固定する.
f(p+hej)f(p)hf(p)ej=||f(p+hej)f(p)f(p)hej||||hej||


h0において,微分可能性より右辺は0に近づく.よって
limh0f(p+hej)f(p)h=f(p)ej

が成立する.f=(f1,...,fm)と書くとすると,
fkxj(p)=limfk(p+hej)fk(p)h

が存在して,f(p)ejに等しい.

一方で,それぞれの偏微分係数が存在しても,fが微分可能であるとは限らない.

8.3.3 Gradient and directional derivatives

f:URが微分可能とする.fgradient(勾配)を
f(x):=nj=1fxj(x)ej=[fx1(x),...,fxn]T


と定める.はナブラと読む.
f(x)v=f(x)vが成立する.(行列×ベクトルとベクトル×ベクトル)
γ:(a,b)Rnが微分可能でγ((a,b))Uであるとき,このような関数とその像をcurve(曲線)という.γ=(γ1,...,γn)とすると,
g(t):=f(γ(t))が定義できて,gは微分可能である.
g(t)=nj=1fxjdγjdt=fγ

が成立する.

xUにある点が速度tでベクトルu方向に移動しているとき,f(u)の変化率を考える.
γ(t)=x+tuとすると,これはその点の軌跡を表す曲線であって,γ(0)=xである.
γ(t)=uであって,そのchain ruleから
ddt|t=0[f(x+tu)]=(f)(x)u=limhf(x+hu)f(x)h


が成立する.最左辺をDuf(x)と書くことにする.
(f)(x)0とすると,Cauchy-Schwartzの不等式から
|Duf(x)|(f)(x)

統合はu(f)(x)の定数倍である時成立し,
u=(f)(x)(f)(x)

である.このように,gradientはある関数が最も早く増大するような方向を向いている

8.3.4 The Jacobian

Definition 8.3.9

f:URnが微分可能であるとする.このとき,fJacobian(ヤコビアン)を,
Jf(x):=det(f(x))


と定める.Jaobianは
(f1,...,fn)(x1,...,xn)

と書かれることがある.行列式が幾何学的に面積や体積を表すのと同様に,Jacobianは写像がRnの元をRnに写すとき,もとの元に比べて像はどれほど引き伸ばされたり,押しつぶされているかの指標になる.

0 件のコメント:

コメントを投稿