CC BY-NC-SA 3.0
8.3 The derivative
この節で,UはU⊂Rnで,開集合とする.
8.3.1 The derivative
f:R→Rにおいて,
limh→0f(x+h)−f(x)h
が存在するとき,それをfのxにおける微分係数というのだった.微分係数aが存在すると仮定すると,
lim|f(x+h)−f(x)h−a|=lim|f(x+h)−f(x)−ah||h|=0
が成立する.a∈L(R1,R1)であることに着目すると,aはxの近くでfを近似する線形作用素と言える.この考えを多次元の場合に拡張する.
Definition 8.3.1
f:U→Rmとする.
fがx∈Uでdifferentiable(微分可能)
⇔∃A∈L(Rn,Rm) s.t. limh→0,h∈Rn||f(x+h)−f(x)−Ah||||h||=0
Df(x):=Aとか,f′(x)=Aと書き,Aをfのxにおけるderivativeという(訳語は色々あるが,微分係数か,単に微分と呼ぶことにする).fが∀x∈Uで微分可能なとき,単にfはUで微分可能であるという.
f↦f′とする操作を微分するという.Aが存在するならそれは一意(Prop 8.3.2)だから,
f′:U→L(Rn,Rm)は関数と考えることができて,fの導関数と呼ぶ.
Proposition 8.3.2.
f:U→Rmについて,x∈Uで,A,Bがともにfのxにおける微分係数なら,A=Bである.
proof.
||(A−B)h||||h||=||f(x+h)−f(x)−Ah−(f(x+h)−f(x)−Bh)||h||≤||f(x+h)−f(x)−Ah||||h||+||f(x+h)−f(x)−Bh||||h||→0
ここで,y=h/||h||とすると||y||=1であり,,最左辺は,||(A−B)y||と書ける.
(A−B)の作用素ノルムが0だから,A−B=0,したがってA=B.
Proposition 8.3.5.
f:U→Rmがp∈Uで微分可能なら,fはpで連続である.
proof.
略
Theorem 8.3.6 (Chain rule)
V⊂Rm, open. f:U→Rm,g:V→Rmであって,
fはpで,gはf(p)で微分可能で,それぞれの微分係数をA,Bとするとき,
f∘gはpで微分可能で,その微分係数はB∘Aである.
proof. 略
8.3.2 Partial derivatives
Definition 8.3.7
f:U→Rについて,
∂f∂xj(x):=limh→0f(x1,...,xj−1,xj+h,xj+1,...,xn)−f(x)h=limh→0f(x+hej)−f(x)h
が存在するとき,∂f∂xj(x)をfのxにおけるxjに対するpartial derivative(偏微分係数)という.
f:U→Rmであるとき,fkのxにおけるxjに対する微分係数を∂fk∂xjと書く.
Proposition 8.3.8
f:U→Rmがp∈Uで微分可能であるとき,
f′(p)∈L(Rn,Rm)であるが,これをRn,Rmの標準基底を使って表現するとき,
f′(p)=[∂f1∂x](p)∂f1∂x2(p)⋯∂f1∂xn(p)∂f2x1(p)⋯⋮∂fm∂x1(p)∂fm∂x2(p)⋯∂fm∂xn(p)]
と書ける. これは
f′(p)ej=m∑k=1∂fk∂xj(p)ek
ということでもある.
v=∑nj=1cjej=(c1,c2,...,cn)であるとき,
f′(p)v=n∑j=1m∑k=1cj∂fk∂xj(p)ek=m∑k=1(n∑j=1cj∂fk∂xj(p))ek
である.
proof.
jを固定する.
‖f(p+hej)−f(p)h−f′(p)ej‖=||f(p+hej)−f(p)−f′(p)hej||||hej||
h→0において,微分可能性より右辺は0に近づく.よって
limh→0f(p+hej)−f(p)h=f′(p)ej
が成立する.f=(f1,...,fm)と書くとすると,
∂fk∂xj(p)=limfk(p+hej)−fk(p)h
が存在して,f′(p)ejに等しい.
一方で,それぞれの偏微分係数が存在しても,fが微分可能であるとは限らない.
8.3.3 Gradient and directional derivatives
f:U→Rが微分可能とする.fのgradient(勾配)を
∇f(x):=n∑j=1∂f∂xj(x)ej=[∂f∂x1(x),...,∂f∂xn]T
と定める.∇はナブラと読む.
f′(x)v=∇f(x)⋅vが成立する.(行列×ベクトルとベクトル×ベクトル)
γ:(a,b)→Rnが微分可能でγ((a,b))⊂Uであるとき,このような関数とその像をcurve(曲線)という.γ=(γ1,...,γn)とすると,
g(t):=f(γ(t))が定義できて,gは微分可能である.
g′(t)=n∑j=1∂f∂xjdγjdt=∇f⋅γ′
が成立する.
x∈Uにある点が速度tでベクトルu方向に移動しているとき,f(u)の変化率を考える.
γ(t)=x+tuとすると,これはその点の軌跡を表す曲線であって,γ(0)=xである.
γ′(t)=uであって,そのchain ruleから
ddt|t=0[f(x+tu)]=(∇f)(x)⋅u=limhf(x+hu)−f(x)h
が成立する.最左辺をDuf(x)と書くことにする.
(∇f)(x)≠0とすると,Cauchy-Schwartzの不等式から
|Duf(x)|≤‖(∇f)(x)‖
統合はuが(∇f)(x)の定数倍である時成立し,
u=(∇f)(x)‖(∇f)(x)‖
である.このように,gradientはある関数が最も早く増大するような方向を向いている.
8.3.4 The Jacobian
Definition 8.3.9
f:U→Rnが微分可能であるとする.このとき,fのJacobian(ヤコビアン)を,
Jf(x):=det(f′(x))
と定める.Jaobianは
∂(f1,...,fn)∂(x1,...,xn)
と書かれることがある.行列式が幾何学的に面積や体積を表すのと同様に,Jacobianは写像がRnの元をRnに写すとき,もとの元に比べて像はどれほど引き伸ばされたり,押しつぶされているかの指標になる.
0 件のコメント:
コメントを投稿