Robert Gallager. 6.262 Discrete Stochastic Processes. Spring 2011. Massachusetts Institute of Technology: MIT OpenCourseWare, https://ocw.mit.edu. License: Creative Commons BY-NC-SA.
Lecture videoを要約していく.
Lecture 1
well-posed problemを解くのは簡単だが,現実にある現象をモデル化してwell-posed problemに落とし込むのは難しい. このコースでは現実世界での確率と確率の理論を学んだ後discrete processがなんであるかを学び,数あるdiscrete processの内いくつかを学ぶ.
確率論がどこで役に立つか–どこでも役に立つのだが,いくつか例を挙げる
Kormogrovの確率の公理がどのように役に立っているか
確率論の復習
モデルを作るときに現れる重要な問題
1. – 完全なモデルは存在しない
完璧なモデルというのは存在しないが,現実の問題をより詳細に記述するモデル–より複雑なモデルを構築することは出来る. 一方モデルが複雑になるほど理解しづらくなってしまうので,モデルの複雑さと理解のしやすさの間でバランスを取ることが重要になってくる. Whiteheadの警句 “Seek simplicity and distrust it.” は,我々は単純なモデルを正しいと思い込みがちなので,単純なモデルがうまく言っているように見えても,よく検証しなければならないと主張する.
2. – その数学的モデルの解が現実で意味を持つか
確率のモデルの正当性はKormogorvの確率の公理に従っているかで決まる.
Stochastic Processとは?
確率モデルの一種で,sample pointが時間を変数とする関数であるものをstochastic process(確率過程)という. このときあるsample pointは時刻を添字とする確率変数の列の,その時刻における1点の現れと考えることが出来る. この確率変数列の全ての元が離散確率変数であるとき特にdiscrete stochastic processという.
このコースで学ぶprocessたち
- counting process
- Poisson process
- renewal process
- Markov process
- random walkとmartingale
以下はほとんどFundamentals of probabilityでやったが,念の為復習
Kormogorovの公理
はある集合で,がeventの集合
(1)
(2)
(3)
つまりがの-algebraであるということ.
がに確率を割り当てる(のprobability measureである)
(1)
(2)
(3) が互いに素なら
Eventの独立性
がindependent
仮にが赤いサイコロをふって出る目が1であるというeventで,が白いサイコロをふって出る目が1であるというeventとすると,というのはという新しいprobability spaceがあらわれて,例えばは単にといデカルト積(とりあえずサイコロの場合はそう).
一方ふるサイコロが両方とも白いとき(区別できないとき)には話は複雑になる.となって,これはサイコロが区別できるときとは異なる集合である. これは2つのeventを,区別できない状況で組み合わせるときに,組み合わせたeventの確率をどう評価するかという重要な問題の最も簡単な例と言える. この話題はまたあとで扱う.
Random Variable
がのrandom variable(r.v., 確率変数)
は-可測
また,をのdistributinoという.
Lecture 2. 確率論の復習
Expectations
のexpectation(期待値) を
と定める(上の二つが定義,下の二つが定義から導かれる公式).
4番目の式の片方の項が,もう一方がの場合を考えれば,expectationが定義できないrandom variableが存在することがわかる. 普通のときのみ,が存在するという.
また,のstandard deviation(標準偏差) をと定める.
上から3番目の式を,discreteの場合に直感的に正当化する.
figure 1.
fig.1のそれぞれの四角形の面積がの各項を表している.として,の軸に垂直な直線と,四角形の重複する部分の長さはだから,四角形の面積の和はと一致する.
example: indicator random variable
のindicator random variable
についてだから,
multiple random variables
random variables についてjoint distribution function
が定義できる.これはrandom variableの集合でも動揺に定義できて,がindependentなら
である.
discrete rv’s について
をconditional probabilityという. がindependentなら
IID random variables
がindependent and identically distributed(IID)
かつ
で,その上のr.v. があるとき,i.i.d.として並べて上のr.v. を考えることが出来る(extended modelという).
(がなんであってもを考えればいいような気がするが・・・・)
Sample Average
はある実数に収束して,その極限が,extended modelが現実世界における試行の繰り返しであるとするなら,その結果の平均であるというのが,大数の法則の主張である.
しかし,いかに述べる問題から,正しいモデルが作れないこともある.
1. 現実での試行の列というのは,それぞれが十分似ていなかったり,独立でなかったりして,i.i.d.でモデル化できないかもしれない.
2. もとのモデルが間違っているかもしれない.例えばコイントスが表が出る確率0.5としたが,実際には0.45かもしれない
実験によって得られる結果というのはsample pointであって,確率ではない. extended modelが現実と合致しているときにのみ大数の法則やその関連を使って分布を考えることが出来る.
また,は平均,分散のr.v.で,は平均0, 分散1. これがでに分布収束するというのがcentral limit theorem(CLT, 中心極限定理)の主張である.(characteristic functionの各点収束を示して証明した)
The Bernoulli Process
がi.i.d.に並んだがあるとき,
の分布を調べる.この節ではと約束する.
となる確率は.で最大となり,の増加とともに減少する.
また,のうちちょうど個が,ほかがである場合の数は個で,それぞれの確率はだから,確率の和は.よって
による増減は,
だから,の増加とともに狭義単調減少する.
さらに,
(以下CLTの成立の証明が続く)
Assignment 1. Problem set 1.
Exercise 1.3
はdisjointで,とする.
(a) この過程が確率の公理に反することを示せ
(b) をで置き換えると,上の過程がその公理系を満たすことを示せ
この結果から,countable additivityがfinite additivityよりも強い概念であることがわかる.
答案.
(a)
よって示せた.
(b)
. これとは矛盾しない.
Exercise 1.9
はr.v.で,distributionはとする.以下のr.v.たちのdistributionを与えよ
(a) にIIDなr.v.たちの最大値のr.v.
(b) にIIDなr.v.だちの最小値のr.v.
(c) (a)と(b)の差のr.v. ただしはPDF を持つとする.
答案.
(a)
から
(独立性)
よって
(b)
(a)とほとんど同様に,
(c) (模範解答)
求めるr.v. をとする.
とする.
から
.
がPDF を持つことから,これはである.
Exercise 1.13
はPDF をもつr.v.のIIDな無限列とする. について,をrecord-to-date,すなわちと定める. IIDの対称性を使って以下の問いに答えよ.
(a) がrecord-to-dateである確率を求めよ.
(b) がrecord-to-dateである確率をの関数として求めよ
(c) 任意のについて,最初の回の試行におけるrecord-to-dateの個数の期待値を求めよ. によって期待値がに発散すると示せ.
答案.
(a)
(b)
のどれか一つが確立1で成立し,対称性から.
(c) (はがrecord-to-dateである確率)
が発散することは有名である.
(模範解答ではは必ずrecord-to-dateになっていた.全件否定からたしかにはrecod-to-date)
Exercise 1.20
(a) は確率1/2で1,確率1/2で0をとるbinary rv’sとする. がdependentだが,それぞれ2つを選ぶとindependentになる例を挙げ,PMF を求めよ (hint: もっとも単純な例では,ただ4つのjoint probabilityが正となる)
(b) pairwise independenceは
の十分条件か.
模範解答.
(a)
(b) この例で, .よって十分条件でない.
Exercise 1.26
r.v. はcontinuousで,distributionはとする. を新たなr.v.として考える.すなわち,に,ならばということである. は上でuniformly distributedであることを示せ.
答案.
を言えば良い.
の単調性から,あるがあって,.の最大値(連続性から存在)をとすると.