2017年7月22日土曜日

The Rust Programming Language 2nd 15日目テスト1

https://doc.rust-lang.org/book/second-edition/
Apache License　Version 2.0

Testing
- How to Write Tests

Testing

Rustはコードの中にテストを書き込むことを許している.

How to Write Tests

testはRustの関数で,testでないコードが期待した通りに動いているか確かめる.test関数のbodyはふつう, 1.準備, 2.テストしたいコード, 期待する結果の3つを含んでいる.ここではtest attribute(属性)といくつかのマクロ,そしてshould_panic attributeを学ぶ.

The Anatomy of a Test Function

attributeはRustコードのメタデータで,chap.5 ですでにderiveを扱った.test attribute付きの関数がRustのテストコードである.関数をtest関数にするには,#[test]をfnの上の行に書く.cargo testによってテストを実行し,test関数のどれが成功してどれが失敗したかを返す.
testの働きを実験を,自動生成されるtemplate testを通して見ていく.そのあと実際のtestを書いてみる.
ライブラリプロジェクトadderを生成すると,src/lib.rsにはすでにテストコードが書いてある.
src/lib.rs listing 11-1

#[cfg(test)]
mod tests {
  #[test]
  fn it_works() {}
  }
}

it_works() {}は何もしないから,テストを無事通過する.

shell

$ cargo test
   Compiling adder v0.1.0 (file:///projects/adder)
    Finished dev [unoptimized + debuginfo] target(s) in 0.22 secs
     Running target/debug/deps/adder-ce99bcc2479f4607

running 1 test
test tests::it_works ... ok     // testsモジュールのit_worksが正常と言っている

test result: ok. 1 passed; 0 failed; 0 ignored; 0 measured

   Doc-tests adder  // documentに対するテスト

running 0 tests     // docを書いていないのでテストは行われない

test result: ok. 0 passed; 0 failed; 0 ignored; 0 measured

失敗するテストを書いてみる.test functionがどこかでpanicするとテストは失敗する.
src/lib.rs listing 11-3

#[cfg(test)]
mod tests {
    #[test]
    fn it_works() {
    }

    #[test]
    fn anoter() {
        panic!("Make this test fail");
    }
}

shell listing 11-4

running 2 tests
test tests::exploration ... ok
test tests::another ... FAILED

failures:

---- tests::another stdout ----
    thread 'tests::another' panicked at 'Make this test fail', src/lib.rs:9
note: Run with `RUST_BACKTRACE=1` for a backtrace.

failures:
    tests::another

test result: FAILED. 1 passed; 1 failed; 0 ignored; 0 measured

error: test failed

test tests::anotherがFAILEDだったと言っている.成功したit_worksには触れられず,anotherの失敗の理由と,失敗したtestの一覧が表示され,最後にtest全体の要約が表示される.testが失敗するのはpanicが生じたときだけではない次節では,panicは起きないが予期した結果と違った計算を行ったときエラーを出すマクロを学ぶ.

Checking Result with the `assert!` Macro

assert! macroはtest functionがfalseを返したとき場合にpanic!を呼び,testを失敗させる.

rectangle/src/lib.rs listing 11-5

#[cfg(test)]
mod tests {
  use super::*;  // tests modの外に有るstructをスコープに入れる

  #[test]
  fn larger_can_hold_smaller() {
    let larger = Rectangle { length:8, width: 7};
    let smaller = Rectangle { length:5, width: 1};

    assert!(larger.can_hold(&smaller));             // assert!(ture)
  }

  #[test]
  fn smaller_can_not_hold_larger() {
    let larger = Rectangle {length: 8, width: 7};
    let smaller = Rectangle {length: 5, width: 1};

    assert!(!smaller.can_hold(&larger))             // assert!(!false)
  }
}

#[derive(Debug)]
pub struct Rectangle {
  length: u32,
  width: u32,
}
impl Rectangle {
  pub fn can_hold(&self, other: &Rectangle) -> bool {
    self.length > other.length && self.width > other.width
  }
}

listing 11-5では,Rectangleのcan_holdメソッドが真となる場合と偽になる場合の両方を確かめている.計算の結果がfalseであることを確かめたいなら,assert!(!false)によって,確かにfalseである場合のみtestを通過させるようにできる.
shell

running 2 tests
test tests::larger_can_hold_smaller ... ok
test tests::smaller_can_not_hold_larger ... ok

test result: ok. 2 passed; 0 failed; 0 ignored; 0 measured

また,コードにバグを埋め込んでみる.ここではRectangle.can_holdの不等号演算子の一つを逆にしてみる.
self.length < other.length && self.width > other.width
結果は
shell

running 2 tests
test tests::smaller_can_not_hold_larger ... ok
test tests::larger_can_hold_smaller ... FAILED

failures:

---- tests::larger_can_hold_smaller stdout ----
        thread 'tests::larger_can_hold_smaller' panicked at 'assertion failed: larger.can_hold(&smaller)', src/lib.rs:10
note: Run with `RUST_BACKTRACE=1` for a backtrace.



failures:
    tests::larger_can_hold_smaller

test result: FAILED. 1 passed; 1 failed; 0 ignored; 0 measured

と,やはり失敗したtestの詳細と全体の要約を出力してくる.

Testing Equality with the `assert_eq!` and `assert_ne!` Macros

ある関数が適当なfuncが数値や文字列xxxを返すときにのみ通過するテストは,assert(func()== xxx)などとすれば書けるのだが,手間を省くためにassert_eq!(xxx, func())として同じ意味になるマクロassert_eq!が定義されている.また,assert_ne!(xxx, funct())はfunc()の返り値がxxxでない場合のみ通過する.どちらのマクロも,テストを通過しなかったときには問題となっている関数の返り値と想定された値を出力する.例えば
src/lib.rs listing 11-7

pub fn add_two(a: i32) -> i32 {
    a + 2
}

#[cfg(test)]
mod tests {
    use super::*;

    #[test]
    fn it_adds_two() {
        assert_eq!(4, add_two(2));
    }
}

は無事通過し,ここでadd_twoのbodyをa+3に書き換えてテストを再度実行すると
shell

test tests::it_adds_two ... FAILED

failures:

---- tests::it_adds_two stdout ----
        thread 'tests::it_adds_two' panicked at 'assertion failed: `(left == right)` (left: `4`, right: `5`)', src/lib.rs:11
note: Run with `RUST_BACKTRACE=1` for a backtrace.

と,左辺,すなわち予期した値は4であるのに,返り値が5であったとしてエラーを返してくる.
ここで我々はassert_eq!(xxx, func())と,左辺に左に予期した値,右に関数を書いたが,この順序が逆でも構わないし,両方が関数でも構わない.例えば
src/lib.rs listing 11-7-0

pub fn add_two(a: i32) -> i32 {
    a + 2
}

pub fn mut_3(a: i32) -> i32 {
    a * 3
}

#[cfg(test)]
mod tests {
    use super::*;

    #[test]
    fn mul_and_add() {
        assert_eq!(mut_3(4), add_two(10));
    }
}

はテストを通過する.

assert_eq!とassert_ne!は内部で==と!=演算子をそれぞれ使っており,また失敗時にはマクロの引数をdebug formattingによって出力する.ゆえに,比較される値はPartialE1とDebug traitを実装していなければならない.全ての基本型と殆どの標準ライブラリ型はこれらのtraitを実装しているが,プログラマが実装したstructやenumにassert_eq!やassert_ne!を適用するには,以上のtraitを実装しなければならない.しかしこれらのtraitはderivableだから,chap.5で見たように,#[derive(PartialEq, Debug)]定義時に注釈することで,簡単に実装できる.derivable traitについてはappendix Cに詳しい.

Custom Failure Messages

テストが失敗したときに好きなメッセージを出力させることが出来る.assert!は1つ,assert_eq!, assert_ne!は2つの引数を必ず取るが,さらに引数を与えると,それらはformat!マクロによって加工されるので,format stringと適当な変数を引数に渡すと,適当にパースして出力してくれる.例えば,人名を引数としてその人を歓迎する関数を作ってテストするときには以下のようなコードが考えられる.

src/lib.rs listing

pub fn greeting(name: &str) -> String {
  format!("Hello {}!", name)
}

#[cfg(test)]
mod tests {
  use super::*;

  #[test]
  fn greeting_contains_name() {
    let result = greeting("Carol");
    assert!(result.contains("Carol"));
  }
}

これはテストを通過する.greetingのbodyをString::from("Hello!")としてバグを入れると,
shell

test tests::greeting_contains_name ... FAILED

failures:

---- tests::greeting_contains_name stdout ----
        thread 'tests::greeting_contains_name' panicked at 'assertion failed: result.contains("Carol")', src/lib.rs:12
note: Run with `RUST_BACKTRACE=1` for a backtrace.

とエラーを生じる.assertionが失敗したことを言っているが,よりエラーを見やすくするために,greeting関数の返り値を表示するようにする.
src/lib.rs

#[test]
fn greeting_contains_name() {
    let result = greeting("Carol");
    assert!(
        result.contains("Carol"),
        "Greeting did not contain name, value was `{}`", result
    );    // 第二引数はプレースホルダー{}を持てる文字列で,
          // 第三引数以降がそのプレースホルダーに入る.
}

ここでまたテストを行うと
shell

test tests::greeting_contains_name ... FAILED

failures:

---- tests::greeting_contains_name stdout ----
        thread 'tests::greeting_contains_name' panicked at 'Greeting did not contain name, value was 'Hello'', src/lib.rs:12
note: Run with `RUST_BACKTRACE=1` for a backtrace.

と,確かにエラーメッセージが想定したとおりになる.

Checking for Panics with `should_panic`

予期した通りの値を返すかを確かめるのと同じくらいに,発生したエラーを予期したとおりに対処するか確かめるのは重要である.たとえばChap. 9, listing9-8で定義したGuess型で,そのinstanceは必ず1から100の値を取ることを約束したので,Guessのinstanceでその範囲から外れたものを作ろうとしたときには確かにpanicを起こすことを確かめたい.
これをshould_panic attributeを関数につけて実現する.shold_panicは,それがつけられた関数がpanicを起こすときにのみテストを通過するようにする.
src/lib.rs listing 11-8

struct Guess {
  value: u32,
}

impl Guess {
  pub fn new(value: u32) -> Guess {
    if value < 1 || value > 100 {
      panic!("Guess value must be between 1 and 100, got {}", value);
    }

    Guess {
      value
    }
  }
}

#[cfg(test)]
mod tests {
  use super::*;

  #[test]
  #[should_panic]
  fn greater_than_100() {
    Guess::new(200);
  }
}

これは確かにテストを通過する.
shell

running 1 test
test tests::greater_than_100 ... ok

test result: ok. 1 passed; 0 failed; 0 ignored; 0 measured

ここでnew()における条件を外すと,
shell

running 1 test
test tests::greater_than_100 ... FAILED

failures:

failures:
    tests::greater_than_100

test result: FAILED. 0 passed; 1 failed; 0 ignored; 0 measured

と,正常にGuessの新しいinstanceが作られてしまうので,エラーを生じる.should_panicは,予期した形のpanicでなくともpanicを拾うとテストに通してしまうので,should_panicにexpectedというパラメータを渡して,より厳密なテストを行うことが出来る.expectedには文字列が入って,panic時のメッセージにその文字列が現れるときのみテストを通すようにする.例えば
src/lib.rs listing 11-9

struct Guess {
  value: u32,
}

impl Guess {
  pub fn new(value: u32) -> Guess {
    if value < 1 {
      panic!("Guess value must be greater than or equal to 1, got {}.", value);
    }
    else if value > 100 {
      panic!("Guess value must be less than or equal to 100, got {}", value);
    }

    Guess {
      value
    }
  }
}

#[cfg(test)]
mod tests {
  use super::*;

  #[test]
  #[should_panic(expected = "Guess value must be less than or equal to 100")]
  fn greater_than_100() {
    Guess::new(200);
  }
}

をテストにかけると,確かにpanicが生じ,しかも値が100を上回るときのメッセージが与えられるから,テストを通過する.
また,if value < 1とelse if value > 100において数値と不等号を交換すると,

shell

test tests::greater_than_100 ... FAILED

failures:

---- tests::greater_than_100 stdout ----
        thread 'tests::greater_than_100' panicked at 'Guess value must be greater than or equal to 1, got 200.', src/lib.rs:8
note: Run with `RUST_BACKTRACE=1` for a backtrace.
note: Panic did not include expected string 'Guess value must be less than or equal to 100'

と,予期したメッセージと返されたメッセージが異なるため,panicが生じてもshould_panicはテストを通過させない.

以上でテストの書き方を学んだので,つぎはテストを行っているとき内部で何が起きているかとか,cargo testの様々なオプションを見ていくことにする.

2017年7月20日木曜日

MIT OCW, Fundamentals of Probability 14日目モーメント母関数1

David Gamarnik, and John Tsitsiklis. 6.436J Fundamentals of Probability. Fall 2008. Massachusetts Institute of Technology: MIT OpenCourseWare, https://ocw.mit.edu. License: Creative Commons BY-NC-SA.

モーメント母関数からは逃げられなかったよ・・・

Lecture 14. Moment Generating FUnctions

momment generating function(モーメント母関数)とその類概念(probability generating function, characterstic function)はprobability distributionを1変数の関数で表現する方法の一つである．

1. Moment Generating Fucntions

1.1 Definition

Definition 14-1

random variable $X$ のmoment generating functionを
$M_X: \mathbb{R} \ni s \mapsto E[e^{sX}] \in [0, \infty]$
と定める．また， $M_X$ のdomain $D_X$ を， $D_X = \{s|M_X(s) < \infty\}$ と定める．

$X$ がdiscrete random variableでPMFが $p_X$ ならば
$M_X(s) = \sum_x e^{sx} p_X(x)$
$X$ がcontinuous random variableでPMFが $f_X$ ならば
$M_X(s) = \int e^{sx} f_X(x)dx$

1.2 The Domain of the Moment Generating Function

$M_X(0) = E[1] = 1$ から， $0 \in D_X$ である．discrete random variableで $|X(\Omega)|<\infty$ ならば， $D_X = \mathbb{R}$ である．一方Cauchy distributino $f_X(x)=1/(\pi(1+x^2))$ では， $D_X=\{0\}$ である．一般に $D_X$ は $0$ を含む区間である．

1.3 Invension of Transforms

$M_X(s)$ の定義から， $D_X$ において $M_X(s)$ が与えられれば $X$ のdistributionが得られる．一方 $D_X$ 以外の点では $X$ のdistributionはわからない．

Theorem 14-1 Inversion Theorem

(a) $M_X$ が $[-a, ]$ 上で有限なら， $M_X$ は $X$ の固有のCDFを与える.
(b) $M_X(s) =M_Y(s) < \infty$ が $[a, b]$ で成り立つとき， $X, Y$ は同じCDFを持つ．

1.4 Moment Generating Properties

$M_X$ の0における微分係数を考える．微分と積分の順序交換が可能と仮定すると
$\frac{dM_X(s)}{ds} \mid_{s=0} = \frac{d}{ds} \int e^{sx}f_X(x)dx \mid_{s=0} = \int xe^{sx}f_X(x)dx \mid_{s=0} = \int xf_X(x)dx = E[X]$
$\frac{d^mM_X(s)}{ds^m} \mid_{s=0} = \int x^m e^{sx} f_X(x)dx \mid_{s=0} = E[X^m]$
よって $X$ の $k$ 次モーメントは $M_X^{(k)}(0)$ で計算できる．

1.5 The Probability Generating Function

Definition 14-2

$g_X(s) = E[s^X]$
を $X$ のprobability generating functionという．普通 $s>0$ である．

$X> 0$ ならば $g_X(s)$ とその微分係数が $s=0$ で存在するので， $X$ が $p_X(m), m=1, 2, ...$ というPMFを持っているとき，
$g_X(s) = \sum_{m=1}^\infty s^m p_X(m)$
だから，
$\frac{d^m}{ds^m} g_X(s) \mid_{s=0} = m!p_X(m)$
である． $X >0$ であれば $g_X$ から容易に $p_X$ が得られる

1.6 Examples

Example

$X =^d Exp(\lambda)$ とすると，
$M_X(s) = \int^\infty_0 e^{sx}\lambda e^{-\lambda x} = \begin{cases} \lambda/(\lambda - s) \ \ & s < \lambda \\ \infty & \text{otherwise} \end{cases}$

Example

$X =^d Ge(p)$ とすると,
$M_X(s) = \sum_{m=1}^\infty e^{sm} p(1-p)^{m-1} = \begin{cases} e^sp /(1-(1-p)e^s)) \ \ \ &e^s < 1/(1-p) \\ \infty & \text{otherwise} \end{cases}$
$g_X(s) = \sum_{m=1}^\infty s^m p(1-p)^{m-1} = \begin{cases} \frac{sp}{1-s(1-p)} \ \ \ & s < 1/(1-p) \\ \infty & \text{otherwise} \end{cases}$

Example

$X =^d N(0, 1)$ とすると，
$\begin{aligned} M_X(s) &= \frac{1}{\sqrt{2\pi}} \int \exp(sx)\exp(-\frac{x^2}{2} ) dx \\ &= \frac{\exp(s^2/2)}{\sqrt{2\pi}} \int \exp(-\frac{x^2 + 2sx -s^2}{2})dx \\ &=\exp(s^2/2) \ \ \ \ \ \ \ \ \ \ \ \text{ガウス関数の積分を使った} \end{aligned}$

1.7 Properties of Moment Generating Functions

Theorem 14-2

(a) $Y = aX + b$ なら $M_Y(s) = e^{sb} M_X(as)$
(b) $X, Y$ が独立なら $M_{X+Y}(s) = M_X(s)M_Y(s)$
(c) $X, Y$ が独立で $Z$ が $X$ である確率が $p$ , $Y$ である確率が $1-p$ であるとすると
$M_Z(s) = pM_X(s) + (1-p)M_Y(s)$

proof.

(a) $M_X(aX;B) = E[\exp(saX + sb)] = \exp(sb) E[\exp(saX)] = \exp(sb)M_X(as)$
(b) $M_{X+Y}(s) = E[\exp(sX+sY)] = E[\exp(sX)]E[\exp(sY)]=M_X(s)M_Y(s)$
(c) $M_Z(s) = E[e^{sz}] = pE[e^{sX}] + (1-p)E[e^{sY}]=pM_X(s) + (1-p)M_Y(s)$

Example: (Normal random variables)

(a) $X =^d N(0,1)$ で， $Y=\sigma X + \mu$ とする． $Y\sim N(\mu, \sigma^2)$ で， $M_Y(s)=\exp(s\mu)M_X(\sigma s) = \exp(s\mu + \frac{1}{2}s^2 \sigma^2)$
(b) $X =^d N(\mu_1, \sigma_1^2), Y =^d N(\mu_2, \sigma_2^2)$ とすると
$M_{X+Y}(s) = \exp(\{s(\mu_1 +\mu_2)+\frac{1}{2}s^2(\sigma_1^2+\sigma_2^2)\})$
inversion propertyから $X+Y=^d N(\mu_1+\mu_2, \sigma_1^2 +\sigma_2^2)$

2017年7月19日水曜日

The Rust Programming Language 2nd 13日目 GenericとTraits

https://doc.rust-lang.org/book/second-edition/
Apache License　Version 2.0

Generic Types, Traits, and Lifetimes
- Generic Data Types
- Traits: Defining Shared Behavior

Generic Types, Traits, and Lifetimes

同じロジックでも，扱う変数の型が違えばこれまで学んだ関数の定義方法では，型ごとに似たような関数をいくつも書かなければならない．このようなロジックの重複を解消するのがgenericで，変数の型に関係なく関数やstructを定義できる．
genericはすでにChap 6でOption<T>を, Chap. 8でVec<T>やHashMap<K, V>を，Chap. 9でResult<T, E>を使った．これを一般化した用法をこの章では学ぶ．
まず，単純に同じロジックだが引数や返り値の型が違う二つの関数を見て，それをgenericによって一本化する．次に単純に一本化できない場合の解決法を学び，最後にlifetimeという,reference同士の関係性を記述するgenericの一種を導入し，リ方法を学ぶ．

Generic Data Types

Using Generic Data Types in Function Definitions

src/main.rs listing 10-4a

fn largest(list: &[i32]) -> i32 {
    let mut largest = list[0];

    for &item in list.iter() {
        if item > largest {
            largest = item;
        }
    }

    largest
}

という関数を考える．これはi32のリストのreferenceを取ってその最大値(i32)を返す関数で，['y', 'm', 'a', 'q']と言うようなリストを引数に取ることはできないので，型だけを(list: &[char]) -> charとしたような関数を更に定義しなければならない．これは明らかに無駄なので，genericによって一本化することを考える．
引数や返り値をgeneric型にするには，そのgeneric型の変数の型名と変数自体の名を関数宣言の際に定義し，関数の内部でその変数名を使ってロジックを書く．変数の型名にはほとんど必ずTを使う．具体的な記法は
fn largest<T>(list: &[T]) -> T {
のようになる．改めてlargestを書き直したのがlisting 10-5aである．しかしこれはコンパイルできない．

src/main.rs listing 10-5a

fn largest<T>(list: &[T]) -> T {
  let mut largest = list[0];

  for &item in list.iter() {
    if item > largest {
      largest = item;
    }
  }
  largest
}

shell

error[E0369]: binary operation `>` cannot be applied to type `T`
  |
5 |         if item > largest {
  |            ^^^^
  |
note: an implementation of `std::cmp::PartialOrd` might be missing for `T`

とエラーが出る．これは任意の型Tに不等号の演算が定義されていないことが原因で，Tの取りうる値をプログラマが制限しなければならない．そのため，標準ライブラリのもつtrait std::cmp::PartialOrdを使うようにする(後述).

Using Generic Data Types in Struct Definitions

structの定義にもgenericを使える．
src/main.rs listing 10-6a

struct Point<T> {
  x: T,
  y: T,
}

fn main() {
  let integer = Point {x: 5, y: 10};
  let float = Point {x: 1.0, y: .40};
}

listing 10-6では,generic型の型名をTしか決めておらず，x, yは1つのinstanceでは必ず同じTの型しか持てない．x, yがそれぞれ異なる型の値を持てるようにするには，generic型の名前を予め二つ用意する．
src/main.rs listing 10-8

struct Point<T, U> {
  x: T,
  y: U,
}

fn main() {
  let both_integer = Point {x: 5, y: 10};
  let both_float = Point {x: 1.0, y: 4.0};
  let integer_and_float = Point{x: 5, y: 4.0};
}

は正常にコンパイルできる．generic型の型名はいくつあってもいいが，コードを読んで把握しづらくなるほど多いようならロジック自体を考え直すべき．

Using Generic Data Types in Enum Definitions

structと同様に,enumもgeneric型をそのvariantsに持てる．Option<T>がこれを行っているのはすでに見た．Rustは変数を取らないときにはgeneric型をvariantに入れないことを許しているから

enum Option<T> {
  Some(T),
  None,
}

というふうにOption<T>を定義できる．また，あるvariantに入る型と別のvariantに入る型が異なっている場合にも

enum Result<T, E> {
  Ok(T),
  Err(E),
}

と記述できる.

Using Generic Data Types in Method Definitions

Chap.5 でやったように，struct やenumにmethodを定義できるが，これにもgenericが使える．例えば
src/main.rs listing 10-9

struct Point<T> {
  x: T,
  y: T,
}

impl<T> Point<T> {
  fn x(&self) -> &T {
    &self.x
  }
}

fn main() {
  let p = Point {x: 5, y: 10};
  println!("p.x = {}", p.x());
}

また例えば
src/main.rs listing10-10

struct Point<T, U> {
  x: T,
  y: U,
}

impl<T, U> Point<T, U> {
  fn mixup<V, W>(self, other: Point<V, W>) -> Point<T, W> {
    Point {
      x: self.x,
      y: self.y,
    }
  }
}

fn main () {
  let p1 = Point {x: 5, y: 10.4} ;
  let p2 = Point {x: "Hello", y: 'C'};  
  let p3 = p1.pixup(p2);
}

は正常に実行できる．

Performance of Code using Generics

Rustはコンパイル時にgenericを具体的な型のコードたちに変換するので，genericが実行時のオーバーヘッドになることはない．Rustのこの働きをmonomorphizationという．
たとえば

let integer = Some(5);
let float = Some(5.0);

をコンパイルするとき

enum Option_i32 {
    Some(i32),
    None,
}

enum Option_f64 {
    Some(f64),
    None,
}

fn main() {
    let integer = Option_i32::Some(5);
    let float = Option_f64::Some(5.0);
}

のように内部で変換する．

Traits: Defining Shared Behavior

traitは型の振る舞いを抽象化する．つまり複数の型に同時にメソッドを定義できる．また関数の引数などにgeneric型を使っているときtraitによってその引数が取れる型の範囲を制限して，Using Generic Data Types in Function Definitionsでみたエラーに対処することができる．

Defining a Trait

型のふるまいは型に実装されているメソッドたちによって決まる．異なった型たちが同じ名前のメソッドを持っているとき，その型たちは振る舞いを共有していると考えることが出来る．traitによって複数の型に同じ名前のメソッドを同時に定義できる．例えばNewsArticle型とTweet型を考える．両者ともに,そのインスタンスの要約を返すメソッドsummaryを,summarizable traitによって持たせる．traitはmoduleのように定義するが，body blockにはsignatureだけ書く．
src/lib.rs listing 10-11

pub trait Summarizable {
  fn summary(&self) -> String;  // method signatureのみ書く
  fn author(&self) -> String;   // 複数のメソッドも書ける．
  fn content(&self) -> String;  // 1行に一つのmethod signatureを書き，セミコロンを打つ．
}

Implementing a Trait on a Type

Summarizable traitを定義したところで，型にtraitを実装する．通常のメソッド定義は
impl NewsArticle { fn summary...}と書くが，traitを実装するときは
impl Summarizable for Newsarticle { fn summary signature { }} と書く.fn summary signature { }の中に実際のロジックをコーディングする．

具体的な例:
lib.rs listing 10-12

pub struct NewsArticle {
  pub headline: String,
  pub location: String,
  pub author: String,
  pub content: String,
}

impl Summarizable for NewsArticle {
  fn summary(&self) -> String {
    format!("{}, by {} ({})", self.headline, self.author, self.location)
  }
}

pub struct Tweet {
  pub username: String,
  pub content: String,
  pub reply: bool,
  pub retweet: bool,
}

impl Summarizable for Tweet {
  fn summary(&self) -> String {
    format!("{}: {}", self.username, self.content)
  }
}

こうしてSummarizableがNewsArticleとTweetに実装できた．それぞれの型のinstanceにドット記法でSummarizableの中のメソッドを呼べる．

let tweet = Tweet {
    username: String::from("horse_ebooks"),
    content: String::from("of course, as you probably already know, people"),
    reply: false,
    retweet: false,
};

println!("1 new tweet: {}", tweet.summary());

は1 new tweet: horse_ebooks: of course, as you probably already know, people.を出力する．

これまではすべてをlib.rsに書いてきた．これらをaggregatorというcrateにして，他の場所にあるWeatherForecast structにSummarizable traitを実装したい場合，Summarizableをまずインポートする.
lib.rs listing 10-13 例

extern crate aggregator;

use aggregatro::Summarizable;

struct WeatherForecast {
  high_temp: f64,
  low_temp: f64,
  chance_of_precipitation: f64
}

impl Summarizable for WeatherForecast {
  fn summary(&self) -> String {
    format!("The high will be {}, and the low will be {}. The chance of precipitation is{}%", self. high_temp, self.low_temp, self.chance_of_precipitation)
  }
}

traitとtypeがともにexternalであるとき，そのtypeにtraitを新たに実装することはできない．例えば,Vecはexternal traitでDisplayはexternal traitだから，VecにDisplayを実装することはできない．こうしたルールをOrphan ruleという．

Default Implementations

traitを定義するとき，予めロジックを決めておいて，改めて型にtraitのメソッドを実装しない限りそのデフォルトのロジックをその型のメソッドとすることが出来る.Default implementationという．そのためには，listing 10-11ではセミコロンで止めていおいたメソッドのsignatureを，実際のロジックまで書くようにし，
lib.rs listing 10-14

pub trait Summarizable {
  fn summary(&self) -> String {
    String::from("(Read more...)");
  }
}

さらに型への実装で{ }を空白にする. impl Summarizable for NewsArticle {}仮にここでtraitの定義とは別のロジックを書いたら，新しいロジックが優先される．

default implementationはそのtraitの他のメソッドを，デフォルトが定義されていなくても，呼ぶことが出来る．例えば

pub trait Summarizable {
  fn author_summary(&self) -> String;

  fn summary(&self) -> String {
    format!("(Read more from {}...)", self.author_summary())
  }
}

このSummarizableを使うときは，author_summaryを型に実装する．

impl Summarizable for Tweet {
    fn author_summary(&self) -> String {
        format!("@{}", self.username)
    }
}

Trait Bounds

traitをgeneric type parameterと使うことも出来る．generic typeは野放図に使うとUsing Generic Data Types in Function Definitionsのようなエラーを生じることがあるので，そのgeneric typeを取れる型が特定のtraitを実装されている型であると制限して，その制限下のどの型でも動くとコンパイラが判断すれば，コンパイルしてくれる．こうしてgeneric typeの型を制限することを,”generic typeにtrait boundsを指定する”という

例えばlisting 10-12でsummarizableをNewsArticleとTweetに実装したので，NewsArticleとTweetを引数に取るnotifyという関数をgenericを使って定義する．generic type parameter TをSummarizable traitが実装されている型に制限するには，定義時に<T: Summarizable>とすれば良い．例えば

pub fn notify<T: Summarizable>(item: T) {
  println!("Breaking news! {}", item.summary())
}

また，SummarizableとDisplayを同時に実装している型にgeneric typeを制限したいときには<T: Summarizable + Displayとする．
fn some_function<T: Display + Clone, U: Clone + Debug>(t: T, u: U) -> i32 {
というふうに複数の引数にそれぞれのtrait boundsを設定することが可能だが，読みづらいのでwhereキーワードを使って

fn some_function<T, U>(t: T, u: U) -> i32
  where T: Display + Clone,
        U: Clone + Debug
{

というふうに定義することも可能である．

Fixing the `largest` Function with Trait Bounds

Using Generic Data Types in Function Definitionsで見たエラーを実際に修正しよう．

error[E0369]: binary operation `>` cannot be applied to type `T`
  |
5 |         if item > largest {
  |            ^^^^
  |
note: an implementation of `std::cmp::PartialOrd` might be missing for `T`

不等号演算子が定義されている型がTに来るかもしれないというのでエラーメッセージが出たので，不等号を定義する標準ライブラリのtrait, std::cmp::PartialOrdをtrait boundとしてみる．
fn largest<T: PartialOrd>(list: &[T]) -> T {
しかし，これでもエラーが出る．

error[E0508]: cannot move out of type `[T]`, a non-copy array
 --> src/main.rs:4:23
  |
4 |     let mut largest = list[0];
  |         -----------   ^^^^^^^ cannot move out of here
  |         |
  |         hint: to prevent move, use `ref largest` or `ref mut largest`

error[E0507]: cannot move out of borrowed content
 --> src/main.rs:6:9
  |
6 |     for &item in list.iter() {
  |         ^----
  |         ||
  |         |hint: to prevent move, use `ref item` or `ref mut item`
  |         cannot move out of borrowed content

cannot move out of type [T], a non-copy array.に着目する．TがCopy traitを実装していないため，largest = list[0]が実行できなかったことを示している．よってtrait boundにCopyを加えることで，コンパイルが可能になる．

src/main.rs listing 10-15

use std::cmp::PartialOrd;

fn largest<T: PartialOrd + Copy>(list: &[T]) -> T {
    let mut largest = list[0];

    for &item in list.iter() {
        if item > largest {
            largest = item;
        }
    }

    largest
}

fn main() {
    let numbers = vec![34, 50, 25, 100, 65];

    let result = largest(&numbers);
    println!("The largest number is {}", result);

    let chars = vec!['y', 'm', 'a', 'q'];

    let result = largest(&chars);
    println!("The largest char is {}", result);
}

Copyをtrait boundに加えたくない場合，かわりにCloneをtrait boundsに加えても良いが，Cloneはheap構造を使うので，性能が落ちる可能性がある．

2017年7月18日火曜日

MIT OCW, Fundamentals of Probability 13日目多次元の正規分布1

Lecture 14. MOMENT GENRATING FUNCTIONS
Lecture 15. MULTIVARIATE NORMAL DISTRIBUTIONS

David Gamarnik, and John Tsitsiklis. 6.436J Fundamentals of Probability. Fall 2008. Massachusetts Institute of Technology: MIT OpenCourseWare, https://ocw.mit.edu. License: Creative Commons BY-NC-SA.

Lecture 14. MOMENT GENRATING FUNCTIONS

モーメント母関数.Laplace変換とか出てきたから飛ばす．そのうちやりたい(願望)

Lecture 15. MULTIVARIATE NORMAL DISTRIBUTIONS

1. Background On Positive Definate Matrices

Definition 15-1

$A$ は $n \times n$ の正方行列とする.
(a) $A$ がpositive definate(正定値) である $\Leftrightarrow \forall x \in \mathbb{R}^n \ \ x^TAx > 0$
このとき $A>0$ と書く.
(b) $A$ がnonnegative definate(半正定値) である $\Leftrightarrow \forall \in \mathbb{R}^n \ \ x^TAx \geq 0$
このとき $A \geq 0$ と書く.

以下の事実は有名である.

(a) symmetric matrixは $n$ 個の実eigenvalueを持つ.
(b) positive definate ならeigenvalueは $n$ 個存在し全て正.
(c) nonnegative definateならeigenvalueは $n$ 個存在し全て非負
(d) symmetri matrixの全てのeigenvalueにはそれぞれ実eigenvectorがあって,異なったeigenvalueに対応するeigenvectorは直行し,複数eigenvalueが重複しているときその重複度の分直行するeigenvectorがある.
(e) 以上から,symmetric definateなら基底変換によって対角化出来る.

上の事実から, spectral decomposition(スペクトル分解) が得られる.すなわち

任意の対称行列 $A$ は, $\lambda_1, ..., \lambda_n$ を $A$ のeigenvalue, $\mathbf{z}_1, ..., \mathbf{z}_n$ をそれぞれのeigenvalueに対応するeigenvectorとすると,
$A = \sum_{i=1}^n \lambda_i \mathbf{z}_i \mathbf{z_i}^T$
と書ける.

また,nonnegative definite matrixであるなら $\lambda_i \geq 0$ だから平方根が実数で,
$B = \sum_{i=1}^n \sqrt{\lambda_i} \mathbf{z_i}\mathbf{z_i}^T$
が定義できる.このとき

(a) $B$ はsymmetric
(b) $B^2 = A$ である. $B$ を $A$ のsymmetric square rootという.
(c) $B$ のeigenvalueたちは $\{\sqrt{\lambda_i}\}$ である.よって, $B$ がpositive(nonnegative) definite $\Leftrightarrow$ $A$ がpositive(nonnegative) definite.

特に $A$ がpositive definiteならば $\lambda_i > 0$ で,
$C= \sum_{i=1}^n \frac{1}{\lambda_i} \mathbf{z_i} \mathbf{z_i}^T$
が定義できて, $CA=AC=I$ ゆえ, $C=A^{-1}$ である.

2. DEFINITION OF THE MULTIVARIATE NORMAL DISTRIBUTION

全ての要素がrandom variableであるベクトルをrandom vectorと呼び.全ての要素がrandom variableである行列をrandom matrixと呼ぶ.
multivariate normal distributionの表現方法３つを取り上げ,それらの同値性を確かめる．最初に，最もわかりやすいがいろいろな操作が面倒な表現を与える.

Definition 15-2

random vector $\mathbf{X}$ がnondegenerate (multivariate) normal distributionをもつ
$\Leftrightarrow$ joint PDF が,あるベクトル $\mu$ とpositive definite $V$ で
$f_X(\mathbf{x}) = \frac{1}{\sqrt{(2\pi)^n |\det V|}} \exp \left[- \frac{(\mathbf{x} - \mu) V^{-1} (\mathbf{x} - \mu)^T}{2} \right]$
と書ける．

さらに,操作が簡単な生成的な定義を与える.

Definition 15-3

random vector $\mathbf{X}$ が (multivariate) normal distributionをもつ
$\Leftrightarrow$ あるmatrix $D$ とベクトル $\mu$ , そして要素が $N(0, 1)$ に独立に従うランダムなベクトル $\mathbf{W}$ によって,
$\mathbf{X} = D\mathbf{W} + \mu$
と書ける.

最後に与える定義は最も難しいが,最も美しいと言う人もいる.

Definition 15-4

random vectro $\mathbf{X}$ が(multivariate) normal distributionをもつ
$\Leftrightarrow$ 任意のベクトル $\mathbf{a}$ にrandom variable $\mathbf{a}^T \mathbf{X}$ がnormal.

Definition 15-2でnondegenerateという語を使ったが，これは $f_X(\mathbf{x}) >$ という意味である. $\mathbf{X} = (X_1, X_2), X_1 \sim N(0, 1), X_2=0$ はNormalだが,これはDef. 15-2の方法では表現できないので,nondegenerateという制限を加えている.

3. MEANS AND COVARIANCES OF VECTOR RANDOM VARIABLES

Definition 15-5

random vector $\mathbf{X} = (X_1, ..., X_N)$ のexpectationを
$E[\mathbf{X}] = (E[X_1], ..., E[X_n])$
とする．同様にrandom matrix $A= A_{ij}$ についてもexpectationを
$(E[A])_{i j} = E[A_{i j}]$
とする.

random vector $\mathbf{X} = (X_1, ..., X_n), \mathbf{Y} = (Y_1, ..., Y_m)$ があるとき,covariance matrix(分散行列, 分散共分散行列)を,
$Cov(\mathbf{X}, \mathbf{Y}) = E \left[(X-E[X])(Y-E[Y])^T \right]$
と定める. $Cov(X, Y)$ の $i j$ 成分は $Cov(X_i, Y_j)$ である.

4. KEY PROPERTIES OF THE MULTIVARIATE NORMAL

Theorem 15-1 (証明略)

$\mathbf{X} = (X_1,...,X_n)$ がmultivariate normalであるとする. $\mu_i$ は第 $i$ 要素の平均と考えることが出来る.このとき
(a) $X_i$ はnormalで,平均は $\mu_i$
(b) $Cov(\mathbf{X}, \mathbf{X}) = DD^T$
(c) $C$ が $m \times n$ 行列で, $\mathbf{d} \in \mathbb{R}^m$ とする. $Y = C\mathbf{X} + d$ はdef. 3の意味でmultivariate normalであって,平均は $C\mu + \mathbf{d}$ , covariance matrixは $CDD^TC^T$ である.
(d) $|D| \neq 0$ なら $\mathbf{X}$ はnondegenerate multivariate normalであって, $V = DD^T = cov(X, X)$ である.
(e) $\mathbf{X}$ のjoint PDF $F_X$ は $\mathbf{X}$ の平均とcovarianceだけで決まる
(f) $\mathbf{X}$ のそれぞれの要素がuncorrelatedすなわち $cov(X, X)$ が対角行列 $\Leftrightarrow$ それぞれが独立
(g) $\left[\begin{array}{} \mathbf{X} \\ \mathbf{Y}\end{array} \right] \sim N \left( \left[\begin{array}{} \mu_X \\ \mu_Y \end{array}\right] , \left[ \begin{array}{} V_{XX} & V_{XY} \\ V_{YX} & V_{YY} \end{array} \right]\right)$
かつ $V_YY > 0$ ならば

(i) $E[\mathbf{X} | \mathbf{Y}] = \mu_X + V_{XY} V_{YY}^{-1} (\mathbf{Y}-\mu_Y)$
(ii) $\tilde{\mathbf{X}} = \mathbf{X} - E[\mathbf{X}|\mathbf{}]$ とすると, $\tilde{\mathbf{X}}$ は $\mathbf{Y}$ と独立で，また $E[X|Y]$ と独立.
(iii) $cov(\tilde{\mathbf{X}}, \tilde{\mathbf{X}}|\mathbf{Y}) = cov(\tilde{\mathbf{X}}, \tilde{\mathbf{X}}) = V_{XX} - V_{XY}V_{YY}^{-1}V_{YX}$

2017年7月17日月曜日

MIT OCW, Fundamentals of Probability 12日目積分の順序交換

David Gamarnik, and John Tsitsiklis. 6.436J Fundamentals of Probability. Fall 2008. Massachusetts Institute of Technology: MIT OpenCourseWare, https://ocw.mit.edu. License: Creative Commons BY-NC-SA.

- Lecture 13 Product Measure and Fubini’s Theorem

Lecture 13 Product Measure and Fubini’s Theorem

1. Product Measure

$(\Omega_1, \mathcal{F}_1, P_1), (\Omega_2, \mathcal{F}_2, P_2)$ と2つのprobability spaceを考える.ふたつのprobability spaceで独立にexperimentを行うとき,”joint experiment”とでも言うものを考え,それに対して新たなprobability spaceを与える.

1.1, 1.2, 1.3 The Sample Space, $\sigma$ -Field and Measure of the Joint Experiment

明らかに新たなsample spaceは $\Omega = \Omega_1 \times \Omega_2$ .
$A_1 \in \mathcal{F}_1, A_2 \in \mathcal{F}_2$ であれば,新しいprobability spaceでも $P(\omega_1 \in A_1, \omega_2 \in A_2)$ という確率が知りたいので,新しい $\sigma$ -fieldを以下のように定義する.

Definition 13-1

$\mathcal{F}_1 \times \mathcal{F}_2 := \sigma(\{A_1 \in \mathcal{F}_1, A_2 \in \mathcal{F}_2\})$
は $\Omega_1 \times \Omega_2$ 上の $\sigma$ -fieldである. $\mathcal{F}_1 \times \mathcal{F}_2$ はデカルト積ではない.
さらに, $(\Omega_1 \times \Omega_2, \mathcal{F}_1 \times \mathcal{F}_2)$ 上のprobability measure $P$ を定義する.独立性を仮定しているから,
$P(A_1 \times A_2) = P_1(A_1) P_2(A_2)$
が成り立たなければならない.

Theorem 13-1 (証明略)

$P(A_1 \times A_2 ) =P_1(A_1)P_2(A_2)$
を満たす $P$ は唯一つ存在する.この $P$ を $P_1 \times P_2$ とも書き, $P_1$ と $P_2$ のproduct measureと呼ぶ.

1.4 Beyond Probability Measures

$\Omega$ の可算個の分割で,そのすべての分割にmeasure $\mu$ が有限であるようにできるとき, $\mu$ は $\sigma$ -finiteという. $\{\mu_i\}$ たちが $\sigma$ -finiteであるとき,Theorem 13-1は成立する.

1.5 The Product Measure on $\mathbb{R}^2$

$(\mathbb{R}, \mathcal{B}, \lambda)$ を2つ考えて節1のように新しいmeasure space
$(\mathbb{R}^2, \mathcal{B} \times \mathcal{B}, \lambda_2)$
を定義できる.ただし $\lambda$ はLebesgue measureとする. $\lambda_2$ は2次元Lebesgue measureという.
ところで $\mathcal{B} \times \mathcal{B}$ は $\mathbb{R}^2$ の開集合全体から導からる $\sigma$ -fieldとして定義しても同じことである.

2. Fubini’s Theorem

Lebesgue積分の順序交換ができる条件を論じる.Lebesgue積分の勉強をしたいわけではないので結論だけ見る. $g: \Omega_1 \times \Omega_2 \rightarrow \mathbb{R}$ はmeasurableとする.これは任意の $c \in \mathbb{R}$ に $\{(\omega_1, \omega_2)| g(\omega_1, \omega_2) \leq c\}\in \mathcal{F}_1 \times \mathcal{F}_2$ という条件に同値.
わかりやす measurable functionの例に

(a) 連続な $\mathbb{R}^2 \rightarrow \mathbb{R}$ はmeasurable
(b) measurable setのindicator functionはmeasurable
(c) measurable functionたちの加減乗算と極限操作はmeasurable

Theorem 13-2

$g: \Omega_1 \times \Omega_2 \rightarrow \mathbb{R}$ は非負かつmeasurableで, $P = P_1 \times P_2$ はこの上のproduct measureとする.このとき

(a) $\forall \omega_1 \in \Omega_1 \ \ g(\omega_1, \omega_2)$ は $\omega_2$ の関数としてmeasurable
(b) $\forall \omega_2 \in \Omega_2 \ \ g(\omega_1, \omega_2)$ は $\omega_1$ の関数としてmeasurable
(c) $\int_{\Omega_2} g(\omega_1, \omega_2) dP_2$ は $\omega_1$ の関数としてmeasurable
(d) $\int_{\Omega_1} g(\omega_1, \omega_2) dP_1$ は $\omega_2$ の関数としてmeasurable
(e) $\begin{aligned} \int_{\Omega_1}\left[\int_{\Omega_2} g(\omega_1, \omega_2) dP_2 \right]dP_1 &= \int_{\Omega_2} \left[ \int_{\Omega_1} g(\omega_1, \omega_2) dP_1 \right]dP_2 \\ &= \int_{\Omega_1 \times \Omega_2} g(\omega_1, \omega_2) dP \end{aligned}$

Theorem 13-2は $g$ が非負であると仮定していて,積分が $\infty$ であることを禁じていない.関数がintegrableとは,積分が $\infty$ 未満の実数に確定することであった.関数の絶対値の二重積分がintegrableであるとき,順序交換できるというのがTheorem 13-3の主張である.

Theorem 13-3

$g: \Omega_1 \times \Omega_2 \rightarrow \mathbb{R}$ がemasurableで,かつ
$\int_{\Omega_1 \times \Omega_2} |g(\omega_1, \omega_2)| dP < \infty$
であるとする.このとき

(a) $\omega_1 \in \Omega_1, a.e.$ に $g(\omega_1, \omega_2)$ は $\omega_2$ の関数としてintegrable
(b) $\omega_2 \in \Omega_2, a.e.$ に $g(\omega_1, \omega_2)$ は $\omega_1$ の関数としてintegrable
(c) $\int_{\Omega_2} g(\omega_1, \omega_2) dP_2 = h(\omega_1)\ a.s.$ となる $h: \Omega_1 \rightarrow \mathbb{R}$ が存在する.
(d) $\int_{\Omega_1} g(\omega_1, \omega_2) dP_1 = h(\omega_2)\ a.s.$ となる $h: \Omega_2 \rightarrow \mathbb{R}$ が存在する.
(e) $\begin{aligned} \int_{\Omega_1}\left[\int_{\Omega_2} g(\omega_1, \omega_2) dP_2 \right]dP_1 &= \int_{\Omega_2} \left[ \int_{\Omega_1} g(\omega_1, \omega_2) dP_1 \right]dP_2 \\ &= \int_{\Omega_1 \times \Omega_2} g(\omega_1, \omega_2) dP \end{aligned}$

4. An Application

基本的な確率論の定理をFubini’s Theoremを使って証明する.

$X$ を非負なrandom variableとする.このとき
$E[X] = \int^{\infty}_0 P(X \geq x)$

を示す.

proof.

$A = \{(w, x) | 0 \leq x \leq X(w)\}$ とする.このとき
$E[X] = \int_{\Omega} X(w)dP = \int_{\Omega} \int^{\infty}_0 1_A(w, x)dxdP$
Fubini’s theoremを適用して
$E[X] = \int^\infty_0 \int_\Omega 1_A(w, x) dPdx$
$\int_{\Omega} 1_A(w, x)dP$ というのは $x$ を固定して $1_A(w, x)$ を $w$ の関数と考えているので,
$1_A(w,x) = \begin{cases} 1 \ \ \ &(w \geq x) \\ 0 & (w < x) \end{cases}$ よって $\int_{\Omega} 1_A(w, x)dP = P(X \geq x)$
以上より
$E[X] = \int^\infty_0 P(X \geq x)$
(Fubini’s theoremが使える条件をみたしているかの判定は略した)

2017年7月16日日曜日

MIT OCW, Fundamentals of Probability 11日目 Lebesuge積分と収束定理

David Gamarnik, and John Tsitsiklis. 6.436J Fundamentals of Probability. Fall 2008. Massachusetts Institute of Technology: MIT OpenCourseWare, https://ocw.mit.edu. License: Creative Commons BY-NC-SA.

Lecture 11 Abstract Integration -I

Lebesgue 積分について論じる.

1. Preliminaries

measure space $(\Omega, \mathcal{F}, \mu)$ と $g: \Omega \rightarrow \overline{\mathbb{R}}$ について, $\int g d\mu$ を定義する. $\int g d\mu$ を $g$ の( $\Omega$ での)Lebesgue integralというが,これを $\int g$ とか $\int g(\omega) d \mu(\omega)$ と書くことも有る.

Special cases:

(a) $(\Omega, \mathcal{F}, P)$ がprobability spaceで $X: \Omega \rightarrow \overline{\mathbb{R}}$ がmeasurableなら, $\int X dP = E[X]$
(b) $(\mathbb{R}, \mathcal{B}, \lambda)$ において, $\mathcal{B}$ がBorel sets, $\lambda$ がBorel measureとするとき, $\int g d\lambda$ を $\int g(x)dx$ と書くことが有る.これはRiemann積分の一般化である.

The Program:

$\int g d\mu$ を以下の段階に沿って定義する.

(a) $g$ が非負で値域が有限集合な関数(simple function, 単函数)について,単に重み付きの和として積分を定める.
(b) 非負な $g$ を,simple functionによって下から近似して,その極限で積分を定める.
(c) 一般の $g$ について, $g = g_+ - g_-$ と正部と負部にわけてそれぞれ積分し, $\int g d\mu = \int g_+ d\mu - \int g_- d\mu$ とする.

$\Omega$ 上の積分についてのみ論じるが,ある $B \in \mathcal{F}$ における積分は単に
$\int_B g d\mu = \int (1_B g) d\mu$
とすればよい.ただし $1_B g(\omega) = \begin{cases} g(\omega) \ \ \ & \omega \in B \\ 0 & otherwise \end{cases}$ とする.
以後,ある性質 $P$ について, $\mu(\{\omega| P(\omega) = False\}) = 0$ であるとき,”Pはa.e. (almost everywhere, ほとんどいたる所) に成立する”という.特に $\mu$ がprobability measureであるとき,a.s. (almost surely, ほとんど確かに)と呼ぶ.例えば $X \neq Y a.s.$ とは, $P(X=Y) = P(\{\omega| X(\omega) \neq Y(\omega)\})=0$ と同値である.
同様に,函数 $g, h$ に $g\leq h$ とは $\forall \omega g(\omega) \leq h(\omega)$ のことだが, $g \leq h \ a.e.$ とは, $\mu(\{\omega| g(\omega) > h(\omega)\}) = 0$ ということである.また” $g_n \uparrow g$ ”によって,任意の $\omega$ に $g_n(\omega)$ が広義単調増加数列で, $g$ に収束することを示し, $g_n \uparrow g \ \ a.e.$ は $g_n(\omega)$ がほとんどすべての点で $g(\omega)$ に広義単調増加収束するということである.

2. The Main Result

The Programで挙げた(a), (b), (c)で,(c)において $g_+ d\mu = g_- d\mu=\infty$ である場合以外,かならず積分値が $\overline{\mathbb{R}}$ の元に確定する.以下は重要な定理であるが,証明は略す.左に一般のmeasureに成立する命題を,右に特に確率論の記法で書いたその命題を記す.

Theorem 11-1

$\begin{aligned} &1. \int 1_B d\mu = \mu(B) \ \ \ \ \ & E[1_B] = P(B) \\ &2. g \geq 0 \Rightarrow \int g d\mu \geq 0 & X \geq 0 \Rightarrow E[X] \geq 0 \\ &3. g= 0 a.e. \Rightarrow \int g d\mu = 0 & X = 0 a.s. \Rightarrow E[X]=0 \\ &4. g \leq h \Rightarrow \int g \leq \int h & X \leq Y \Rightarrow E[X] \leq E[Y] \\ &4' g \leq h, a.e. \Rightarrow \int g \leq \int h & X \leq Y a.s. \Rightarrow E[X] \leq E[Y] \\ &5. g= h, a.e. \Rightarrow \int g = \int h & X=Y, a.s. \Rightarrow E[X]=E[Y] \\ &6.[g\geq 0, a.e. and \int g =0] \Rightarrow g = 0, a.e. & [X \geq 0, a.s. and E[X] \geq 0] \Rightarrow X =0, a.s. \\ &7. \int(g+h) = \int g + \int h & E[X+Y] = E[X]+ E[Y] \\ &8. \int(ag) &= a \int g \\ &9.\ \ 0\leq g_n\uparrow g \Rightarrow \int g_d \uparrow \int g & 0 \leq X_n \uparrow X \Rightarrow E[X_n] \uparrow E[X] \\ &9'\ \ 0 \leq g_n \uparrow g, \ a.e. \Rightarrow \int g_n \uparrow \int g & 0 \leq X_n \uparrow X, a.s. \Rightarrow E[X_n] \uparrow E[X] \\ &10. g\geq 0 \Rightarrow \nu(B)=\int_B g \text{ is a measure} & [f \geq 0, \int f = 1]\Rightarrow \nu(B)=\int_B \text{ is a probability measure} \end{aligned}$

9, 9’をMonotone Convergence Theorem(MCT, 単調収束定理)という.これにのみあとで証明を与える.

The Riemann Integral

Riemann積分の定義はすでにやった.http://37ma5ras.blogspot.jp/2017/06/basic-analysis-jiri-lebl-16.html.
Riemann積分はほとんど至るところ連続な函数でしか定義できない.Lebesgue積分はこの問題を解決する.

Example

$Q = [0, 1] \cap \mathbb{Q}$ とする. $g = 1_{Q}$ とする. $[0, 1]$ の任意の分割 $P = (0=x_1<x_2<\cdots<x_n=1)$ を考える. $[x_i, x_{i+1})$ は必ず有理数と無理数を含むから,Darboux和は $L(P, g)=0, U(P, g)=1$ が必ず成立.よっていかなる分割にもDarboux上下和は一致せず,Riemann積分不能.一方 $[0, 1]$ 上のuniform distributionとrandom variable $1_Q$ を考えると, $P(1_Q = 1) = 0 (\because |Q|=|\mathbb{N}|)$ で, $E[X] = \int_{[0, 1]}1_Q(x)dx = 0$ .

4.The Integral of a Nonnegative Simple Function

Definition 11-2

$g: \Omega \rightarrow \mathbb{R}$ がsimple function(単函数) $\Leftrightarrow g\text{はmeasurableで}|g(\Omega)| < |\mathbb{N}|$

このとき $g$ は
$g(\omega) = \sum_{i=1}^k a_i 1_{A_i}(\omega), \ \ \ a_i \in \mathbb{R}, \ A_i \in \mathcal{F}$
と書ける.このような表現はいくらでも作れるが, $\{a_i\}$ がすべて異なった値で, $\{A_i\}$ が互いに素である表現は唯一つで,このような表現をcanonicalという.canonical表現では $\{a_i\} = g(\Omega), A_i=\{\omega|g(\omega)=a_i)$ である.

Definition 11-3

$g$ がsimple functionであって上の様に表現するとき,その積分を
$\int g d\mu := \sum_{i=1}^k a_i \mu(A_i)$
と定める.

$\mu$ がprobability measure $P$ であるとすると,simple function $X: \Omega \rightarrow \mathbb{R}$ をsimple random variableとよび,その積分 $\int X dP$ は $E[X]$ と書かれ,
$E[X] = \sum_{i=1}^k a_i P(A_i)$
である.仮に $\{a_i\}$ の元がそれぞれ異なるとき,つまりcanonicalであるとき
$E[X] = \sum_{i=1}^k a_i P(X=a_i)$
が成立する.

4.2 Proof of the Monotone Convergence Theorem

property 9の,probability measureの場合をsimple functionに示す.
$q = \sum_{i=1}^k a_i 1_{A_i}, a_i >0$ と表現したsimple function $q$ を考える.
$\{g_n\}$ を $g_n \uparrow q$ なるnonnegative measurable functionの列とする. $\int q$ が無限である場合と有限である場合に場合分けする.

(i) $\int q =\infty$ であるとき,ある $i$ に $\mu(A_i)=\infty$ ということである.この $i$ について
$B_n = \{\omega \in A_i | g_n(\omega) > a_i / 2\}$
という集合列を考える. $B_n \uparrow A_i$ であって,measureの連続性から $\mu(B_n) \uparrow \infty$ .また $g_n \geq (a_i/2)1_{B_n}$ である.Theorem 11-1-4から
$\int g_n d\mu \geq \int (a_i/2) 1_{B_n} d\mu = \frac{a_i}{2} \mu(B_n) \uparrow \infty$
よって $\int g_n \uparrow \infty$

(ii) $\int q < \infty$ とする.常に $\mu(A_i) < \infty$ であって, $A=\sum_{i=1}^k A_i$ とする.finite additivityから $\mu(A) < \infty$ である. $1/ r < a$ なる整数 $r$ を固定する.
$B_n = \{\omega \in A| g_n(\omega) \geq q(\omega) - (1/r)\}$
とすると $B_n \uparrow A$ で,連続性から $\mu(B_n) \uparrow \mu (A) = \mu(B_n) + \mu(A \backslash B_n) < \infty$ から $\mu(A\backslash B_n) \downarrow 0$ .
$1_A q = q, a.e.$ であって,
$\int q d\mu = \int 1_A q d\mu = \int 1_{B_n} q d\mu + \int 1_{A \backslash B_n} q d\mu$
$\omega \in B_n$ に $g_n(\omega) + (1/r) \geq q(\omega)$ だから, $g_n + (1/r)1_{B_n} \geq 1_{B_n} q$ .
したがって
$\int g_n d\mu + \int \frac{1}{r} 1_{B_n} d\mu \geq \int 1_{B_n} q d\mu = \int q d\mu - \int 1_{A\backslash B_n} q d\mu \geq \int q d\mu - a \mu(A\backslash B_n)$
極限を取って
$\lim_{n \rightarrow \infty} \int g_n d\mu + \frac{1}{r} \mu(A) \geq \int q d\mu$
$r > 1/a$ は任意だから
$\lim \int g_n d\mu \geq \int q d\mu$
一方 $g_n \leq q$ から $\int g_n d\mu \leq \int q d\mu$ で $\lim \int g_n d\mu \leq \int q d\mu$ .
以上より
$\lim \int g_n = \int q$

5. The Integral of a Nonnegative Function

非負関数 $g$ の積分は, $g$ をsimple functionによって下から近似して定めることはすでに述べた.

Definition 11-4

measurable $g: \Omega \rightarrow [0, \infty]$ について, $S(g)=\{q| q \leq g, q\text{はsimple}\}$ とする.
$\int g d\mu = \sup_{q \in S(g)} \int q d\mu$
と積分を定める.

Lecture 12 Abstract Integration -II

この章では重要な定理が証明されているが,関数がsimple functionである場合以外は省略する.

1. Borel-Cantelli Revisited

Borel-Cantelliの補題はすでに述べたがもう一度定式化する.http://37ma5ras.blogspot.jp/2017/07/gamarnik-tsisiklis-fundamentals-of_8.html
特に第一の主張 $A=\{A_n \text{i.o.}\}, \sum P(A_n) < \infty \Rightarrow P(A)=0$ について論じる.
$X_i$ をevent $A_i$ のindicator functionとする. $E[X_i] = P(A_i)$ であって, $\sum E[X_i] < \infty$ を仮定する. $\sum_{i=1}^n X_i$ というrandom variableは非負で $n$ によって増加列をなす.さらに
$\lim_n \sum_{i=1}^n X_i = \sum_{i=1}^\infty X_i$
と各点収束する.Monotone Convergence Theoremとexpectationの線形性から
$\begin{aligned} E[\sum X_i] &= \lim E[\sum_{i=1}^n X_i] \\ &= \lim \sum_{i=1}^n E[X_i] \\&= \lim \sum_{i=1}^n P(A_i) = \sum P(A_i) < \infty \end{aligned}$
であって, $\sum X_i < \infty \ a.s.$ である. $A_i$ が有限回起きる確率が1ということであって,すなわち $A_i$ が無限回起きる確率が0ということである.

2. Connections between Abstract Integration and Elementary Definitions of Integrals and Expectations

2.2 Evaluating Expectations by Integrating on Different Spaces

$(\Omega, \mathcal{F}, P)$ というprobability spaceを考える. $X$ をその上のrandom variableとすと, $(\mathbb{R}, \mathcal{B}, P_X)$ という新しいprobability spaceが現れる.ここで $\mathcal{B}$ は $\mathbb{R}$ のBorel sets, $P_X$ は $X$ のprobability law
$P_X(A) = P(\{\omega \in \Omega| X(\omega) \in A\})$
である.measurableな $g: \mathbb{R} \rightarrow \mathbb{R}$ で $Y=g(X)$ を定義し,また新たなprobability space $(\mathbb{R}, \mathcal{B}, P_Y)$ を定める. $E[Y]$ は3つの方法で計算できる.

Theorem 12-1

$\int Y dP = \int g dP_X = \int ydP_Y$

proof. $g$ がsimple functionである場合のみ示す.

$g(\mathbb{R}) = \{y_1, ..., y_n\}$ とする.定義より
$YdP = \sum_{y_i} y_i P(\{\omega| Y(\omega) = y_i\} = \sum_{y_i} y_i P(\{\omega|g(X(\omega))=y_i\})$
同様に
$\int g dP_X = \sum_{y_i} y_i P_X(\{x| g(x) = y_i\})$
$P_X$ の定義より,
$P_X(\{x|g(x)=y_i\}) = P_X(g^{-1}(y_i))=P(\{\omega|X(\omega)\in g^{-1}(y_i)\})=P(\{\omega|g(X(\omega))=y_i\})$

以上によって示せた.

2.3 The Case of Continuos Random Variables, Described by PDFs

$X: \Omega \rightarrow \mathbb{R}$ がcontinuousであるとは,そのCDFが
$F_X(x)=P(X \leq x) = \int 1_{(-\infty, x]}f d\lambda \ \ \ \ (\lambda: \text{Lebesgue masure})$
というふうに,非負でmeasurableな $f$ で書けることであった.このとき $A \in \mathcal{B}$ に
$P_X(A) = \int_A f d\lambda$
が成立する. $f$ がRiemann積分可能で $A$ が区間なら単に $P_X(A) = \int_A f(x) dx$ と書ける.

Theorem 12-2

$g$ はmeasurableで非負であるか, $\int |g| dP_X < \infty$ ならば
$E[g(X)] = \int g dP_X = \int (gf) d\lambda$
が成立する.

proof.

$E[g(X)] = \int gdP_X$ は定義であるから, $\int g dPX_ = \int (gf)d\lambda$ を示す.
$g$ がsimple functionで, $g= \sum_{i=1}^k a_i 1_{A_i}$ と書けるときのみ示す.
$\begin{aligned} \int g dP_X &= \sum_{i=1}^k a_i P_X(A_i) \\ &= \sum_{i=1}^k a_i \int_{A_i} f d\lambda \\ &= \sum_{i=1}^k \int a_i 1_{A_i}f d\lambda \\ &= \int \sum_{i=1}^k a_i 1_{A_i} f d\lambda \\&= \int (gf) d\lambda\end{aligned}$
から,成立.

Fatou’s Lemma

$X, Y$ という2つのrandom variableがあるとき, $\min\{X, Y\} \leq X, \min\{X, Y\} \leq Y$ であって,expectationをとると $E[\min\{X, Y\}] \leq E[X], E[\min \{X, Y\}] \leq E[Y]$ .したがって
$E[\min\{X, Y\}] \leq \min\{E[X], E[Y]\}$ が成立する.
Fatouの補題はこれに無限個のrandom variableと極限操作を入れて出来る命題である.

Theorem 12-3

$Y$ は $E[|Y|] < \infty$ なるrandom variableとする.このとき
(a) $\forall n\ \ Y \leq X_n$ であるなら $E[\liminf X_n] \leq \liminf E[X_n]$
(b) $\forall n\ \ X_n \leq Y$ であるなら $E[\limsup X_n] \geq \limsup E[X_n]$

proof.

(a)のみ示す. $n$ を固定し,
$\inf_{k \geq n} X_k - Y \leq X_m - Y \ \ \ \ \ \forall m \geq n$
expectationを取ってから $\inf$ を考えて
$E[\inf_{k \geq n} X_k -Y] \leq \inf_{m \geq n} E[X_m - Y]$
$\inf_{k\geq n} X_k - Y$ は非負であり, $n$ によって広義単調増加である.また $\liminf X_n - Y$ に収束する.両辺の極限を取って,
$\lim_n E[\inf_{k \geq n} X_k - Y] \leq \liminf E[X_n-Y]$
左辺はMonotone convegence theoremから $E[\liminf X_n -Y]$ に収束し,
$E[\liminf X_n - Y] \leq \liminf E[X_n -Y]$
$E[|Y|] < \infty$ から $E[\liminf X_n] \leq \liminf E[X_n]$

4. Dominated Convergence Theorem(DCT, 優収束定理)

Theorem 4. (DCT)

$X$ に各点収束する $\{X_n\}$ というrandom variableの列を考える. $\forall n \ \ |X_n| \leq Y, E[|Y|] < \infty$ があるなら, $\lim E[X_n] = E[X]$

proof.

$-Y \leq X_n \leq Y$ だから,両辺にFatou’s Lemmaを適用して
$E[X] = E[\liminf _Xn] \leq \liminf E[X_n] \leq \limsup E[X_n] \leq E[\limsup X_n] = E[X]$
ゆえに
$E[X] = \liminf E[X_n] = \limsup E[X_n]$
よって $\lim E[X_n]$ が存在して, $E[X]$ に等しい.

DCTの特別な場合に,Bounded Covergence Theorem(BCT, 有界収束定理)がある.これは $Y$ を $c$ という定数としたとき,すなわち $|X_n| \leq c \ \ \ a.s.$ であるなら $E[X_n] \rightarrow X$ を主張する.

Corollary 12-1

$\sum E[|Z_n|] < \infty$ ならば
$\sum_{n=1}^\infty E[Z_n] = E[\sum_{n=1}^\infty Z_n]$
が成立する.

proof.

Monotone Convergence Theoremを $Y_n = \sum_{k=1}^n |Z_k|$ に適用し
$E[\sum |Z_n|] = \sum E[|Z_n|] < \infty$
$X_n = \sum_{i=1}^n Z_i$ とすれば $\lim X_n = \sum Z_n$ . $|X_n | \leq \sum |Z_i|< \infty$ で,これにDCTを適用する.

登録: 投稿 (Atom)

2017年7月22日土曜日

Testing

How to Write Tests

The Anatomy of a Test Function

Checking Result with the assert! Macro

Testing Equality with the assert_eq! and assert_ne! Macros

Custom Failure Messages

Checking for Panics with should_panic

2017年7月20日木曜日

Lecture 14. Moment Generating FUnctions

1. Moment Generating Fucntions

1.1 Definition

Definition 14-1

1.2 The Domain of the Moment Generating Function

1.3 Invension of Transforms

Theorem 14-1 Inversion Theorem

1.4 Moment Generating Properties

1.5 The Probability Generating Function

Definition 14-2

1.6 Examples

Example

Example

Example

1.7 Properties of Moment Generating Functions

Theorem 14-2

Example: (Normal random variables)

2017年7月19日水曜日

Generic Types, Traits, and Lifetimes

Generic Data Types

Using Generic Data Types in Struct Definitions

Using Generic Data Types in Enum Definitions

Using Generic Data Types in Method Definitions

Performance of Code using Generics

Traits: Defining Shared Behavior

Defining a Trait

Implementing a Trait on a Type

Default Implementations

Trait Bounds

Fixing the largest Function with Trait Bounds

2017年7月18日火曜日

Lecture 14. MOMENT GENRATING FUNCTIONS

Lecture 15. MULTIVARIATE NORMAL DISTRIBUTIONS

1. Background On Positive Definate Matrices

Definition 15-1

2. DEFINITION OF THE MULTIVARIATE NORMAL DISTRIBUTION

Definition 15-2

Definition 15-3

Definition 15-4

3. MEANS AND COVARIANCES OF VECTOR RANDOM VARIABLES

Definition 15-5

4. KEY PROPERTIES OF THE MULTIVARIATE NORMAL

Theorem 15-1 (証明略)

2017年7月17日月曜日

Lecture 13 Product Measure and Fubini’s Theorem

1. Product Measure

1.1, 1.2, 1.3 The Sample Space, \sigma-Field and Measure of the Joint Experiment

Definition 13-1

Theorem 13-1 (証明略)

1.4 Beyond Probability Measures

1.5 The Product Measure on \mathbb{R}^2

2. Fubini’s Theorem

Theorem 13-2

Theorem 13-3

4. An Application

2017年7月16日日曜日

Lecture 11 Abstract Integration -I

1. Preliminaries

Special cases:

The Program:

2. The Main Result

Theorem 11-1

The Riemann Integral

Example

4.The Integral of a Nonnegative Simple Function

Definition 11-2

Definition 11-3

4.2 Proof of the Monotone Convergence Theorem

5. The Integral of a Nonnegative Function

Definition 11-4

Lecture 12 Abstract Integration -II

Checking Result with the `assert!` Macro

Testing Equality with the `assert_eq!` and `assert_ne!` Macros

Checking for Panics with `should_panic`

Fixing the `largest` Function with Trait Bounds

1.1, 1.2, 1.3 The Sample Space, $\sigma$ -Field and Measure of the Joint Experiment

1.5 The Product Measure on $\mathbb{R}^2$