このファイルは、2年春学期科目「工学のための確率と統計」の授業において、口頭で説明する内容をテキスト(.txt)に書き起こしたものです。 事前に科目のHPにアクセスして「講義ノート」の PDF ファイルをダウンロードし、印刷しておいてください。講義ノート中には、わざと空白にしてある部分があり、このテキストに従ってそれらを埋めていってください。特に重要な部分を手書きすることによって記憶を強化するねらいがあります。 講義ノートの行間に、テキストの説明を書きこんで行くことをお勧めします。最後にプリントを綴じれば、将来必要になったときに見返せる自分の「講義ノート」ができあがります。 同じ場所に「宿題」を提示します。「学生用ページ」「レポート提出システム」 から、その日のレポートを提出してください。 〆切は 次回授業日前日の 23:59 です。 _/_/_/ 第六回 いろいろな確率分布 (2) _/_/_/ 前回に引き続き、大学で確率・統計を勉強した学生が「習ってません」では許してもらえない、必須の確率分布を紹介していきたいと思います。 さて、二項分布は、ある事象が「生起するかしないか」という2者択一の分布なので、非常に応用範囲が広いのですが、分布の形状を決めるパラメータが n と p の2つあって、その組み合わせによって千差万別の分布形状を取りうるという面倒さがありました。 そこで、特定の条件の下で、二項分布を別の分布で近似することが考案されました。 試行回数 n と事象の確率 p の積 λ を用いて、λ が小さい (<10) とき 二項分布を「ポアソン分布」で近似 (n→∞) することができます。 今回は、λ が大きいときです。λ が大きいとき、 二項分布を「正規分布」で近似 (n→∞)することができます。 【講義ノート】正規分布 連続量 x を確率変数とする「正規分布」N(μ, σ^2) は次式のように定義されます。 複雑な式を書き間違ってはいけないので、空白にせずノート中に数式を記述していますが、本来これは自分で「書いて」覚えるべき定義式です。 f(x) = ... 「μ」ギリシャ小文字で「ミュー」と読みます。 「σ」ギリシャ小文字で「シグマ」と読みます。 「σ^2」は「σ二乗」「シグマスクエア」と読みます。 正規分布って名前ですが、何が「正規」なのか悩みますね。実は、英語の「normal distribution」を日本語に直訳しただけです。ほんとうは「普通によくある分布」くらいの意味です。数学者ガウス先生の名前から「ガウス分布」と呼ぶことも多いです。 正規分布の確率変数は x です。連続型の分布であることに注意しましょう。 正規分布は μ と σ^2 の値が与えられると、分布の形状が一意に決定できます。 分布の形状を決定するパラメータ μ,σ^2 を明示して、正規分布を N(μ,σ^2) と表記することがあります。「N」は「Normal」からきてます。 パラメータ「σ^2」は「σ」の2乗というわけではなくて、「σ^2」自体がパラメータです。このように表記されるパラメータは、負の値をとりません。 式中の「σ」の値は「σ^2」の平方根です。 正規分布の定義式は記憶しておきましょう。 【講義ノート】正規分布の概形(その1) まず、正規分布の定義式の右辺、指数部分の括弧内に注目します。 (x - μ)^2 y = - ----------- 2 σ^2 この式は x についての 2次関数になっており、x = μ において最大値 0 をとります。 また、x → ±∞ で y → - ∞ 。 講義ノート中に、この関数を作図してみましょう。 【講義ノート】正規分布の概形(その2) 指数関数「exp()」ってどんな形の関数だったでしょうか。 WWW等で調べて、概形を作図しておきましょう。 【講義ノート】正規分布の概形(その3) この関数に、前ページの括弧の中の式を入力すると、 x = μ において最大値をとるのは同じ。 x → ±∞ で y → - ∞ 。指数関数は → - ∞ で、0 に漸近していきます。 講義ノート中に、この関数を作図してみましょう。 分布の形状を決めるパラメータは μ と σ^2 の2つです。 「μ」を平均、「σ^2」を分散、と呼びます。 【講義ノート】正規分布する統計量 ・二項分布において、  多数回の試行 n → ∞ が可能で、  λ(= n p) が大きい場合 その分布を正規分布で近似することができます。 これは後で勉強する「中心極限定理」とも関係してきます。 ・各種測定値の分布は正規分布します。   物理現象、天文現象、生体計測   測定値の誤差の分布 【講義ノート】χ^2-分布 「χ」ギリシャ小文字で「カイ」と読みます。「x」と紛らわしいので注意。 「カイ二乗分布」 f_n(χ^2) (kai square distribution) n を自由度という 連続量 χ^2 を確率変数とする「カイ二乗分布」f_n(χ^2) は次式のように定義されます。 f_n (χ^2) = ... 複雑な式を書き間違ってはいけないので、空白にせずノート中に数式を記述しています。 この式は記憶する必要はありません。というか無理です。必要が生じたらノートを見るなり、WWWで調べましょう。大事なのはむしろ、 カイ二乗分布の確率変数は χ^2 だということです。連続型の分布であることに注意しましょう。 カイ二乗分布は n の値が与えられると、分布の形状が一意に決定できます。この n を、カイ二乗分布の自由度といいます。 【講義ノート】ガンマ関数 式中に「Γ()」という関数が現れます。この関数について述べておきましょう。 「Γ」はギリシャ大文字で「ガンマ」と読みます。 ガンマ関数 Γ(p) の定義式は、ノートに記述してある通りです。この式を記憶する必要はありません。その代わり、ガンマ関数の次の性質には注目しておきましょう。 Γ(p+1) = p Γ(p) Γ(1) = 1 Γ(1/2) = sqrt(π) 皆さん、階乗という概念を思い出してください。n の階乗とは、 n! = n × (n-1) × ... × 1 n! = n × (n-1)! どこかガンマ関数と似ていないでしょうか? 実は、ガンマ関数は階乗の一般化となっており、n が正の整数であれば、 Γ(n+1) = n! が成立します。 前のページに戻ります。 【講義ノート】χ^2-分布 (再掲) もう一度、カイ二乗分布の定義式を見てみましょう。 確率変数「χ^2」はどこにありますか? (χ^2)^{(n/2)-1} と e^{- (χ^2)/2} の 2箇所です。 その前に付いている、ガンマ関数を含む複雑な係数には、確率変数「χ^2」が含まれていない。すなわちこの係数は確率変数に依存しない「定数」に過ぎないのです。 この複雑な係数は、実は確率分布を全区間で積分して 1 にするための正規化係数です。はじめ見たときはびっくりしますが、ただの定数だと思えば怖くありません。意味をしっかり捉えおきましょう。 【講義ノート】χ^2-分布の概形 「カイ二乗分布」f_n (χ^2) (kai square distribution) カイ二乗分布の分布の形状を決定するパラメータは、自由度 n です。 いろいろな n に対して、カイ二乗分布がどのような形状になるかを見ておきましょう。 n=1 (赤), n=2 (緑), n=3 (青), n=4 (紫), n=5 (黒) n が大きくなるにつれ、頂点が右にずれ、また滑らかになっていくことが分かります。 【講義ノート】χ^2-分布する統計量 確率変数 X が正規分布 N(0,1) に従うとき、 確率変数 X^2 は χ^2-分布 f_1(χ^2)に従う。 正規母集団 N(μ,σ^2) から独立に抽出された n 個の標本 X_1, X_2, …,X_n に ついて、合成確率変数 (1/σ^2) Σ (X_i - μ)^2 i は、 χ^2-分布 f_n(χ^2)に従う。 さて、2 回に亘っていろいろな確率分布を見てきました、一様分布、二項分布、ポワソン分布、正規分布、カイ二乗分布。 この授業で、皆さんに知っておいてほしい確率分布は他にもまだあります。しかし、それらを勉強するためには、ちょっと準備が必要です。 ところで、この授業は「確率・統計」というタイトルです。これまでずっと確率の話をしてきました。いよいよ統計の話を始めたいと思います。 次回より3回かけて「統計的計算手法」について説明していきます。そのうち、確率も統計も実は同じ世界の概念であることが分かってきます。 一通り統計の話をした後で、また確率分布の話に戻ってきたいと思います。今日勉強したカイ二乗分布の意味がよくわかるようになります。また、統計分野で極めて重要な「分散分析」のベースとなる、エフ分布について学びます。 --