このファイルは、2年春学期科目「工学のための確率と統計」の授業において、口頭で説明する内容をテキスト(.txt)に書き起こしたものです。 事前に科目のHPにアクセスして「講義ノート」の PDF ファイルをダウンロードし、印刷しておいてください。講義ノート中には、わざと空白にしてある部分があり、このテキストに従ってそれらを埋めていってください。特に重要な部分を手書きすることによって記憶を強化するねらいがあります。 講義ノートの行間に、テキストの説明を書きこんで行くことをお勧めします。最後にプリントを綴じれば、将来必要になったときに見返せる自分の「講義ノート」ができあがります。 同じ場所に「宿題」を提示します。「学生用ページ」「レポート提出システム」 から、その日のレポートを提出してください。 〆切は 次回授業日前日の 23:59 です。 _/_/_/ 第十回 いろいろな確率分布 (3) _/_/_/ 【講義ノート】χ^2-分布 (再掲) 「カイ二乗分布」 f_n(χ^2) (kai square distribution) n を自由度という。 連続量 χ^2 を確率変数とする「カイ二乗分布」f_n(χ^2) は次式のように定義されます。 f_n (χ^2) = ... カイ二乗分布の確率変数は χ^2 。連続型。 分布の形状を決定するパラメータ n を「自由度」という。 【講義ノート】χ^2-分布する統計量 (再掲) 確率変数 X が正規分布 N(0,1) に従うとき、確率変数 X^2 は χ^2-分布 f_1(χ^2)に従う。 正規母集団 N(μ,σ^2) から独立に抽出された n 個の標本 X_1, X_2, …,X_n に ついて、合成確率変数 (1/σ^2) Σ (X_i - μ)^2 i は、 χ^2-分布 f_n(χ^2)に従う。 【講義ノート】χ^2-分布する統計量 (2) ここまでは、復習でした。本日はχ^2-分布する統計量としてさらに、統計の話と関連付けます。 正規母集団 N(μ,σ^2) から独立に抽出された n 個の標本 X_1, X_2, …,X_n について、その標本平均を X~ (Xの上に横棒) とするとき、 「不偏分散」 1 n U^2 = ----- 煤@(X_i - X~)^2 n-1 i=1 はχ^2-分布 f_{n-1}(χ^2)に従う。 標本分散の一種ですが、1/n でなく、1/(n-1) になっています。これを「不偏分散」といいます。ノートの空欄を埋めておいてください。 不偏分散は確率変数として、自由度 n-1 のχ^2-分布に従います。ノートの(?)を埋めておきましょう。 実は、1/n で計算する標本分散の期待値は、母分散と一致しません。ちょっと偏ってしまいます。 1/(n-1) で計算する不偏分散の期待値は母分散と一致します。これは何故かというと、分散を計算するとき母平均が分からないので、代わりに標本平均を使うわけですが、そのためデータ n 個が一次従属になり、自由度が 1 個減るためです。 「分散」の確率分布はχ^2-分布になる、と覚えておきましょう。 【講義ノート】F-分布 χ^2-分布の次は「F-分布」(F-distribution) です。 先に言っておくと、F-分布は「分散比」の確率分布です。また、後述する「仮説検定」の一種である「分散分析」によく用いられます。 連続量 F を確率変数とする「エフ分布」f_{m,n}(F) は次式のように定義されます。 f_{m,n}(F)= ... 複雑な式を書き間違ってはいけないので、空白にせずノート中に数式を記述しています。 とはいえ、この式は記憶する必要はありません。必要が生じたらノートを見るなり、WWWで調べましょう。 Γ() はガンマ関数です。χ^2-分布のときに出てきましたね。階乗を連続量に一般化した関数です。思い出しましょう。 F-分布の確率変数は F です。連続型です。 定義式の前半には F が現れません。もう想像できますね。積分して 1 になるための正規化係数です。ガンマ関数が4つもありますが、恐れてはいけません。ただの定数です。 F-分布は m, n の値が与えられると、分布の形状が一意に決定できます。この m, n を、F-分布の自由度対といいます。 ノートの空白部分を埋めておきましょう。 「エフ分布」 f_{m,n}(F) (F-distribution) 確率変数は F 、連続型。 m, n は自然数。自由度対という。分布の形状を定めるパラメータ。 【講義ノート】F-分布する統計量 「^」は上付き添字、「_」は下付き添字を表すものとします。 確率変数 X_1 がχ^2-分布 f_m(χ^2)に従い、 確率変数 X_2 がχ^2-分布 f_n(χ^2)に従うとき、 確率変数 X_1 ----- m F= ------- X_2 ----- n は自由度対 [m , n] の F-分布 に従います。空白を埋めておいてください。 次のページが大事。 【講義ノート】F-分布する統計量 (2) 正規母集団 N(μ_1,σ^2_1), N(μ_2,σ^2_2)から独立に抽出された、 大きさ n_1, n_2 個の標本に対する「不偏分散」を U^2_1, U^2_2 と するとき U^2_1 ------- σ^2_1 F= --------- U^_2_2 ------- σ^2_2 は自由度対 [n_1 - 1, n_2 - 1] の F-分布 に従います。 要するに、2つの不偏分散の比、 「分散比」の確率分布は F-分布になる、ということです。 【講義ノート】ケーススタディ(分散比) 分散比の計算を実例で見ていきましょう。 自動車の燃費です。ある新型車種が発売されました。自動車の雑誌各社は新型車の燃費を記事にしたいと思っています。新型車「車種A」の試走車を何とか5台確保しました。 車種A 5台の燃費測定値(X_j^(A)) 18.0 18.2 15.3 17.5 17.3 となりました。燃費の単位は (km/l) とします。一リットルのガソリンで何 km 走れるかです。この表記では大きいほうが燃費が良い。 比較のため、旧型車「車種B」をテスト用に10台確保しました。新型じゃないので台数確保が容易だった。 車種B 10台の燃費測定値(X_j^(B)) 13.4 10.4 17.8 16.3 16.4 14.9 16.4 17.7 21.5 15.3 さて、両車種の燃費に差があるか? 【講義ノート】ケーススタディ(分散比)(2) 車種A、B、および全体の平均燃費を計算します。 1 5 X~^(A)= --- 煤@X_j^(A) = 17.26 5 j=1 1 10 X~^(B)= ---- 煤@X_j^(B) = 16.01 10 j=1 1 n^(i) X~= ---- 煤@ 煤@ X_j^(i) = 16.426 … 15 i=A,B j=1 【講義ノート】ケーススタディ(分散比)(3) これらの平均をもとに、次のような量を計算します。 級間平方和、異なる車種間の燃費のばらつきに関係。 s^2_{between} = … = 5.208 … 級内平方和、同一車種内での燃費のばらつきに関係。 s^2_{within} = … = 81.94 … 【講義ノート】ケーススタディ(分散比)(4) 「標本数-1」で割って不偏分散にします。 級間(不偏)分散 U^2_b = s^2_{between} / 1 = 5.028 … 級内(不偏)分散 U^2_w = s^2_{within} / 煤@(n^(i) - 1) = 6.303 … i=A,B 【講義ノート】ケーススタディ(分散比)(5) 不偏分散比を計算する。 U^2_b ------- = 0.826 U^2_w これで、車種Aと車種Bの燃費の違いを評価するための量が計算できました。 この値が大きいほど、燃費の違いが大きいことを表しています。 さて、2クラスの不偏分散比は自由度対 [ 1, 煤@(n^(i) - 1) ] i=A,B            の F-分布に従います。 次回は、確率分布を用いて、判定したい事柄の「白黒」をはっきりいうための 「検定」(統計的仮説検定)の話をしたいと思います。 --