11.【2014年度試験問題から】N神社の御手洗の水の硬度(ここではカルシウムとマグネシウムの合量の濃度で表示)x μmol/Lを、 K大学の優秀な3回生が毎年キレート滴定で測っている。 2010年度は14件が、2014年度は19件の測定値が得られ(外れ値outlierは省いてある)、 2010年の x の標本平均は 276 で標本標準偏差18、2014年の標本平均は 246 で標本標準偏差 23 であったという。 このデータを解析した U 君の次の文章を読み、問いに答えよ。
10年度と 14年度の標本分散を用いて、σ2 は s2 = (13×182 + 18×232)/31 で推定できる。 10年度の標本平均の分散は ハ σ2、 14年度の標本平均の分散は ニ σ2である。 さて 10年度と 14年度の測定値の平均が等しいものとすれば、10年度と14年度の標本平均の差の2乗を ホ σ2 で割ったものは、 自由度 1 の χ 2 分布に従う。 一方 ヘ s2/σ2は自由度 ト のχ2 分布に従うと考えられる。 つまり標本平均の差の2乗 (246 - 276)2 を チ s2で割ったものは、 自由度が (φ1, φ2) = ( リ , ヌ )のF分布に従う。 F( リ , ヌ ; 0.05) = 4.2なので、有意水準 5 %で標本平均が等しいと {A: 見なせない、見なせる}。 つまり 10年度と 14年度で、採水したN神社の水の硬度に変化があったと {B: 考えられない、考えられる}。
11-1. 文中のイ~ヌに当てはまる適切な数値・数式を記し、{ A }、{ B }については適切な語を選べ。
11-2. U君はF分布を用いて10年度と14年度の測定値の平均値が同じかどうかを検定したが、 t分布を用いることもできる。 測定値の平均が等しいとすれば、標本平均の差 246 - 276 を ホ 1/2 s で割ったものは自由度 ヌ の t分布に従うことを説明せよ。
N 個のデータの残差2乗和を分散 σ2 で割ったものは、
自由度 N - 1 の χ2 分布に従う。
標本分散は残差2乗和を N - 1で割ったものなので、標本分散を σ2 で割ったものは、
χ2変数をその自由度で割ったものに相当する。
分散が等しいと仮定すれば(帰無仮説)、14 年度と10 年度の標本分散の比は、自由度 (19 -1, 14 - 1) = (18, 13) の F 分布に従うと見なせる。
【イ、ロ】
分散 σ2 のN 個のデータの標本平均の分散は、 σ2/N になる。
10年度の標本平均の分散は (1/14) σ2、14年度は (1/19) σ2。
【ハ、ニ】
10年度と14年度の標本平均は独立なので、その分散は両者の分散の和で [(1/14) + (1/19)] σ2。
平均が等しいものとすれば、標本平均の差の2乗をその分散で割ったものは、自由度 1 の χ2 分布にしたがう。
【ホ】
推定した標本平均の分散 s2 を σ2 で割ったものは、
自由度 18 + 13 = 31 の χ2 変数を、(18 + 13) = 31 で割ったものになっている。
【ヘ、ト】
したがって標本平均の差の2乗を [(1/14) + (1/19)] s2 で割ったものは、
自由度 (1, 31) の F 分布に従う。
【チ、リ、ヌ】
(246 - 276)2/{ [(1/14) + (1/19)] s2} = 16.1 で、
これはF( リ , ヌ ; 0.05) = 4.2 より大きく、
平均が等しいという仮説は、有意水準 5 %で棄却される。。
{A: 見なせない} {B: 考えられる}
31 s2/σ2 は自由度31の χ2分布に従う。 平均が等しいとすれば標本平均の差は平均0、分散[(1/14) + (1/19)] σ2 の正規分布に従う。
したがって
\[ z = \frac{246 - 276}{\sqrt{[(1/14) + (1/19)] \sigma^2} \sqrt{s^2/\sigma^2}} = \frac{246 - 276}{\sqrt{(1/14) + (1/19)}~ s} \]
は自由度31のt-分布に従う。