CARPE DIEM

今を生きる旅人大学生の記録・コラム。

台風半端ない中、ゴリゴリの大学数学の話をする

台風半端ないですね。

 

もともと富士山に登るつもりだったのですが、ツアーが中止になり、昨日と今日の予定がぽっかり空いてしまいました。

そのうえ、さっき吹いた突風で家の近くの電線が切れたっぽくて、Wi-Fiの接続も切れました。

 

家で下書きしたやつを、ローソンのカフェスペースで更新してます。笑

 

 

ですので、今日はいつも以上に図や説明をしっかりとした記事を書きたいと思います。

 

今日に限らず、編集が凝っていたり、写真でない図が載っていたり、動画が載っていたりするときは、『さかい今日ヒマなんやw』と思ってくれていいです。笑

 

 

 

ということで、台風の中で旅のバカ話するのもあれなので、数学の話をします。

 

意外にも、このブログ内で数学の記事が人気みたいで、トップ5の記事のうち、3つの記事が数学の記事なのです。

みんな、そんなに数学好きですか?笑

 

 

 

 

今日は、『統計的仮説検定』という話をしましょう。

 

 

みなさん、『ポテトチップス』というお菓子をご存知でしょうか?

ジャガイモを薄くスライスして、油で揚げて、味付けをしているお菓子です。

巷では、『ポテチ』と略して呼ぶ人が多いです。

 

 

あるポテチの内容量が、『200g』と記載されているとします。

 

 

でも、それって本当に『200.00…0g』ぴったりでしょうか?

 

おそらく違いますよね。

 

ジャガイモをスライスしているので、1枚1枚の大きさや重さは違います。

そうなると1袋あたりに入っている量も多少ながら誤差が出てくるはずです。

 

つまり、198gのものもあれば、203gのものもあると考えるのが普通でしょう。

 

内容量『200g』というのは、あくまで『平均が200g』という意味だということは納得できると思います。

 

 

では、どうやって、『平均200g』と出すことができるのでしょうか。

 

 

もちろん、世界中からその製品のポテチを全て回収して重さを量れば、答えは出ますが、現実的にできません。

はじめしゃちょーどころではない数のポテチの数になりますから。笑

 

 

メーカー側は、「(平均の)内容量は200g」と言っていますが、実はサバを読んでいるかもしれません。

本当は(平均の)内容量が195gしかないかもしれません。

 

 

さあ、どうしましょう。

 

もし、たまたまとった一つの袋が195gだったとして、メーカーに問い合わせたとしても、

「それは誤差の範囲っすわ。たまたま平均より低い製品を手にとってしまっただけ。ドンマイw」

と言われるでしょう。

 

 

では、どうすれば、『本当の平均値』が200gより小さいということを論理的に示すことができるのでしょうか。

 

 

 

ここで力を発揮するのが、統計の力です。

今回使うのは、『t-検定』。

 

具体的な数字ベースで考えてみましょう。

 

 

 

【考えることの確認】

ポテチの内容量が『(平均)200g』と記載されているが、これは実はメーカーがサバを読んでいて、本当の平均の内容量は200gより小さいのではないかと考える。

 

 

【データの例】

あるメーカーのポテチをランダムに15袋集めたら、内容量はそれぞれ以下の通りになった。

①201.6g ②192.6g ③197.4g ④189.1g ⑤190.8g ⑥195.2g ⑦196.2g ⑧195.2g ⑨183.7g ⑩207.2g ⑪195.7g ⑫206.4g ⑬200.5g ⑭203.5g ⑮197.3g

 

 

【実際に検定する】

検定の方法には、「z-検定」や「カイ自乗検定」など、いろいろな方法があるが、今回は「t-検定」を用いる。

(理由は、さかいでも何とか理解できるから。笑)

 

 

今から、『検定統計量』という値を導出する。

 

 

t-検定の検定統計量は、

{\frac{\sqrt{n}(\bar{X_n}-\mu)}{\sqrt{V_0}}}

である。(定義。なぜ?とかではなく、これはこういうもの。)

 

ただし、

{n=15}:集めたデータの数

{\bar{X_n}=\frac{1}{n}\sum_{i=1}^n X_i =196.83}:集めたデータの平均

{\mu=200}:メーカー側が主張している平均

{V_0=\frac{1}{n-1} \sum_{i=1}^n (X_i -\bar{X})^2=40.98}:集めたデータの不偏推定量(というものがあるんです)

である。

 

{\bar{X_n}}{\mu}はどちらも『平均』だが、それぞれが持つ意味は異なるので、混同しないでほしい。

集めたデータの平均や不偏推定量は、ゴリゴリ計算するだけで求まります。

 

 

よって、

{\frac{\sqrt{15}(196.83-200)}{\sqrt{40.98}}=-1.92}

となる。

 

 

ここで、有意水準αを5%(0.05)とする。(意味はあとで説明する)

 

 

t-分布の上側確率α-点は、

{t(n;\alpha)=t(15,0.05)=1.753}

この『1.753』という値は、nとαの値から自動的に決まるものです。ググるか、統計の教科書を調べると出てきます。

20-2. t分布表 | 統計学の時間 | 統計WEB

 

 

 

ここからの部分をきちんと説明すると難しくて、訳わかんなくなると思うので、結論に入っていきます。

 

 

さっき導出した-1.92からマイナスをとった、『1.92』の値が、ググって出した『1.753』を上回っていれば、仮説(平均が200gである)ということを、棄却(おかしいと主張)することができる。

 

今回は、

1.92>1.735

となるので、真の平均の値は200gより小さいと主張ができる。

 

つまり、メーカー側がサバを読んでいたということになる。

 

 

 

有意水準について】

『1.92>1.735』とは、いったい何を意味していのかを解説しよう。

 

この不等式が成立しているとき、

『本当の平均値が200gだと仮定すると、15個のデータが①~⑮のように集まる確率は5%以下ですよ』

ということを意味している。

 

 

つまり、『集めたデータが、たまたま平均より小さいデータが多かった』とは考えにくいということである。

 

 

先ほど、「有意水準αを5%とする」と言った「5%」とは、このことである。

 

 

5%を「たまたま」という人もいれば、そうでない人もいるだろう。

 

何%からを「たまたま」と言うかは、検定をする人(計算をする人)次第だというわけである。

実際に、αを10%にするときもあるし、0.5%にするときもある。

 

一般的には5%とするケースが多いが、時と場合によって変わってくるのだ。

 

例えば、検定するデータが薬など、人の生死にかかわる重大な検定の場合は、慎重に検定するため、有意水準をより低く設定するだろう。

 

 

ちなみに、今回のケースで有意水準を2.5%にすると、{t(n;\alpha)=t(15,0.025)=2.131}となり、

1.92>2.131

となってしまい、不等式が成立しない。

 

つまり、

『本当の平均値が200gだと仮定すると、15個のデータが①~⑮のように集まる確率は2.5%以下ですよ』

とは言えないということである。

 

 

 

【真実は神にしかわからない】

これは教科書にも書いていたが、『本当の平均値』というものは、誰にもわからない。

知ろうと思えば、世界中にあるすべてのポテチの内容量を量る必要があるからだ。

 

つまり、先ほどの検定で、「サバを読んでいる」という結果が出たとしても、「本当にサバを読んでいるか」どうかは、誰にもわからない。

 

「サバを読んでいる可能性が高い」というだけで、実は集めたデータの内容量がたまたま低かっただけかもしれない。

 

あくまで確率の高さとして、「サバを読んでいる」と結論づけたに過ぎない。

 

 

いくら有意水準を低く(つまり、厳しく判定)したとしても、『絶対正しい』結論は出てこないのである。

 

統計の世界とは、そういうものである。

物事を確率で考えている以上、『絶対』は存在しないのである。