【ピーマン分類法】
共通テストで目を引いた【ピーマン分類法】.
統計は,もうすぐ必須になるにも関わらず,多くの先生方が学習を避けている分野です.
拙著などどうですか?
☟
本当は,それよりもこっちの方が断然オススメです.
☟
ピーマンを通じて,統計を少し身近に感じてもらいたく,解説してみようと思います.
大量のピーマンがあります.
重さの平均は30.0g,標準偏差は3.6です.
これらのイメージは,正規分布に従っていると仮定すれば
全体の68%が30-3.6~30+3.6に含まれる
を主要イメージとして,
全体の38%が30-1.8~30+1.8に含まれる
全体の95%が30-7.2~30+7.2に含まれる
という感じです.
個数が十分多いと,正規分布に近似的に従うことが知られています(中心極限定理という)ので,よっぽど偏りのある分布でない限り,だいたい当たります.
このイメージを利用したら偏差値の意味も分かってきます・
上記の重さを偏差値で表すと,1つ目が40~60,2つ目が45~55,3つ目が30~70です.
偏差値70以上と言うのは,その母集団において上位2.5%くらいというイメージです.
また,偏差値45~55が全体の約1/3なので,45以下,および,55以上もだいたい全体の1/3です.集団を3分割する基準はこのようになっています.だから,入試倍率が3倍であれば,合格するのに全体の上位1/3に入る必要があり,それは,受験者全体を母集団としたときに偏差値55を目指すことに相当します.意外と低いことに驚きます.
さて,大量のピーマンから無作為に2個選んで袋に詰めて,販売します.
公平性のために,1袋ずつの重さの分散を小さくしなければなりません.
そこで考えたのが【ピーマン分類法】です.
【ピーマン分類法】***
無作為に抽出したいくつかのピーマンについて,重さが30.0g以下のときをSサイズ,30.0gを超えるときはLサイズと分類する.そして,分類されたピーマンからSサイズとLサイズのピーマンを一つずつ選び,ピーマン2個を1組とした袋を作る.
***
25袋作りたいとします.
何個のピーマンを無作為に抽出しましょうか?
無駄なく50個ではどうでしょう?
S,Lがちょうど25個ずつになっていたら,そのときに限り,25袋を作ることができます.
そうなる確率は・・・
(50,25)/2^50
ここで,(50,25)は50個から25個を選ぶ選び方の個数(組合せの記号 C で表すもの)です.
これを計算すると,0.1122……であり,11%です.
意外と高確率である気もしますが,9割ほどの確率で再抽出する必要があって,逆に無駄ですね.
では,何個選べば,25袋作れる確率を95%以上にできるでしょう?
上記の通り,標準偏差2つ分を両サイドにとれば,約95%です.正確には
平均±1.96×標準偏差
です(正規分布表より).
でも,計算の手間を減らすために,
平均±2×標準偏差
で考えることにします.
50+k個選ぶことにします.
Sサイズ,Lサイズのピーマンがともに25個以上含まれる確率を考えます.
「二項分布の性質」と「正規分布での近似可能性」と「標準正規分布への変換」を利用します(ここが,統計として理論を学ぶべきところ).
Lサイズが25個以上とは,
S+L=50+k
だから,Sサイズが50+k-25=25+k個以下であると言い換えられます.
Sサイズが25個以上25+k個以下になる確率を考えます.
「二項分布の性質」から,Sサイズの個数の平均が(50+k)/2で,標準偏差が√(50+k)/2と分かります.
同じ分布の「正規分布での近似が可能」なので,
Y={(Sサイズの個数)-(平均)}/(標準偏差)
が「標準正規分布」になります.
<補足>
標準正規分布とは,平均が0で,標準偏差が1の正規分布ですから,
平均±2×標準偏差
というのがすごく分かりやすいです.
-2以上2以下ということです.
その範囲に対応する確率を,正規分布の表を用いて求めると.約0.95になっています.
25≦(Sサイズの個数)≦25+k
は,Yの範囲として
-k/√(50+k)≦Y≦k/√(50+k)
と書けるので,これが95%の範囲
-2≦Y≦2
を含んでいれば良いことになります.
求めるkの条件は,
k/√(50+k)≧2
であり,少し計算すると,k≧17と分かります.
50+17=67
67個選べば,95%以上の確率で25袋を作ることができます.
なお,ここの計算では,
k/√(50+k)≧2
の両辺を2乗して得られる2次不等式を考えます.
それを解くと√51が現れるので,7.14という近似値が与えられています.
しかし,整数値を考えるだけなので,
k^2≧4k+200
にいくらか代入すればOKです.14^2=196ですが,4kの分だけもっと大きくすべきで,k=16で不成立,k=17で成立することがわかります.
こういう感覚は,共通テスト全般で求められています.