yoshidanobuo’s diaryー高校数学の“思考・判断・表現力”を磨こう!ー

「大学への数学」執筆者・吉田信夫の数学探求ブログ(共通テスト系問題の研究報告)

【ピーマン分類法】 2023共通テストより

【ピーマン分類法】

共通テストで目を引いた【ピーマン分類法】.
統計は,もうすぐ必須になるにも関わらず,多くの先生方が学習を避けている分野です.
拙著などどうですか?
    ☟
 
本当は,それよりもこっちの方が断然オススメです.
    ☟
 

ピーマンを通じて,統計を少し身近に感じてもらいたく,解説してみようと思います.


大量のピーマンがあります.
重さの平均は30.0g,標準偏差は3.6です.
これらのイメージは,正規分布に従っていると仮定すれば

 全体の68%が30-3.6~30+3.6に含まれる

を主要イメージとして,

 全体の38%が30-1.8~30+1.8に含まれる
 全体の95%が30-7.2~30+7.2に含まれる

という感じです.
個数が十分多いと,正規分布に近似的に従うことが知られています(中心極限定理という)ので,よっぽど偏りのある分布でない限り,だいたい当たります.
このイメージを利用したら偏差値の意味も分かってきます・

上記の重さを偏差値で表すと,1つ目が40~60,2つ目が45~55,3つ目が30~70です.
偏差値70以上と言うのは,その母集団において上位2.5%くらいというイメージです.
また,偏差値45~55が全体の約1/3なので,45以下,および,55以上もだいたい全体の1/3です.集団を3分割する基準はこのようになっています.だから,入試倍率が3倍であれば,合格するのに全体の上位1/3に入る必要があり,それは,受験者全体を母集団としたときに偏差値55を目指すことに相当します.意外と低いことに驚きます.


さて,大量のピーマンから無作為に2個選んで袋に詰めて,販売します.
公平性のために,1袋ずつの重さの分散を小さくしなければなりません.
そこで考えたのが【ピーマン分類法】です.


【ピーマン分類法】***

無作為に抽出したいくつかのピーマンについて,重さが30.0g以下のときをSサイズ,30.0gを超えるときはLサイズと分類する.そして,分類されたピーマンからSサイズとLサイズのピーマンを一つずつ選び,ピーマン2個を1組とした袋を作る.

***


25袋作りたいとします.

何個のピーマンを無作為に抽出しましょうか?


無駄なく50個ではどうでしょう?
S,Lがちょうど25個ずつになっていたら,そのときに限り,25袋を作ることができます.
そうなる確率は・・・
 (50,25)/2^50
ここで,(50,25)は50個から25個を選ぶ選び方の個数(組合せの記号 C で表すもの)です.
これを計算すると,0.1122……であり,11%です.


意外と高確率である気もしますが,9割ほどの確率で再抽出する必要があって,逆に無駄ですね.


では,何個選べば,25袋作れる確率を95%以上にできるでしょう?

上記の通り,標準偏差2つ分を両サイドにとれば,約95%です.正確には
 平均±1.96×標準偏差
です(正規分布表より).
でも,計算の手間を減らすために,
 平均±2×標準偏差
で考えることにします.


50+k個選ぶことにします.
Sサイズ,Lサイズのピーマンがともに25個以上含まれる確率を考えます.
「二項分布の性質」と「正規分布での近似可能性」と「標準正規分布への変換」を利用します(ここが,統計として理論を学ぶべきところ).


Lサイズが25個以上とは,
  S+L=50+k
だから,Sサイズが50+k-25=25+k個以下であると言い換えられます.
Sサイズが25個以上25+k個以下になる確率を考えます.
「二項分布の性質」から,Sサイズの個数の平均が(50+k)/2で,標準偏差が√(50+k)/2と分かります.
同じ分布の「正規分布での近似が可能」なので,
 Y={(Sサイズの個数)-(平均)}/(標準偏差)
が「標準正規分布」になります.


<補足>
標準正規分布とは,平均が0で,標準偏差が1の正規分布ですから,
 平均±2×標準偏差
というのがすごく分かりやすいです.
-2以上2以下ということです.
その範囲に対応する確率を,正規分布の表を用いて求めると.約0.95になっています.


 25≦(Sサイズの個数)≦25+k
は,Yの範囲として
 -k/√(50+k)≦Y≦k/√(50+k)
と書けるので,これが95%の範囲
 -2≦Y≦2
を含んでいれば良いことになります.

求めるkの条件は,
 k/√(50+k)≧2
であり,少し計算すると,k≧17と分かります.
 50+17=67
67個選べば,95%以上の確率で25袋を作ることができます.


なお,ここの計算では,
 k/√(50+k)≧2
の両辺を2乗して得られる2次不等式を考えます.
それを解くと√51が現れるので,7.14という近似値が与えられています.
しかし,整数値を考えるだけなので,
 k^2≧4k+200
にいくらか代入すればOKです.14^2=196ですが,4kの分だけもっと大きくすべきで,k=16で不成立,k=17で成立することがわかります.

こういう感覚は,共通テスト全般で求められています.