yoshidanobuo’s diaryー高校数学の“思考・判断・表現力”を磨こう!ー

「大学への数学」執筆者・吉田信夫の数学探求ブログ(共通テスト系問題の研究報告)

「標本平均」と「その標本での平均」の違いが分かりにくい

「確率変数」は「確率分布」を考える対象であるが,「確率変数」を構成するには,「確率」が必要で,そのためには「事象」が必要で,そもそも「試行」を定めないと,始まらない.
その感覚がないと,この違いは分かりにくいようだ.

「標本平均」は1つのまとまった言葉で,それは,「標本を作る試行において,各事象(標本)に,その平均を対応させるルール」の略である,と思えばよい.
数ある標本の作り方の中で,具体的に一つの標本を作ると,「標本平均」の実現値としての「その標本の平均値」が定まる.サイコロを実際に振ったら,出る目(確率変数「出目」の実現値)が定まるのと同様である.
***
実践編として,確率論とデータの分析の違い,および,信頼区間の正しい解釈も少し.
標本平均(と呼ばれる確率変数)の期待値と分散を考えるのは,確率論の話.
  ⇓
標本平均の期待値は,母平均(未知であっても,あくまで定数)と一致する.
  ⇓
標本平均の理論をもとに,信頼区間を作ることができる.
  ⇓
95%信頼区間の両端にあるものも,確率変数!
(その区間に母平均が入るかどうかは,命題ではなく,条件に相当する.成り立つか,成り立たないか,が論点ではなく,成り立つのがどういうときか,を考えるもの)

具体的な標本において,平均値を求めるのは,標本平均の実現値を求めること(データの分析における平均,「その標本での平均値」).
  ⇓
「その標本での平均値」を母平均の推定値として,信頼区間というものを考えるのだが・・・
それは,上記の「両端が確率変数である状態の信頼区間」に「その標本での平均値」を代入することをいい,「その標本での信頼区間」とでもいうべきものが得られる.
➤「その信頼区間に母平均が含まれる確率が95%」という意味ではない!!
 だって,母平均は定数なのだから.
 「その標本での信頼区間」に母平均が含まれるかどうかは,確定する(命題!)
  ⇓
標本をたくさん(例えば100個)作ったら,「その標本での信頼区間」もたくさん(100個)できる.
それらの中で,母平均を含むものが,総数の95%である(95個)ということである.

つまり・・・
・「両端が確率変数である状態の信頼区間に,母平均が含まれる」は,「条件」
・具体的な標本を代入すると,「両端が定数になった区間になって,そこに母平均が含まれる」は,「命題」
・たくさんある具体的な標本たちのうち,代入して「真」になるものは,全体の95%である.


 推定量(確率変数)

 推定値(実現した値)
の違いが分かりにくさの原因なのですよね.

 両端を確率変数とする信頼区間

 実現値を代入した信頼区間
にも,(あまり述べられないけれど)大きな違いがあるのだと思います.