「標本平均」と「その標本での平均」
標本平均は,標本を作るという試行において,各事象(標本)に,その標本での平均値を対応させる確率変数.
実際に作ると,「その標本での平均」という標本平均の実現値が得られる.
サイコロを投げる試行で,出目は確率変数.
本当に投げて出る目は,実現値.— 吉田信夫(お茶ゼミルータス・数学科、【大学への数学】などで執筆してます) (@Nobuo183052) 2023年8月15日
「確率変数」は「確率分布」を考える対象であるが,「確率変数」を構成するには,「確率」が必要で,そのためには「事象」が必要で,そもそも「試行」を定めないと,始まらない.
その感覚がないと,この違いは分かりにくいようだ.
「標本平均」は1つのまとまった言葉で,それは,「標本を作る試行において,各事象(標本)に,その平均を対応させるルール」の略である,と思えばよい.
数ある標本の作り方の中で,具体的に一つの標本を作ると,「標本平均」の実現値としての「その標本の平均値」が定まる.サイコロを実際に振ったら,出る目(確率変数「出目」の実現値)が定まるのと同様である.
***
実践編として,確率論とデータの分析の違い,および,信頼区間の正しい解釈も少し.
標本平均(と呼ばれる確率変数)の期待値と分散を考えるのは,確率論の話.
⇓
標本平均の期待値は,母平均(未知であっても,あくまで定数)と一致する.
⇓
標本平均の理論をもとに,信頼区間を作ることができる.
⇓
95%信頼区間の両端にあるものも,確率変数!
(その区間に母平均が入るかどうかは,命題ではなく,条件に相当する.成り立つか,成り立たないか,が論点ではなく,成り立つのがどういうときか,を考えるもの)
具体的な標本において,平均値を求めるのは,標本平均の実現値を求めること(データの分析における平均,「その標本での平均値」).
⇓
「その標本での平均値」を母平均の推定値として,信頼区間というものを考えるのだが・・・
それは,上記の「両端が確率変数である状態の信頼区間」に「その標本での平均値」を代入することをいい,「その標本での信頼区間」とでもいうべきものが得られる.
➤「その信頼区間に母平均が含まれる確率が95%」という意味ではない!!
だって,母平均は定数なのだから.
「その標本での信頼区間」に母平均が含まれるかどうかは,確定する(命題!)
⇓
標本をたくさん(例えば100個)作ったら,「その標本での信頼区間」もたくさん(100個)できる.
それらの中で,母平均を含むものが,総数の95%である(95個)ということである.
つまり・・・
・「両端が確率変数である状態の信頼区間に,母平均が含まれる」は,「条件」
・具体的な標本を代入すると,「両端が定数になった区間になって,そこに母平均が含まれる」は,「命題」
・たくさんある具体的な標本たちのうち,代入して「真」になるものは,全体の95%である.
推定量(確率変数)
と
推定値(実現した値)
の違いが分かりにくさの原因なのですよね.
両端を確率変数とする信頼区間
と
実現値を代入した信頼区間
にも,(あまり述べられないけれど)大きな違いがあるのだと思います.