統計学で出したグラフデータ
0

推測統計とは、統計学の母集団と標本の解説

推測統計とは、母集団から取り出した標本から、母集団の性質を推測する統計学です。
一番身近な応用例としてテレビの視聴率があります。

ある番組の視聴率が20%であったと聞けば、
「日本人の20%、つまり5人に1人がその番組を見ていた」
とおおよその人は考えるでしょう。
ですが、テレビの視聴率は、日本人全員に
「どの番組を見ましたか?」
とたずねて出された数字ではなく、日本人のうちのごく一部、おおよそ500世帯が見ていた割合を示しているのです。
つまり、日本人全体(母集団)のうちある番組を見ていた割合を知りたいがために、日本人のごく一部の人(標本)を対象に調査し、得られたデータから日本人全体の様子(母集団の性質)を推測しているのです。
これが推測統計の基本です。


ただし、視聴率のような例は、点推定と呼ばれる手法で、最も単純な推測統計です。

看護研究でよく行われる調査研究もこの方法を用いている場合が多いといいます。

母集団と標本

母集団とは、調査の対象となるすべてを含む集団のことです。
前述した視聴率の場合には母集団はその番組を見る可能性のあるすべての人々です。
少し視点を変えてみると、母集団はもっと小さい集団であってもいいのです。
たとえば、ある学校のあるクラスの性質に興味がある場合には、母集団はそのクラス全体になります。

これに対して、母集団から取り出した母集団の一部を標本といいます。
一億人の中から100万人を取り出しても標本で、100人を取り出しても標本です。

そして、前述したとおり、推測統計とは、母集団から取り出した標本から、母集団の性質を推測する統計学のことです。
ですので、推測統計を理解するには母集団と標本を理解していないといけません。


「母集団の性質を知りたいのであれば、なぜ標本を取り出す必要があるのだろうか、母集団を調べればいいのに」
と考える人もいるかもしれません。
ですが、一般的に下記のような理由から母集団全体を調査することが不可能であったり困難であったりします。


①時間的な問題

インフルエンザの流行について考えてみます。
そのシーズンに流行しそうなインフルエンザの種類を、初冬までに調査しなければワクチンの製造が間に合わないとします。
このようなとき、母集団全体を調査していたのでは、多くの時間を必要とし、流行の時間が終わってしまい、調査が無意味なものになってしまいます。


①金銭的な問題

母集団全体を調査するためには時間がかかることは言うまでもないですが、時間がかかるということは多くの調査費用も必要となります。
どんな研究であれ調査であれ、そのための予算がありそれを超えることはできません。
金銭的な問題は、全数調査を実施できない大きな要因と言えます。


①人的な問題

全数調査をするためには、データの収集や解析に多くの人員を必要とします。
国勢調査など国策として行われる調査を除き、一般的には調査のために動員できる人員は限られています。


これらの理由によって、母集団全体を調べることはあまり行われないのです。
そこで、母集団全体を調べていないのに、標本から母集団の性質を正しく知ることができるのだろうか、という疑問が出てくると思います。
もちろん、全体を調べていないので100%正しい性質を知ることはできません。
しかしながら、標本でもよい予測はでき、推測統計を正しく用いることで全数調査よりも正しい予測をすることも可能なことがわかっているのです。



コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です