1: 2018/03/16(金) 22:33:50.98 ID:CAP_USER
統計学における仮説の検定法である「t検定」は、生物学や物理学などあらゆる科学分野で使用されていますが、なんと「t検定はギネスビールの醸造所から生まれた」そうです。

The genius at Guinness and his statistical legacy
https://theconversation.com/the-genius-at-guinness-and-his-statistical-legacy-93134
https://i.gzn.jp/img/2018/03/16/guinness-and-his-statistical-legacy/02_m.jpg

ギネスは1756年創業の老舗ビール醸造会社であり、長年にわたってビールの品質評価を醸造家の主観的評価に依存して行ってきました。
ところが、19世紀の終わりにギネスは事業規模を拡大し、ギネスビール生産のあらゆる過程に科学的アプローチを導入する方針を固めます。

科学に造詣の深い醸造家の募集を始めたギネスは、1893年にトーマス・ベネット・ケースという人物が雇われます。
ケースはビールの原料であるホップ に含まれる軟性樹脂(ソフトレジン)の量がビールの味と関連しているとして、原料となるホップに含まれているソフトレジンの量を計測することで、作られるビールの品質を評価できると考えていました。
ところが、ケースは「原料となる全てのソフトレジンの量を見積もることは不可能である」という問題に直面します。
ビールの原料となるホップの量は膨大であり、とてもいちいち評価することはできませんでした。

そこで、ケースはホップから50グラムのサンプルを11回に分けて採取し、平均のソフトレジン量を計測する方法をとりました。ケースは複数サンプルの平均をとることで、ホップ全体のソフトレジン量を知ることができると考えたのです。ケースはこの考えを確かめるために、次は50グラムのサンプルを14回取り出し、再度計測しました。
すると、サンプルに取ったホップに含まれるソフトレジン量にわずかな差異が見られ、「このやり方は間違っているのか?」とケースは再び問題に直面します。

続きはソースで

GIGAZINE
https://gigazine.net/news/20180316-guinness-and-his-statistical-legacy/
ダウンロード


引用元: 【統計学】ギネスビールの醸造所が統計学的手法の一つ「t検定」を生み出した[03/16]

スポンサーリンク
2: 2018/03/16(金) 22:54:25.50 ID:9LPuBjAZ
へー、勉強になった
と思いながらエ◯フォルダにブックマークしてしまった私を誰が責められようか

3: 2018/03/16(金) 23:02:12.09 ID:GTwJGL3N
t検定とフィッシャーの正確確率検定にはこんな関係があったのか

4: 2018/03/16(金) 23:02:50.33 ID:l4HH20Bv
エクセルの統計機能が充実して21世紀になってやと活用されとる
その前はナゾの数表相手に格闘する、美しい数式とはかけ離れた
みっともない不人気数学だた

6: 2018/03/17(土) 00:17:53.36 ID:H8xwjOxU
χ二乗検定は数学者の考案だよな?

7: 2018/03/17(土) 00:24:39.14 ID:2vYBozte
フィッシャーだと思っていたんだが違ったんだな
1925年の論文のあれなんだっけ?

実験区画法 とか 実験なんとか という論文だったようなの

9: 2018/03/17(土) 01:56:02.85 ID:QtkOHcel
そして何でもかんでも正規分布を仮定して検定にぶち込む研究者が量産された

10: 2018/03/17(土) 05:34:49.66 ID:Ie9JMO+G
>>9
ランダムサンプリングで標本数が十分に多いとき
母集団が正規分布でなくても、標本サイズが大きくなる と、平均値の標本抽出分布は正規分布に近づく。(中心極限定理)


この大前提を理解してないド素人が正規分布を否定してるだけなんだな

11: 2018/03/17(土) 06:35:22.63 ID:QtkOHcel
>>10
中心極限定理は知っていますよ
私が言っているのは正規分布を前提とした検定法に
無思慮に正規分布かわからないデータをぶち込む輩や
あるいは従属変数が非負なのがわかってるのに正規分布を使おうとする輩のことです

15: 2018/03/17(土) 12:31:18.39 ID:Ie9JMO+G
>>11
わかってないやんw

19: 2018/03/17(土) 17:28:20.54 ID:QtkOHcel
>>15
統計量の分布と母集団の分布がごっちゃにしておられるようです
もう一度参考書を繙かれることをおすすめします
頑張ってください

20: 2018/03/18(日) 09:57:22.56 ID:PEKEq54o
>>19
母集団の分布が「正規分布じゃなくても」ランダムサンプリングされた分布は正規分布になる

これがt検定の利点なのよ

21: 2018/03/18(日) 10:24:30.89 ID:EzvH0rHi
>>20
正しくは
母集団の分布が「正規分布じゃなくても」ランダムサンプリングされた分布の"標本平均は"正規分布になる
です(標本平均じゃなくほかの統計量でも当てはまりますが)

冷静に考えてみましょう
極端な話デルタ関数のような確率分布からランダムサンプリングしても
得られるのはおなじデルタ関数でしょう
どうやっても正規分布は出てきません

22: 2018/03/18(日) 19:22:50.11 ID:QTvioYO2
>>21
デルタ関数が母集団の場合無限大の一点がサンプリングされる可能性は限りなくゼロに近いんだから平均値ゼロ標準偏差無限大の正規分布になるよ
ちゃんと考えて

t検定が乱用された理由がランダムサンプリングされてさえいれば適用可能という敷居の低さだよ
例え著者がその根拠を知らなくてもね
これはラプラス変換の証明を知らなくても学生でも多用するのと同じ
手軽に高度な技術が使えることはそれを産み出した人が偉大だということだ

23: 2018/03/19(月) 06:08:40.75 ID:ku2XrSj5
>>22
デルタ関数が母集団の確率分布ということはランダムサンプリングしても
かならず値ゼロが得られるということです
これはとても正規分布とは言えません

デルタ関数が難しいようですので例えば母集団が一様分布なら
あなたの考えではランダムサンプリングされた分布はどうなるのでしょうか?
平均値が毎回ほぼ同じのところに収束するのですか?

具体的にあなたの意見である『母集団の分布が「正規分布じゃなくても」ランダムサンプリングされた分布は正規分布になる』が
示された文献を教えてください

24: 2018/03/19(月) 06:36:41.08 ID:DEs95JfG
>>23
中心極限定理
https://ja.m.wikipedia.org/wiki/%E4%B8%AD%E5%BF%E6%A5%B5%E9%90%E5%AE%9A%E7%86

大数の法則によると、ある母集団から無作為抽出された標本平均はサンプルのサイズを大きくすると真の平均に近づく。
これに対し中心極限定理は標本平均と真の平均との誤差を論ずるものである。
多くの場合、母集団の分布がどんな分布であっても、その誤差はサンプルのサイズを大きくしたとき近似的に正規分布に従う。



25: 2018/03/19(月) 06:55:42.22 ID:ku2XrSj5
>>24
いみじくもあなたが書いたとおり
『その"誤差"はサンプルのサイズを大きくしたとき近似的に正規分布に従う』
のであって、誰も
『その"分布"はサンプルのサイズを大きくしたとき近似的に正規分布に従う』
とは言っていません

そして一様分布の質問に答えておられないようですが?

26: 2018/03/19(月) 07:02:38.40 ID:DEs95JfG
>>25
標準偏差を無限大にすると一様分布になるけど?
あと現代科学の大半を否定する覚悟はできたかね?

27: 2018/03/19(月) 07:11:39.99 ID:ku2XrSj5
>>26
平均値についてはいかがですか?
もしあなたの説通りならサンプリングされた分布は
毎回同じ平均値に収束するはずですが
もしそうなら具体的な平均値の値をご教示ください

28: 2018/03/19(月) 07:40:41.53 ID:DEs95JfG
>>27
そりゃ母集団の平均値が同じなら同じ平均値に収束されるが母集団の平均値が異なれば変わるよ

29: 2018/03/19(月) 07:47:56.38 ID:ku2XrSj5
>>28
そもそも一様分布では平均値は定義されませんからね
これ1つとっても任意の母集団の分布をランダムサンプリングしたとき
必ず正規分布になるとは言えないわけです

41: 2018/03/20(火) 05:32:54.71 ID:VfzKqi9g
量子力学だって電気器具メーカーの裸電球のフィラメントの材質研究から始まった