find100

日常の中で見つけた面白そうなことを発信します

MENU

統計学は最強の学問なのか

最近ブログを更新していなくてややサボりがちになっていたので、3週間ぶりぐらいに書いて行こうと思います。

 

今回読んだ本はこちらです

 

統計学が最強の学問である

統計学が最強の学問である

 

 

 

 

以前記事に少し書いたと思うのですが、自分は生物統計に興味を持っています。

以前の記事はこちら

 

find314.hatenablog.com

 

そこで、具体的に統計学がどのように発展していってどう使われているのかを知りたくなったため読んで見ました。

 

この本の構成は大体こんな感じ

 

第1章   なぜ統計学が最強の学問なのか?

第2章   サンプリングが情報コストを激減させる

第3章   誤差と因果関係が統計学のキモである

第4章   「ランダム化」という最強の武器

第5章   ランダム化ができなかったらどうするか?

第6章   統計家たちの仁義なき戦い

終章    巨人の肩に立つ方法 

 

 

本書の中で統計学が最強の武器となりうる理由として、どんな分野の議論においても、データを集めて分析することで最速で最善の答えを出すことができると述べられている。

 

そもそも統計学は現在では、計量経済学や製薬の開発などの様々な場面で用いられているが、その一番の目的として得られてデータを分析した結果を基にしてではどのようにすれば良いか、という議論をするためのツールであると思う。

 

統計学の始まりはどのようであっただろうか。

それは「疫学の父」と呼ばれるジョン・スノウが行った調査が始りである。その当時はロンドンでコレラによる感染が流行っており、合計で十数万人もの死亡者を出したと言われている。現代ほど科学技術が発達していないにせよ、高いレベルの医者や科学者はいた。しかし、そんな彼らが考え出した方法やアイデアも無駄に終わってしまう。

スノウがおこなった調査は以下のようなシンプルなものであった。

  • コレラの死亡者数の多い付近の環境を観察する
  • 同じような条件のもとでコレラに感染した人とそうでない人の違いを調べる
  • 仮説を立てて大量にデータを集めた後、コレラの発症/非発症と関連があると考えられる違いについて、どの程度確からしいか検証する

 

このようにして調べていった結果、ある水道会社を利用している家庭のコレラによる死亡率が高いことがわかった。よって、その水道会社の利用を止めればコレラによる感染をグッと抑えることに成功した。コレラとは一体何なのかがわからなかった時代であるが、コレラによる感染を防ぐという目的は達成されたのである。

 

統計学の始まりはビジネスに用いるわけではなく、人の死を食い止めるために用いられたんすね〜

 

では次にフィッシャーが考え出した「ランダム化」というものについて軽く述べて行こうと思う。ランダム化の凄いところは人間の制御しうる何物においても、その因果関係を分析できるところにあるんです。

例えば暴力的なゲームのプレイ時間と犯罪率について調べたときに断片的なデータだけをクロス集計したところで前者が後者の原因なのか、はたまたその逆なのかという因果関係の向きは分からないんですよね。第三の要因が両者に関係している可能性もありますしね。そこでデータの取り方を工夫しなければならないんですね。

ランダム化してしまえば、比較したい両グループの諸条件が平均的にはほぼ揃う(誤差を制御することができる)ので因果関係を明らかにすることができるのである。

 

言われてみれば納得ですね。つまりできる限りランダム化してから検証しましょうってことですね。

 

まぁあとはデータ化が出来ない時の対処法だったり、統計を用いる専門家の考え方の違いだったり、ビジネスにおける統計解析を使う時の注意だったりが詳しく書かれているわけなんですけど特に自分が興味を持ったのは本書の最初と最後の50ページぐらいですかね

 

そこにはIT×統計みたいなのことが書いてあって今の自分に興味のあることが書いてあったので面白かったです

 

本書で言いたいこととしては、この世には知恵(情報)が溢れていて統計リテラシーを身につけていればそれを迅速に活用できるから統計学は最強の学問なんだよってことですかね

 

 

それでは今回はこのへんで