統計学が最強の学問である

著者は本気で「統計学が最強の学問である」という信念を持っておられるので、記述に迫力があります。さまざまな数学的技法以前に覚えておくべき、統計を用いる際の心構え、という点で勉強になりました。もうひとつ私が勉強になったのは「ランダム化」という技法の効用についてです。私はランダム化がそれほど重要だとは今まで認識していませんでした。おもしろく読み進めていったのですが、第5章「ランダム化ができなかったらどうするか?」の半ばからだんだん記述についていけなくなりました。この本を読んでも統計の数学的技法についてはあまり書かれていません。むしろそれらの技法を用いる際の留意点について書かれています。技法についてはこの本とは別な本を読む必要があると思います。


心構え的なところで感心した記述を挙げます。ビジネスで登場するグラフにもどうしようもないグラフが多い、という話です。著者はデータをビジネスに使うための「3つの問い」を提唱します。それは以下のものです。

  • 問1.何かの要因が変化すれば利益は向上するのか?
  • 問2.そうした変化を起こすような行動は実際に可能なのか?
  • 問3.変化を起こす行動が可能だとしてもそのコストは利益を上回るのか?


また、このようなことも言っています。

次の食べ物を禁止すべきかどうか考えてみましょう。

  • 心筋梗塞で死亡した日本人の95%以上が生前ずっとこの食べ物を食べていた。

実はこの食べ物とは「ご飯」のことなのですが、比較データがなければ容易にだまされてしまう例としてこの例を挙げています。著者によればこの例と同レベルの集計結果が世の中にはあふれているそうです。


この本の章立ては以下のようになります。

  • 1.なぜ統計学が最強の学問なのか?
    • 統計リテラシーのない者がカモられる時代がやってきた。/統計学は最善最速の正解を出す。/すべての学問は統計学のもとに。/ITと統計学の素晴らしき結婚。
  • 2.サンプリングが情報コストを激減させる。
    • 統計家が見たビッグデータ狂想曲。/部分が全体に優る時。/1%の精度に数千万円かけるべきか?
  • 3.誤差と因果関係が統計学のキモである。
    • ナイチンゲール的統計の限界。/世間にあふれる因果関係を考えない統計解析。/「60億円儲かる裏ワザ」のレポート。/p値5%以下を目指せ!/そもそも、どんなデータを解析すべきか?/「因果関係の向き」という大問題。
  • 4.「ランダム化」という最強の武器
    • ミルクが先か、紅茶が先か。/ランダム化比較実験が社会科学を可能にした。/「ミシンを2台買ったら1割引き」で売上は上がるのか?/ランダム化の3つの限界。
  • 5.ランダム化ができなかったらどうするか?
    • 疫学の進歩が証明したタバコのリスク。/「平凡への回帰」を分析する回帰分析。/天才フィッシャーのもう1つの偉業。/統計学の理解が劇的に進む1枚の表。/重回帰分析とロジスティック回帰。/統計学が極めた因果の推論。
  • 6.統計家たちの仁義なき戦い
  • 7.巨人の肩に立つ方法
    • 「最善の答え」を探せ。/エビデンスを探してみよう。


著者の「熱」を感じました。