統計学が最強の学問である データ社会を生き抜くための武器と教養

統計学が最強の学問である データ社会を生き抜くための武器と教養
西内啓 2013 ダイアモンド社

内容、カバー折口より

あえて断言しよう。あらゆる学問のなかで統計学が最強の学問であると。どんな権威やロジックも吹き飛ばして正解を導き出す統計学の影響は、現代社会で強まる一方である。「ビッグデータ」などの言葉が流行ることもそうした状況の現れだが、はたしてどれだけの人が、その本当の魅力とパワフルさを知っているだろうか。本書では、最新の事例と研究結果をもとに、今までにない切り口から統計学の世界を案内する。

感想

統計学が最強の学問である」と、喝破する。もちろん統計学といえども、さまざまな学問との関わりのなかにあるので、「最強」などと表現するものではない。あくまで読者をひきつけるためのオーバーな表現、ということだろう。

なぜ「統計学が最強の学問である」のか?
本書によると、「どんな分野の議論においても、データを集めて分析することで最速で最善の答えを出すことができるからだ」p8、という。医療や教育、効果的にDMをおくる方法など、不確実性が高く、また原因と結果の仕組みがよくわかっていない分野においては、勘と経験を積み重ねて時間をかけて議論したところで、答えは根拠薄弱なうえ、正しいものが出てくるわけではない。しかし、データを準備し統計学を使えば、はっきりとした根拠をもった正しい結論を、すぐに出せるというのだ。

本書の後半では実際の統計学の考え方や計算方法が紹介されているが、途中から意味がわからなくなった。私、勉強不足。

なるほどなあ、と思った点(理解できた点w)については下記にメモしておく。

メモ

統計学は21世紀を生きる我々にとって必須のスキル

○医療分野での話。人間の体は不確実性が高く、データをとって分析すると、理屈のうえでは正しいはずの治療が効果を示さないケースや、経験と権威にあふれる大御所医師たちがこれまで続けてきた治療法がじつはまったくの誤りだった、という事例が少しずつ明らかになったきた。そのため、医師の経験と勘だけではなく、きちんとしたデータとその解析結果に基づくことで最適な判断をすべきだ、というのが現在の医学において主流の考え方。

○ほとんどすべての学問に関わる学者は統計学を使わざるを得ない。

IT技術の発達により、統計学はより強力に、かつ使いやすいものになった。

○解析それ自体に価値はない。重要なのは、「果たしてその解析はかけたコスト以上の利益を自社にもたらすような判断につながるのだろうか?」という視点。現状を把握しただけでは意味がない。また得られそうな価値が小さければ、金をかけて大規模に調査しても無駄。

データをビジネスにおける具体的な行動につなげるには、次の3つの問いに答えられる必要がある。これにより利益を向上させるという見通しが立つ。
問1 何かの要因が変化すれば利益は向上するのか?
問2 そうした変化を起こすような行動は実際に可能なのか?
問3 変化を起こす行動が可能だったとしてそのコストは利益を上回るのか?

○ちょっとした改善でも、もともとの規模が大きければ大きな利益をつかむことができる。

○検証内容や検証対象をランダムにする検証方法をランダム化比較実験という。このアイデアにより科学で扱える対象の領域は大きく広がった。
ランダム化比較実験がもたらしたメリットには次のものがある。
一つは、「誤差」がある現象も統計的に処理することができるようになった。
もう一つは、因果関係が実証できること。調べたい問題を除いてランダム化してしまえば、調べたい問題を除いた諸条件を平均的にそろえることができる。そのため、調べたい問題の影響を検証できる。(例:肥料の作物に与える影響など)

ごちゃごちゃ理屈を唱えるよりも、倫理的にも予算的にも実験が許されるのなら、研究対象をランダムに分けて、状況を設定し、その差を統計学的に分析してしまえばいい。

「 さらにはA/Bテストと呼ばれる一種のRCT(スカイコミュ注:ランダム化比較実験のこと)がシリコンバレーで大いに活用されるようになった、ということも特筆すべきだろう。AmazonのようなECサイトの中では、ちょっとした画面領域やフォントのサイズ、色などが変わるだけで利用者のコンバージョン率(実際に購入する確率)はわずかながら変化することがある。その変化は、サイトの利用者のうち、「購入」ボタンをクリックする率が0.10%から0.11%に増加するというような微々たる変化かもしれない。しかし、見方を変えれば年間の売上が1.1倍に増加する大きなチャンスがそこに眠っているということだ。

Amazonの売上は日本国内だけでも数千億円ほどの規模だ。それが1.1倍、というのであれば数百億円やそこらの売上増のチャンスがそこにあるということである。そしてこのような潜在的なチャンスを迅速かつ正確につかむためには統計学の知識が不可欠なのだ。
 医学の世界と同様、こうした売上増に繋がるデザインの変化はこれまでは「デザイナーの経験と勘」に頼っていたが、どれだけ大御所の手によるデザインであったとしても、きちんとしたA/Bテストを行なってしまえば、たちどころにその価値は丸裸にされてしまうのである。」
(「なぜ、統計学が最強の学問なのか? 『統計学が最強の学問である』ビジネス書大賞2014「大賞」受賞記念記事」、http://diamond.jp/articles/-/52085)より

統計学はさまざまな分野で利用されているが、統計をどう考えるのか、ということはそれぞれの分野の特色に応じて異なる。
 ・「社会調査法」では、実態の正確な把握のため、可能な限り偏りなく求められる誤差の範囲に収まる推定値を得ることを重視する。
 ・「疫学・生物統計学」では、原因を究明することを重視するため、社会調査法ほどは偏りにこだわらない。原因究明に影響なければ、偏りが生じても妥当な判断が下せるので、それはそれでよい、と考える。
 ・経済学の分野で統計学を用いると計量経済学とよばれる。経済学は「あらゆる経済活動は物々交換にすぎない」といったいくつかの仮定を組み合わせ、演繹によって推論を広げていくことで個人や社会の均衡を説明してきた。そのため計量経済学では、演繹に足るようなよりよい強固なモデルをつくることを重視する。