因果推論の科学 「なぜ?」の問いにどう答えるか ジューディア・パール、ダナ・マッケンジー

book report

感想

章ごとに書いてみる。

第1章 因果のはしご

因果関係を理解するには少なくとも3段階の認知能力を身に着ける必要がある。その3段階とは関連付け(見ること)、介入(行動すること)、反事実(想像すること)とのこと。

第2章 シューアル・ライトが起こした革命

ゴルトンボードと呼ばれているピンボールの台のような器具を使った「平均への回帰」を実演した実験が導入に用いられている。「平均への回帰」は日常の様々なところで現れる現象であるが、その原因がわからないということをきっかけとして、「相関」という尺度が発見された。

↑ゴルトンボード

そこから統計学では「相関」が重視され、「因果」は科学で扱う範疇ではないという考えが統計学では主流になっていった。

そんな中シューアル・ライトが因果ダイアグラムという、因果関係を扱う言語(図形)を発明した。

言語が発明されたことで因果関係の研究が発展するかと思われたが、依然として統計学では客観的な指標である相関を重視する派閥が主流であり、因果の研究はすぐには発展しなかった。

筆者曰く、ピアソンとフィッシャーがめちゃくちゃプライド高い人で、周りも扱いに困る感じの人だったらしい。

学者って権威が勝手についていっちゃいそうで、権威が出てくると間違ったことを間違ったと認めるのが難しくなっていくのかな、なんて思ったりしました。

第3章 結果から原因へ

「実に簡単なことだよ、ワトソン君」というホームズの引用から始まる。

ホームズの推理は証拠から仮説を導く「帰納法」と、いくつかの仮説のうちありえないものを消去していくことで最終的に正しい1つの結論を導く「演繹法」を使用している。その二つの推理法のうち自動的に行うことがより難しいように思える帰納法について、近年AIの研究で進歩が見られるという。

その一つが「ベイジアンネットワーク」である。

ベイジアンネットワークを利用すれば結果から原因の確率を導き出すことを可能に、つまり因果の非対称性を崩すことが可能となる。

そしてこのベイジアンネットワークが因果ダイアグラムを理解するための基礎となっている。

内容とはずれるけど、引用から文を開始して自然な流れで本論に持っていくのってなんかイケてる文な感じがする。

新書だけじゃなく小説でもよく目にする、章の最初に何らかの文献の一文を引用して、その一文がその章のメインの主張と合致している例のアレ、引用元ってどうやって探してるんやろ。先に見つけておいてストックしておくのかな。書き上げてからそれっぽい一文探してんのかな。

第4章 交絡を取り除く

対照実験を行う際に処理群と対照群にグループを分割して実験を行うが、処理群のサンプルと実験結果の両方にある変数が影響を与える際に生じるのが交絡バイアスである。そしてこの変数が交絡因子であり、交絡因子の存在が既知のものではない場合に「隠れた第三の変数(潜伏変数)」と呼ばれる。

例えば、ウォーキングの習慣がある人は死亡率が低下するという関係があるとする(実際にそのようなデータは存在する)。では、ウォーキングをすれば死亡率が下がるのか、というと話はそこまで単純ではない。実はウォーキングの習慣がある人には年齢が若い人が多いという隠された特徴があった。当然若い人のほうが死亡率は低くなる。

このように、ウォーキングの習慣(処理群のサンプル)と実験結果(死亡率の低下)のどちらに対しても年齢(交絡因子)が影響を与えており、処理群と実験結果に対して疑似的な因果関係がみられることがある。

この章ではこのように厄介な存在である交絡因子を、因果ダイアグラムを用いて完全に解決するアルゴリズムが発見されたことを紹介している。

このあたりはまだ書いてる内容も理解できた。交絡因子の概念を知ってまず思いつくチェーンに加えて、フォークとコライダーという交絡因子が存在すること自体が面白いし、それらの影響を無効化できるというのも面白い。行動経済学と因果推論が融合した研究とかめっちゃ面白そう。おすすめの書籍があれば教えてほしい。

第5章 タバコは肺がんの原因か?

タバコと肺がんの間に相関関係があることはデータから読み取れるが、その間に因果関係があるかどうかを証明するのが恐ろしく大変な行為であり、専門家の間でもかなり意見が割れていたという話が紹介されている。

4章までしつこいくらいに科学の立場で「因果」というものが存在すると宣言するのは非常に難しいことだと作者が伝えているが、因果の証明を使用としている具体例を見ると、本当に大変なことなんだなと思う。

BAZOOKA!!!という地下クイズ王決定戦などのコーナーで人気があった番組の企画でも、タバコは体に悪いのか悪くないのかみたいな議論を専門家的な人を論客として呼び出して行っていたのを思い出した。それに出ていた人たちが本当に専門家だったのか怪しいが(そもそも専門家って何の?)、とにかく「因果」という言葉についての定義・理解・共通認識が難しいことがよくわかった。

第6章 パラドックスの詰め合わせ

モンティ・ホールのパラドクス、シンプソンのパラドクス、バークソンのパラドクスなど、好奇心をくすぐる魅力的なテーマを、因果ダイアグラムを用いてスマートに解説している。

この章が一番面白かった。

初めてモンティ・ホール問題に出会ったときに興奮しなかった人はいないと思うが、因果という視点を加えるとまた更に楽しめる。この問題を考えた人天才ですね。

シンプソンのパラドックスはいまいち理解できていなかったが、グラフにプロットされた図を見ると何を言っているのか一瞬で理解できた。図の力ってすげえって思いました。

第7章 介入

因果関係を理解するための3ステップのうちの2段階目である「介入」を式に変換する方法を説明している。

ちょっと難しすぎた。中身ほとんど理解できなくて読みとばした。ランダム化試験の結果において、指示を無視した人がいたとしても最悪のケースと最良のケースを両方考えることで幅を持った推定が可能になる話は面白かった。

第8章 反事実

因果関係を理解するための3ステップのうちの3段階目である「反事実」を式に変換する方法を説明している。

7章にさらに輪をかけて難しくなっていた。ヒュームが原因の定義をこそっと変えようとした話が面白かった。この本って因果推論のテクニック的なところだけじゃなくて歴史背景とか哲学とか具体例とかあるから、主張を式に変換するところがあんまりわからなくてもそれなりに楽しめた気がするな。

第9章 媒介

間接効果や交絡など、媒介が存在することによって生じる様々な事象に焦点をあてている。

ここも難しかったけど面白い話多かったな。直接効果と間接効果を分けて考える話とか。

あと、止血帯の話が面白かった。止血帯をしている兵隊としていない兵隊の死亡率には優位な差はないけど、戦場ですぐ止血帯を使用できることによって病院まで死なずに戻れる確率が上がっているのではないかという話。戦争から帰ってきた戦闘機の傷があるところではなくて、傷がないところの方を修正したほうがいいっていう生存者バイアスの話っぽくない?なんか書いててちょっと違う気もしたけど、まあ面白いからよし。

第10章 ビッグデータ、AI、ビッグクエスチョン

ビッグデータ、AI、機械学習など、今後発展が予想される分野について、著者の展望が書かれている。

ディープラーニングって結局データいじってるだけで因果関係理解できてなくて、強いAIをつくるには因果関係を理解できるAIを作らないといけないらしい。そしてそれを実現するために因果関係を言語(式)で記述できるようになる必要があるらしい。なるほど。ちょっとこれも難しくてよくわからんかったけど、因果関係を理解できるAIがでてきたらどんな事やってくれるのかっていうのはとても気になる。

引用&コメント

本文から印象に残った箇所の引用&コメントです。表現は適宜変更しています。

多くて読むのが辛いという声があったので、今後は最大5つに絞ります。

  • 本書で私が読者に伝えたいことをごく簡単にまとめると、「人間はデータよりも賢い」という事になるだろう。
    • 直感的に因果推論ができているから、という文脈。因果推論に限らず脳のさまざまな働きとか、手を器用に動かせるとか、ロボットよりも人間が優れているところって実は想像している以上にたくさんあるんだろうなと思った。
  • 因果関係の存在は、因果関係が存在するという前提で状況を見ていないと発見できないということだ。
    • これはアブダクション推論ってやつか?わからんけどなんかなるほど~ってなった
  • 日常の会話では「なぜ?」という問いには、少なくとも二つの種類がある。一つは、何らかの現象を見て、それが起きた原因を求めるという非常に単純な問いだ。もう一種類の問いは、何か既知の原因と既知の結果があるときに、両者の関係をよりよく知ろうとして発するものである。
    • 想定したのと違う分類の仕方でなるほど~ってなった。
タイトルとURLをコピーしました