MENU

causal analysis

データサイエンティストは、記述的分析や予測的分析を重視し、因果関係の分析を軽視する傾向があります。しかし、意思決定には因果関係の分析が必要です。この事実は、COVID-19パンデミックの際に公衆衛生の疫学者たちが認識していたことでもあります。私は生物学を専攻していたこともあり、「相関関係は因果関係ではない」という言葉を身にしみて感じていたので、因果関係を主張することを避けるようにしていました。幸いなことに、私の飽くなき好奇心は、因果関係を受け入れ、因果関係の分析を容易にするための厳密な数学の体系を確立している計量経済学の分野に導いてくれました。

最近、私が計量経済学に興味を持ったのは、世界銀行で中東・北アフリカ(MENA)地域に特化したコンサルティングを行っているからです。具体的には、『Political Science Research and Methods』誌に最近掲載された論文では、イスラエルの検問所がパレスチナ人の雇用成果に与える因果関係を評価した珍しい論文を詳しく紹介しています(Abrahams, 2021)。Hard traveling」では、著者は巧妙に設計された実験で操作変数を利用し、現在進行中のパレスチナ占領中にイスラエル軍が展開した道路封鎖の因果効果を強調しています。この記事では、この興味深い論文の結果を実用的なPythonチュートリアルで再現することで、実用的な応用という観点から因果関係を探ります。

まず、因果関係の複雑さと難しさを伝えるために必要なステップとして、機械学習と計量経済学の違いを明確にします。次に、このチュートリアルで使用するPythonライブラリを紹介し、因果関係分析の計量経済学的アプローチについて説明します。続いて、ケーススタディ論文に記載されている実験デザインの概要を説明し、関連する方程式の直感的なウォークスルーを行います。最後に、Pythonを使って、コードの実装に重点を置いて論文の主要な結果を再現します。

www.DeepL.com/Translator(無料版)で翻訳しました。

https://towardsdatascience.com/practical-python-causality-econometrics-for-data-science-ffc074e11a1d

因果関係の検証

因果分析のプロセスは、4つの段階に分けることができます。第1段階は、因果関係の質問をモデル化すること、第2段階は推定対象を特定すること、第3段階は効果を推定すること、第4段階は得られた推定値に反論することです。この記事では、説明を簡単にするために、マイクロソフトが開発した因果推論用のPythonライブラリであるDoWhyを使って、因果分析の4つのステージを実装することに主眼を置きます。また、ケーススタディ論文の主要な結果を再現するために、Pythonライブラリのlinearmodelsも利用します。

第一段階で因果関係のある質問をモデル化する際には、因果関係のある仮定を明示する必要がありますが、DoWhyは因果関係グラフによってこれを可能にしています。経済学の用語を借りると、因果グラフはデータ生成プロセスに関する仮定を符号化した確率的なグラフモデルであり、基本的に因果グラフは事前の知識を符号化したものです。因果関係のあるグラフについての簡単な紹介は、このMediumの記事をお勧めします。因果関係のあるグラフを徹底的に議論するには、チューリング賞受賞者のジュディア・パールとサイエンスライターのダナ・マッケンジーによる「The Book of Why」をお勧めします。

パールはコンピュータ科学者として、人工知能の研究やベイジアンネットワークの開発で知られていますが、私の研究に最も役立っているのは因果関係の研究です。実はDoWhyの “do “は “do-calculus “に由来しています。”do-calculus “はパールが因果関係を議論するために発明した形式言語で、ロバート・R・トゥッチによる教育的な論文では、証明やルールを含めた言語の概要が紹介されています。do-calculusの詳細については本稿では触れませんが、重要な点は、Do-calculusを使って因果関係のあるグラフを構築することで、DoWhyがPearlianのフレームワークを採用していることです。具体的には、DoWhyは、仮定をモデル化し、ノンパラメトリックな因果効果を特定するために、グラフベースの基準とdo-calculusに依存しています。

DoWhyの因果関係フレームワークを使用する利点は、仮定を明示的に識別することだけではなく、重要なのは、DoWhyは第2段階での因果効果の識別と第3段階での効果の推定を分離していることです。このライブラリを紹介しているMicrosoft Researchのブログ記事を引用します。

www.DeepL.com/Translator(無料版)で翻訳しました。

よかったらシェアしてね!

この記事を書いた人

コメント

コメントする

目次
閉じる