因果推論の最前線 特集号 -解題(前編) SBI Research Review Vol.8-
The English translation can be accessed at the following link.
------------------------------------------------------------------------------
因果推論の最前線
今号の特集は「因果推論の最前線」である。因果推論とは、「あることが起きた原因は何か」「ある行動や政策をとった結果、何が起こるのか」といった原因と結果の関係を明らかにするための考え方や分析手法である。
たとえば、「ワクチンを打った、給付金支給や減税を行った、最低賃金を引き上げた、医療費負担率を引き上げた、非正規雇用にかかる労働契約法を変更した、株式投資促進策を採った、関税を引き上げた」場合、実現した結果が政策や介入の効果なのか、様々な他の要因に左右されたに過ぎないのかを判断するのは容易ではない。同様にビジネスにおいても、「価格を下げた、商品の内容量を減らした、クーポンを配布した、スポット広告を打った、店内レイアウトを変更した、AI活用研修を行った、アプリに新機能を追加した、社外取締役を増やした、上場/MBO/M&Aを実施した」といった施策の効果を、他要因を排除して正確に計測するのは非常に困難である。
因果推論の原理的な困難さは、ある経済主体や個体について、時々の環境のもとで、「介入した場合」と「しなかった場合」の両方の結果を観測することができない点にある。これは、因果推論の根本問題(Fundamental Problem of Causal Inference)と呼ばれている。他の要因を完全に同一とした並行宇宙を用意し、世界Aと世界Bの比較を行ってみるわけにはいかないのである。この根本問題に対して、どのような手法で因果性を検証することが可能になるのか、長年にわたり研究が蓄積されてきた。
1. 発展の歴史と主要な手法
観測されなかったもう一つの世界、すなわち、政策やビジネス戦略を行っていれば、もしくは行っていなければ、実現していたであろう世界のことを反実仮想(counterfactual outcome)とよぶ。これは、エコノミストにとって馴染みが深い概念であり、実証分析モデルを用いて反実仮想を推計する手法が知られている。消費税引き上げがなかりせば、量的緩和がなかりせば、資産バブルの早い段階で引き締め政策が採られていれば、不良債権問題への公的資金投入が早期決定されていれば、等々である(前二者は政策が採られていなければ、後二者は採られていればという反実仮想である)。このほか、計量経済学でよく知られた操作変数法も因果推論に応用されてきた。しかし、前者の経済構造モデル分析は「モデルが世界の近似として適切か」、後者は「適切な操作変数が利用可能か」という難しい課題を抱えている。
因果推論でもっとも著名な手法として、実験によって根本問題を乗り越えるというランダム化比較試験(RCT:Randomized Controlled Trial)がある。1930年代に開発され、1940年代には医療での適用が行われたが、経済分野では技術的・倫理的・予算的な制約により実験が難しいと考えられていた。しかし、1990年代以降、社会政策や教育、経済学での応用が広がり、特に開発経済学の進歩において重要な役割を果たした。2019年には開発経済学でのRCTがノーベル経済学賞を受賞している。2010年代になると、労働経済学や教育経済学、行動経済学、公共経済学でもRCTが活発に導入されるようになった。
因果推論の手法としてはRCTや操作変数法のほかにも、傾向スコアマッチングや、差の差分法、回帰不連続デザイン、逆確率重み付けほか様々な手法がある。これらは、反実仮想が観測できないという制約を統計的仮定と設計上の工夫によって集団レベルで推定可能にするアプローチであり、潜在アウトカムモデルと総称される。こうしたアプローチとは別に、構造的因果モデルと呼ばれる手法も発展してきた。原因と結果の因果の方向性をグラフで表現し、これを数理モデル化することで個体レベルでの反実仮想が検証可能となっている。モデル化の方法論は異なるが、構造モデルを推計するという点では、前述の計量経済学の構造モデルと類似している。
2. 政策やビジネスへの応用
以上のような因果推論の発展は、EBPM(Evidence-Based Policy Making)やデータマーケティングの観点からますます重視されるようになっている。最低賃金を引き上げると失業が増加するというトレードオフが必ずしも成立しないことを発見した米国の90年代初の研究や、コロナ給付金の相当な割合が消費に回らなかったことを銀行口座データから突き止めた研究は、いずれも因果推論の手法を用いている。排出権取引など環境規制が企業行動や大気汚染レベルに効果的であったか、少人数制学級が学力向上に寄与するのか、特定健診・保健指導が医療費の抑制効果を有していたか、警察官の配置増員や防犯カメラ設置が犯罪の発生を抑制したかなど、様々な分野でEBPMが進展し、因果推論は検証手法として重要な役割を担っている。
ビジネスにおいても応用事例は多い。ビデオ配信サービスにおいて推薦アルゴリズムが視聴時間を延ばすか・購買停止に抑止力を持つか、クーポン配布がタクシー乗車回数や収益を増やしているか(必要以上に配りすぎて収益機会を失っていないか)、金融商品キャンペーンやアプリのUI/UX改良が商品購買や収益に貢献しているか、CRM(Customer Relationship Management)ツールや営業手法、トレーニングプログラムの導入が成約率向上や顧客単価、Life Time Valueの引き上げに貢献しているかなど、様々な検証が進められている。このように、データサイエンスに基づくビジネスの高度化が競争力に直結する時代となって久しい。データ駆動型ビジネスの先端を行くGAFAMの株価時価総額の伸びがそれを象徴している。
その一方で、経験則や直感に基づく政策実施やビジネス戦略の決定も少なくないであろう。あるいは、データサイエンスの普及状況や、分析に必要なIT基盤・データの未整備という現状から推測すると、誤った分析結果に基づく方策決定が政策立案やビジネス推進の現場で行われていることも十分考えられる。
因果推論の活用推進の動きも明確に観察されている。因果推論への注目度が高まるにつれ、専門書や啓蒙書、実践手法のテキストが出版されるようになった。特に、2020年前後から翻訳書や日本の研究者による優れた書籍が多数執筆されている。Box記事(p.8)にその代表的なものを示した。因果推論の考え方や実践方法をこれらの書籍で学ぶことは、政策やビジネス推進に大きく貢献する。
3. 特集の狙い:新しい手法の登場、言語という分析対象への拡張
本号特集の狙いは、因果推論の最新動向の一部を紹介することである。近年の発展のドライビングフォースとなっているのは、自然言語処理の技術の発展、とりわけ大規模言語モデル(LLM:Large Language Model)の爆発的な進化により、因果性検証のための新データ、すなわち言葉で書かれた文章が利用可能になった点である(LLMについては所報6号[2024年]の副島論文を参照)。ここまで解説してきた統計的因果推論に加えて、新しい手法やテキストという膨大なデータソースにより、因果推論の潜在力が一段と高まる兆しが窺われる。こうした発展に伴い、研究領域の拡大が生じている。ものごとの因果性を検証するだけでなく、因果性を人間がどう認知しているか、その認知に基づきどう行動しているか、という人間の情報処理の仕方が研究対象となっている。本号掲載の2つの論文が、こうした視点からの研究であり、その手法について実証事例を含めて紹介している。
また、機械学習やAIの手法が発展し、これを因果推論に活用する研究やビジネスが増えている。推薦アルゴリズムの選択問題では、介入手段が数万の音楽や映像、書籍が対象になり、1つの政策採用による介入に比べて解くべき問題が遥かに高次元化している。こうしたケースではRCTやA/Bテストの実施が困難であり、「ある方策や環境のもとで観察されたデータから意思決定を行う」ことを強いられる。また、医療のように試験的介入を行えない領域が広い分野も存在している。本号掲載の論文では、オフ方策評価と呼ばれる上記の意思決定問題を取り上げ、最近の技法発展を紹介している。
Box記事に示した書籍の出版社名をみてもわかるように、因果推論を研究対象とする学問分野はもともと間口が広かった。AIや機械学習という新手法と、テキストという新データの登場により、情報処理、行動経済学、政治学、医学、法曹/法制度、経済史、比較制度分析、コミュニケーションサイエンス、マーケティング、計算社会科学(Computational Social Science)など、因果推論を研究対象とする学問分野が拡大している。筆者は、5月に大阪で開催された人工知能学会の全国大会に参加したが、SNSデータを対象とした計算社会科学や、マーケティングにおける自然言語処理活用などのセッションが多数設定され、学界・実務界からの報告者も多分野・多産業にわたっている点が興味深かった。今号の収録論文も、いわゆるエコノミストによるものは1本のみであり、情報処理や人工知能、機械学習等の工学系の研究者のほか、教育行政、統計、自然言語、認知科学など、様々なバックグラウンドを持つ研究者の方々にご寄稿いただいている。
4. 因果推論の可能性
こうした学際的な展開は、人間の意思決定における因果的思考の役割とその社会への影響を深く理解することに繋がる。インターネットは、情報の生産と拡散のされ方にグーテンベルクの印刷技術発明級の大きな変革をもたらした。政治や政策、企業のオフィシャルな情報発信やそれを伝える従来のメディア媒体と同じかそれ以上に、SNSでの情報発信や伝達のされ方が、世論形成や人々の行動変容、政治・経済政策、民主主義のあり方などに大きな影響を及ぼすようになった。悪意を持った情報操作、ポピュリズムの横行、プライバシーやセキュリティ情報の簒奪と悪用は、ネット社会の負の側面である。同時に、デジタル技術を活用した新しいデモクラシーへの期待や、ボトムアップ型の社会運営の可能性も広がっている。
以上のような社会環境において、因果推論の技法は一段と重要性を高めている。社会で起こる出来事の背景にどのような因果があるのかを正しく理解し、効果的な政策や制度設計を実施していくためには、原因と結果の関係を適切に検証することだけでなく、これを社会がどう認識し、行動に反映させていくかが、健全な社会運営を進めていくための鍵となる。地球温暖化や社会保障、税を巡る議論など個別論点の事例を考えるだけでも、その重要性が確認できよう。
ビジネスにおいても、従来の数字中心の構造化データでは捉えきれなかった因果関係を明らかにするという大きな潜在力を有している。多くのビジネス活動では、顧客の声や顧客対応、営業メモ、商品レビュー、チャット履歴、SNS投稿、FAQなど、非構造データであるテキスト情報が意思決定の基盤になっている。こうした情報は主に感情分析や話題抽出にとどまっていたが、ある文脈・表現・メッセージがどのような行動や評価に因果性をもって影響を与えているかを明らかにするために、因果推論の活用が始まっている。
広告や顧客対応などテキストや音声、映像を介した処置(介入)の効果、LLMによる大量のテキストデータの処理や構造化による因果推論の精度向上、テキスト生成による最適化介入設計など、応用範囲は更に拡がっていくであろう。
以下では、本号に収録された論文を実務への活用という視点を中心に紹介する。技術内容の詳細については、各論文やベースとなっている研究論文に当たられたい。(後編に続く)
最近出版された因果推論の日本語書籍
1.実務実践系
効果検証入門:正しい比較のための因果推論/計量経済学の基礎、安井翔太、2020、技術評論社
施策デザインのための機械学習入門:データ分析技術のビジネス活用における正しい考え方、安井翔太・齋藤優太、2021、技術評論社
反実仮想機械学習:機械学習と因果推論の融合技術の理論と実践、齋藤優太(本号寄稿者)、2024、技術評論社
つくりながら学ぶ! Pythonによる因果分析:因果推論・因果探索の実践入門、小川雄太郎、2020、マイナビ出版
マーケティングのための因果推論:偶然と相関の先へ進む因果思考、漆畑充・五百井亮、2025、ソシム
2.教科書系(一部コード付き)
因果推論の計量経済学、川口康平・澤田真行、2024、日本評論社
開発経済学: 実証経済学へのいざない、高野久紀、2025、日本評論社
はじめての統計的因果推論、林岳彦、2024、岩波書店
統計的因果推論の理論と実装 (Wonderful R)、高橋将宜、2022、共立出版
因果推論:基礎から機械学習・時系列解析・因果探索を用いた意思決定のアプローチ、金本拓、2024、オーム社
因果推論入門〜ミックステープ:基礎から現代的アプローチまで、Scott Cunningham、2023、技術評論社
政治学と因果推論:比較から見える政治と社会、松林哲也、2021、岩波書店
医学研究のための因果推論レクチャー、井上浩輔他、2024、医学書院
3.世界の大御所系
インベンス・ルービン 統計的因果推論(上・下)、Guido Imbens・Donald Rubin、2023、朝倉書店
入門 統計的因果推論、Judea Pearl他、2019、朝倉書店
ローゼンバウム 統計的因果推論入門: 観察研究とランダム化実験、Paul Rosenbaum、2021、共立出版
政策評価のための因果関係の見つけ方:ランダム化比較試験入門、Esther Duflo他、2019、日本評論社
4.啓蒙書系
「原因と結果」の経済学:データから真実を見抜く思考法、中室牧子・津川友介、2017、ダイヤモンド社
データ分析の力:因果関係に迫る思考法、伊藤公一朗、2017、光文社新書
RCT大全、Andrew Leigh、2020、みすず書房
因果推論の科学:「なぜ?」の問いにどう答えるか、Judea Pearl他、2022、文藝春秋