因果推論入門〜ミックステープ:基礎から現代的アプローチまで
書籍情報
発売日 : 2023年05月09日
著者/編集 : Scott Cunningham/加藤真大/河中祥吾/白木紀行/冨田燿志/早川裕太
出版社 : 技術評論社
発行形態 : 単行本
書籍説明
内容紹介
DAG、潜在アウトカム因果モデル、マッチング、回帰不連続デザイン、操作変数法、パネルデータ分析、差分の差デザイン、合成コントロール法。「因果推論×プログラミング」による研究デザイン入門の決定版。
目次
第1章 導入
■1.1 因果推論とは何か
■1.2 相関と因果を混同してはいけない
■1.3 最適化はすべてを内生化する
■1.4 例:需要の価格弾力性の識別
■1.5 まとめ
第2章 確率と回帰の概要
■2.1 確率論の基礎
■2.2 事象と条件付き確率
■2.3 確率木
■2.4 ベン図と集合
■2.5 分割表
■2.6 Monty Hall問題
■2.7 総和オペレータ
■2.8 期待値
■2.9 分散
■2.10 共分散
■2.11 母集団モデル
■2.12 平均独立
■2.13 最小二乗法
■2.14 OLSの代数的な性質
■2.15 適合度
■2.16 OLSの期待値
■2.17 繰り返し期待値の法則
■2.18 CEF分解の性質
■2.19 CEF予測の性質
■2.20 分散分析定理
■2.21 線形CEF定理
■2.22 最良線形予測定理
■2.23 回帰CEF定理
■2.24 それで?
■2.25 回帰解剖定理
■2.26 OLS推定量の分散
■2.27 頑健標準誤差
■2.28 クラスタ頑健標準誤差
第3章 非巡回的有向グラフ
■3.1 DAG 記法の紹介
■■3.1.1 シンプルなDAG
■■3.1.2 合流
■■3.1.3 バックドア基準
■■3.1.4 合流点バイアスの他の例
■■3.1.5 差別と合流点バイアス
■■3.1.6 標本選択と合流点バイアス
■■3.1.7 合流点バイアスと警察の実力行使
■3.2 まとめ
第4章 潜在アウトカム因果モデル
■■4.0.1 統計的推論
■4.1 物理的なランダム化
■■4.1.1 潜在アウトカム
■■4.1.2 平均処置効果
■■4.1.3 平均アウトカムの単純差
■■4.1.4 独立性の仮定
■■4.1.5 SUTVA
■4.2 ランダム化推論
■■4.2.1 紅茶を試飲する女性
■■4.2.2 Fisherのシャープな帰無仮説の方法
■■4.2.3 p値へのステップ
■■4.2.4 例
■■4.2.5 そのほかの検定統計量
■■4.2.6 大きなnのもとでのランダム化推論
■■4.2.7 レバレッジ
■4.3 まとめ
第5章 マッチングと層別化
■5.1 層別化
■■5.1.1 背景
■■5.1.2 識別のための仮定
■■5.1.3 層別化の練習:タイタニックデータセット
■■5.1.4 次元の呪い
■5.2 完全マッチング
■5.3 近似マッチング
■■5.3.1 最近傍共変量マッチング
■■5.3.2 バイアス補正
■■5.3.3 傾向スコア法
■■5.3.4 事例:NSWの職業訓練プログラム
■■5.3.5 傾向スコアによる重み付け
■■5.3.6 最近傍マッチング
■■5.3.7 粗い完全マッチング
■5.4 まとめ
第6章 回帰不連続デザイン
■6.1 回帰不連続デザインの大流行
■■6.1.1 復活を待つ
■■6.1.2 RDDのグラフ表現
■■6.1.3 百聞は一見に如かず
■■6.1.4 RDDのデータ要件
■6.2 RDDの推定
■■6.2.1 シャープRDD
■■6.2.2 連続性の仮定
■■6.2.3 ローカルおよびグローバルな最小二乗回帰を用いた推定
■■6.2.4 ノンパラメトリックカーネル
■■6.2.5 メディケアと国民皆保険
■■6.2.6 推論
■■6.2.7 ファジーRDD
■6.3 識別への挑戦
■■6.3.1 McCraryの密度検定
■■6.3.2 共変量バランステストとプラセボテスト
■■6.3.3 ランニング変数上での非ランダムな集中
■6.4 人気のデザインを再現する:接戦選挙
■■6.4.1 再現演習
■■6.4.2 接戦選挙デザインについての結論
■6.5 回帰屈折デザイン
■6.6 まとめ
第7章 操作変数
■7.1 操作変数の歴史:父と息子
■7.2 操作変数の直感的説明
■■7.2.1 標準的な操作変数のDAG
■■7.2.2 良い操作変数とは奇妙であるべし
■7.3 均質な処置効果
■■7.3.1 2段階最小二乗法
■7.4 親のメタンフェタミン乱用と里親制度
■7.5 弱い操作変数の問題
■7.6 異質な処置効果
■7.7 応用例
■■7.7.1 居住する郡にある大学
■■7.7.2 フルトン魚市場
■7.8 有名な操作変数デザイン
■■7.8.1 抽選
■■7.8.2 裁判官固定効果
■■7.8.3 バーティク操作変数
■■7.8.4 シフトvsシェア
■7.9 まとめ
第8章 パネルデータ
■8.1 DAGの例
■8.2 推定
■■8.2.1 プールされたOLS
■■8.2.2 固定効果(群内)推定量
■■8.2.3 識別のための仮定
■■8.2.4 注意1:固定効果は逆の因果関係を解決できない
■■8.2.5 注意2:固定効果は時間を通じて変化する未観測の異質性に対処できない
■■8.2.6 結婚のリターンと未観測の異質性
■8.3 演習:成人向けサービス提供者の調査
■8.4 まとめ
第9章 差分の差デザイン
■9.1 John Snowのコレラ仮説
■■9.1.1 表XII
■9.2 推定
■■9.2.1 簡単な表による説明
■■9.2.2 単純な2 × 2差分の差デザイン
■■9.2.3 差分の差デザインと最低賃金
■9.3 推論
■■9.3.1 ブロックブートストラップ
■■9.3.2 集計
■■9.3.3 クラスタリング
■9.4 イベントスタディや平行リードによる平行トレンドの証拠の提供
■■9.4.1 処置前の平行トレンドのもとで差分の差デザインの係数について、(一つでは足りないと思ったので)もう一つ余計なことを書いておきます
■■9.4.2 処置群とコントロール群の処置前バランスのチェック
■■9.4.3 アフォーダブルケアアクト、メディケイドの拡大と人口死亡率
■9.5 差分の差デザインの識別戦略におけるプラセボの重要性
■■9.5.1 三重差分デザイン
■■9.5.2 州が義務付ける出産手当金
■■9.5.3 中絶合法化と長期的な淋病の発生率
■■9.5.4 Cunningham and Cornwell(2013)を超えて
■■9.5.5 批判としてのプラセボ
■■9.5.6 繰り返しクロスセクションデータにおける構成の変化
■■9.5.7 最終的な考察
■9.6 異なるタイミングでの処置をともなう二元配置固定効果
■■9.6.1 Bacon分解定理
■■9.6.2 分解の潜在アウトカムによる表現
■■9.6.3 分散で重み付けられたATT
■■9.6.4 分散で重み付けられた共通トレンド
■■9.6.5 時間上でのATT の異質性によるバイアス!
■■9.6.6 城の原則法と殺人事件
■■9.6.7 Cheng and Hoekstra(2013)の再現のようなもの
■■9.6.8 Bacon分解
■■9.6.9 差分の差デザインの未来
■9.7 まとめ
第10章 合成コントロール法
■10.1 比較事例分析の導入
■■10.1.1 キューバ、マイアミ、そしてマリエルボートリフト
■■10.1.2 合成コントロールを選ぶ
■■10.1.3 定式化
■■10.1.4 カリフォルニア州プロポジション99
■■10.1.5 反証
■10.2 刑務所の建設と黒人男性の収容
■10.3 まとめ
第11章 結論
■1.1 因果推論とは何か
■1.2 相関と因果を混同してはいけない
■1.3 最適化はすべてを内生化する
■1.4 例:需要の価格弾力性の識別
■1.5 まとめ
第2章 確率と回帰の概要
■2.1 確率論の基礎
■2.2 事象と条件付き確率
■2.3 確率木
■2.4 ベン図と集合
■2.5 分割表
■2.6 Monty Hall問題
■2.7 総和オペレータ
■2.8 期待値
■2.9 分散
■2.10 共分散
■2.11 母集団モデル
■2.12 平均独立
■2.13 最小二乗法
■2.14 OLSの代数的な性質
■2.15 適合度
■2.16 OLSの期待値
■2.17 繰り返し期待値の法則
■2.18 CEF分解の性質
■2.19 CEF予測の性質
■2.20 分散分析定理
■2.21 線形CEF定理
■2.22 最良線形予測定理
■2.23 回帰CEF定理
■2.24 それで?
■2.25 回帰解剖定理
■2.26 OLS推定量の分散
■2.27 頑健標準誤差
■2.28 クラスタ頑健標準誤差
第3章 非巡回的有向グラフ
■3.1 DAG 記法の紹介
■■3.1.1 シンプルなDAG
■■3.1.2 合流
■■3.1.3 バックドア基準
■■3.1.4 合流点バイアスの他の例
■■3.1.5 差別と合流点バイアス
■■3.1.6 標本選択と合流点バイアス
■■3.1.7 合流点バイアスと警察の実力行使
■3.2 まとめ
第4章 潜在アウトカム因果モデル
■■4.0.1 統計的推論
■4.1 物理的なランダム化
■■4.1.1 潜在アウトカム
■■4.1.2 平均処置効果
■■4.1.3 平均アウトカムの単純差
■■4.1.4 独立性の仮定
■■4.1.5 SUTVA
■4.2 ランダム化推論
■■4.2.1 紅茶を試飲する女性
■■4.2.2 Fisherのシャープな帰無仮説の方法
■■4.2.3 p値へのステップ
■■4.2.4 例
■■4.2.5 そのほかの検定統計量
■■4.2.6 大きなnのもとでのランダム化推論
■■4.2.7 レバレッジ
■4.3 まとめ
第5章 マッチングと層別化
■5.1 層別化
■■5.1.1 背景
■■5.1.2 識別のための仮定
■■5.1.3 層別化の練習:タイタニックデータセット
■■5.1.4 次元の呪い
■5.2 完全マッチング
■5.3 近似マッチング
■■5.3.1 最近傍共変量マッチング
■■5.3.2 バイアス補正
■■5.3.3 傾向スコア法
■■5.3.4 事例:NSWの職業訓練プログラム
■■5.3.5 傾向スコアによる重み付け
■■5.3.6 最近傍マッチング
■■5.3.7 粗い完全マッチング
■5.4 まとめ
第6章 回帰不連続デザイン
■6.1 回帰不連続デザインの大流行
■■6.1.1 復活を待つ
■■6.1.2 RDDのグラフ表現
■■6.1.3 百聞は一見に如かず
■■6.1.4 RDDのデータ要件
■6.2 RDDの推定
■■6.2.1 シャープRDD
■■6.2.2 連続性の仮定
■■6.2.3 ローカルおよびグローバルな最小二乗回帰を用いた推定
■■6.2.4 ノンパラメトリックカーネル
■■6.2.5 メディケアと国民皆保険
■■6.2.6 推論
■■6.2.7 ファジーRDD
■6.3 識別への挑戦
■■6.3.1 McCraryの密度検定
■■6.3.2 共変量バランステストとプラセボテスト
■■6.3.3 ランニング変数上での非ランダムな集中
■6.4 人気のデザインを再現する:接戦選挙
■■6.4.1 再現演習
■■6.4.2 接戦選挙デザインについての結論
■6.5 回帰屈折デザイン
■6.6 まとめ
第7章 操作変数
■7.1 操作変数の歴史:父と息子
■7.2 操作変数の直感的説明
■■7.2.1 標準的な操作変数のDAG
■■7.2.2 良い操作変数とは奇妙であるべし
■7.3 均質な処置効果
■■7.3.1 2段階最小二乗法
■7.4 親のメタンフェタミン乱用と里親制度
■7.5 弱い操作変数の問題
■7.6 異質な処置効果
■7.7 応用例
■■7.7.1 居住する郡にある大学
■■7.7.2 フルトン魚市場
■7.8 有名な操作変数デザイン
■■7.8.1 抽選
■■7.8.2 裁判官固定効果
■■7.8.3 バーティク操作変数
■■7.8.4 シフトvsシェア
■7.9 まとめ
第8章 パネルデータ
■8.1 DAGの例
■8.2 推定
■■8.2.1 プールされたOLS
■■8.2.2 固定効果(群内)推定量
■■8.2.3 識別のための仮定
■■8.2.4 注意1:固定効果は逆の因果関係を解決できない
■■8.2.5 注意2:固定効果は時間を通じて変化する未観測の異質性に対処できない
■■8.2.6 結婚のリターンと未観測の異質性
■8.3 演習:成人向けサービス提供者の調査
■8.4 まとめ
第9章 差分の差デザイン
■9.1 John Snowのコレラ仮説
■■9.1.1 表XII
■9.2 推定
■■9.2.1 簡単な表による説明
■■9.2.2 単純な2 × 2差分の差デザイン
■■9.2.3 差分の差デザインと最低賃金
■9.3 推論
■■9.3.1 ブロックブートストラップ
■■9.3.2 集計
■■9.3.3 クラスタリング
■9.4 イベントスタディや平行リードによる平行トレンドの証拠の提供
■■9.4.1 処置前の平行トレンドのもとで差分の差デザインの係数について、(一つでは足りないと思ったので)もう一つ余計なことを書いておきます
■■9.4.2 処置群とコントロール群の処置前バランスのチェック
■■9.4.3 アフォーダブルケアアクト、メディケイドの拡大と人口死亡率
■9.5 差分の差デザインの識別戦略におけるプラセボの重要性
■■9.5.1 三重差分デザイン
■■9.5.2 州が義務付ける出産手当金
■■9.5.3 中絶合法化と長期的な淋病の発生率
■■9.5.4 Cunningham and Cornwell(2013)を超えて
■■9.5.5 批判としてのプラセボ
■■9.5.6 繰り返しクロスセクションデータにおける構成の変化
■■9.5.7 最終的な考察
■9.6 異なるタイミングでの処置をともなう二元配置固定効果
■■9.6.1 Bacon分解定理
■■9.6.2 分解の潜在アウトカムによる表現
■■9.6.3 分散で重み付けられたATT
■■9.6.4 分散で重み付けられた共通トレンド
■■9.6.5 時間上でのATT の異質性によるバイアス!
■■9.6.6 城の原則法と殺人事件
■■9.6.7 Cheng and Hoekstra(2013)の再現のようなもの
■■9.6.8 Bacon分解
■■9.6.9 差分の差デザインの未来
■9.7 まとめ
第10章 合成コントロール法
■10.1 比較事例分析の導入
■■10.1.1 キューバ、マイアミ、そしてマリエルボートリフト
■■10.1.2 合成コントロールを選ぶ
■■10.1.3 定式化
■■10.1.4 カリフォルニア州プロポジション99
■■10.1.5 反証
■10.2 刑務所の建設と黒人男性の収容
■10.3 まとめ
第11章 結論
著者情報
Scott Cunningham
Cunningham, Scott, 1956-1993
加藤 真大
加藤, 真大
加藤真大
東京大学経済学研究科を中退後、2020年に東京大学情報理工学系研究科を修了。2020年株式会社サイバーエージェントに入社。機械学習や計量経済学の手法の研究開発に従事。
河中祥吾
2021年奈良先端科学技術大学院大学先端技術研究科博士課程修了後、サイバーエージェント入社。小売領域におけるグロースマーケティングに向けた分析・効果検証およびデータ基盤構築に従事。
河中, 祥吾
河中 祥吾
白木紀行
2009年慶應義塾大学大学院修士課程修了後、日本銀行入行。日本経済や金融市場の分析・予測、金融政策や国際金融規制の効果検証などに携わる。2021年株式会社サイバーエージェント入社。Data Science Center小売DXLab室長として、機械学習や統計モデリングの手法を用いたコンサルティング・研究に従事。2023年より厚生労働省政策企画官として、EBPMや統計業務の改善に取り組む。
白木, 紀行
白木 紀行
冨田 燿志
冨田, 燿志
冨田燿志
2019年東京大学大学院経済学研究科修士課程修了、2020年サイバーエージェント入社。AI Lab経済学社会実装チームにて、マーケットデザインの研究・社会実装に取り組む。主な興味分野は、ゲーム理論、マッチング理論、マーケットデザイン、およびそれらの応用・社会実装。
早川裕太
2019年東京工業大学情報理工学院修士課程修了後、サイバーエージェント入社。アドテク領域にて分析及び研究開発に従事。2020年より小売との協業事業において、POSデータを活用した広告配信プロダクトの立ち上げに参画。現在も小売企業のデータを用いたデジタルマーケティングの改善やリテールメディア化の推進に取り組む。
早川 裕太
早川, 裕太
兵頭亮介
2021年早稲田大学基幹理工学研究科修士課程修了後、サイバーエージェント入社。小売との協業事業において、データサイエンスや機械学習の応用に取り組む。主な興味は、定量・定性データおよび機械学習を用いた産業領域のグロース。
兵頭 亮介
兵頭, 亮介
藤田 光明
藤田, 光明
藤田光明
2018年東京大学経済学研究科修士課程修了後、サイバーエージェント入社。AI事業本部Dynalystにて広告配信アルゴリズムの開発・実装やチームマネジメント、研究開発に従事し、研究組織AI Labとの共著論文はWWWなどの国際学会に採択。現在は小売DX領域にて、経済学を活用した新規事業の立ち上げ中。
邊土名 朝飛
邊土名, 朝飛
邊土名朝飛
2021年長岡技術科学大学大学院工学研究科修士課程修了後、サイバーエージェント入社。同子会社の株式会社AI Shift、およびAI Labにて音声対話システムの研究開発に従事。
森脇大輔
2006年東京大学経済学部卒業、内閣府入府。経済対策のとりまとめ、国会対応、経済財政白書や月例経済報告の作成、統計改革などに携わる。2017年株式会社サイバーエージェントに中途入社。研究開発組織AI Labにおいて、経済学やデータサイエンス、機械学習を用いたアルゴリズム開発、社会実装プロジェクトを実施。2021年より経済学社会実装チームリーダー。EBPM推進のためのプラットフォーム「EBPMデータベース」管理人。経済学博士(ニューヨーク州立大学アルバニー校)。著書:『少子高齢社会における世代間移転と家族』(共著、日本評論社, 2020年)
森脇, 大輔
森脇 大輔
安井翔太
2011年、立教大学経済学部卒業。2013年、ノルウェー経済大学修士課程修了後、サイバーエージェント入社。入社後は広告代理店で広告効果検証等を行い、2015年にアドテクスタジオへ異動。その後は機械学習の応用や、機械学習が使われている状況下でのデータ分析や効果検証を主な業務とする。2016年よりAI Lab経済学グループを設立。2019年よりData Science Center副所長も務める。2022年より主席データサイエンティスト。著書:『効果検証入門』(技術評論社、2020年)『施策デザインのための機械学習入門』(技術評論社、2021年)
安井, 翔太
安井 翔太