こちらの論文を読みながらCausal impactを考えます
Martín Cervantes PA, Cruz Rambaud S. An empirical approach to the “Trump Effect” on US financial markets with causal-impact Bayesian analysis. Heliyon. 2020;6(8):e04760. Published 2020 Aug 26. doi:10.1016/j.heliyon.2020.e04760
目次
Causal Impact
- 定義: Causal Impactは、ベイジアン時系列モデルを使用して、介入の因果効果を推定するための手法です。
- モデル: ローカル線形トレンドモデルや季節性を考慮したモデルなど、データの特性に応じて柔軟にモデルを選択することができます。
- 特徴:
- ベイジアンアプローチを使用するため、推定の不確実性を信頼区間として明示的に示すことができる。
- データの特性やトレンドに応じてモデルを柔軟に適応させることができる。
ITSとCausal impactの使い分けは?
Interrupted Time Series Analysis(ITS analysis)
- 定義: ITSは、介入前と介入後の時系列データのトレンドやレベルの変化を評価するための統計的手法です。
- モデル: 通常、線形回帰モデルを使用して、介入の効果を推定します。
- 特徴:
- 介入の前後でのトレンドやレベルの変化を直接的に評価する。
- モデルの仮定や形状は固定的であり、データの特性に応じて柔軟に変更することが難しい場合がある。
比較と優位性
- 柔軟性: Causal Impactは、ベイジアンモデリングのアプローチを採用しているため、データの特性やトレンドに応じてモデルを柔軟に適応させることができます。また、適切な共変数を設定することで介入以外の因子を調整することも可能です。一方、ITSは固定的なモデル形状を持つことが多い。そのため、介入による遅効性のトレンド変化を正確に捉えることが難しいなどの問題点がある。後付の恣意的な介入地点、介入要素の決定も問題となる。(有意になる線引をしてしまう可能性がある)
- 不確実性の評価: Causal Impactは、ベイジアンアプローチの特性上、推定の不確実性を信頼区間として明示的に示すことができます。これに対して、ITSでは不確実性の評価が直接的ではない場合があります。
- 適用範囲: 両者ともに、介入の因果効果を評価するための手法として広く使用されていますが、データの特性や問題の性質に応じて最適な手法を選択することが重要です。
- 明確さ:Causal impactは効果の積分により効果の積算を明確にするとともに、時系列中の効果を時点ごとに観察できるため、視認性が高いです。また効果量が%で算出可能です。一方で、ITSでは即時効果(グラフの切片)と持続性効果(グラフの傾き)に分けて考えられるため、理解が容易であり、即時効果の高いモデルについては主張が明確になり得ます。
結論として、Causal Impactは、データの特性に応じてモデルを柔軟に適応させることができる点や、不確実性の評価が明確である点で、ITSAと比較して優位性を持っていると言えます。
例えば、Interrupted time series analysisは線形トレンドを仮定しているため、持続的な介入など、非線形トレンドが予測されるものに対しては不適切なモデル設定になり得ます。
具体的な研究や分析の目的に応じて、どちらの手法が適切であるかを検討することが必要です。
DIDとCausal impactの使い分けは?
Difference-in-Differences(DID)
- 基本的なアイディア: 介入群と非介入群の間で、介入の前後の変化を比較することで、介入の効果を推定します。
- データ要件: 介入群と非介入群の両方のデータが必要です。
- 仮定: DIDの推定は、平行トレンド仮定(介入の前に、介入群と非介入群のトレンドが平行であること)に基づいています。
- 適用範囲: クロスセクションデータやパネルデータに適用されることが多い。
比較と優位性
- データ要件: DIDは、介入群と非介入群の両方のデータが必要ですが、Causal Impactは主に介入群のデータだけで推定を行うことができます。
- 仮定: DIDの平行トレンド仮定は、実際のデータで確認することが難しい場合があります。一方、Causal Impactの仮定は、使用する時系列モデルの特性に依存します。
- 適用範囲: DIDはクロスセクションデータやパネルデータに適していますが、Causal Impactは時系列データに特に適しています。
結論として、DIDは介入群、非介入群の両方のデータが必要で、更にそれらの非介入前の平行トレンドが必要とされるのに対し、Causal impactは介入群のデータのみで分析可能です。完全な非介入群を対照と出来ない場合はCausal impactが有用です。
ただし、Causal impactは介入以外の要素がない事を仮定した効果量となるため、共変数を用いて合成コントロールする事で適切なモデル設定になっているか考える必要があります。
やはり具体的な研究や分析の目的に応じて、どちらの手法が適切であるかを検討することが重要です。
誤りがありましたら是非教えて頂ければ幸いです
タグ: Rstats, 論文作成