# 因果探索の精度指標

人工データで実験する場合は真のDAGがわかるため、真のDAGと推定したDAGとの一致具合を定量評価するための指標が提案されている。

## まとめ

#### 基礎概念

- **真陽性（True Positive: TP）**： 正しい方向で推定されたエッジ
- **真陰性（True Negative: TN）**： 推定したグラフにも真のグラフにも存在しないエッジ
- **偽陽性（False Positive: FP）**： 推定したグラフにはあるが真のグラフには存在しないエッジ
- **偽陰性（False Negative: FN）**： 推定したグラフにはないが真のグラフには存在するエッジ


| 名称                                                | 定義                                                         |
| --------------------------------------------------- | ------------------------------------------------------------ |
| 真陽性率 (True Positive Rate: TPR)                  | $\dfrac{TP}{TP + FN}$                                        |
| 偽陽性率 (False Positive Rate: FPR)                 | $\dfrac{\text{reverse} + FP}{TN + FP}$                       |
| 適合率 (Precision)                                  | $\dfrac{TP}{TP + FP}$                                        |
| 再現率 (Recall)                                     | $\dfrac{TP}{TP + FN}$                                        |
| F1 Score                                            | $2 \times \dfrac{\text{適合率} \times \text{再現率}}{\text{適合率} + \text{再現率}}$ |
| 偽発見率 (False Discovery Rate: FDR)                | $\dfrac{\text{reverse} + FP}{TP + FP}$                       |
| 誤りの総数 (No. of Non-Negative Entries: NNZ)       | $TP + FP$                                                    |
| 構造ハミング距離 (Structural Hamming Distance: SHD) | 不正確なエッジの数を合計したもの。小さいほど正解に近くなる指標 |
| G-Score                                             | $\dfrac{TP - FP}{TP + FN}$ もしくは $0$ のうち最大値の大きいほう |

## 構造ハミング距離

不正解のエッジの数を合計したもの。

具体的には、

1. 余分なエッジ
2. 欠落したエッジ
3. 誤った方向のエッジ

の合計

## G-Score

TPからFPを引いた数と0の最大値を正例の数（TP+FN）で割ったもの。

$$
\mathrm{G-Score} = \frac{\max\big(0, (TP-FP)\big)}{TP+FN}
$$

FPが多いと分子が減る → **G-Scoreは誤検出（FP）へのペナルティをかけているペナルティつきRecall**

## 参考

- [metrics — gCastle documentation](https://gcastle-test.readthedocs.io/en/latest/castle/castle.metrics.html)
