因果探索の精度指標

因果探索の精度指標#

人工データで実験する場合は真のDAGがわかるため、真のDAGと推定したDAGとの一致具合を定量評価するための指標が提案されている。

まとめ#

基礎概念#

  • 真陽性(True Positive: TP): 正しい方向で推定されたエッジ

  • 真陰性(True Negative: TN): 推定したグラフにも真のグラフにも存在しないエッジ

  • 偽陽性(False Positive: FP): 推定したグラフにはあるが真のグラフには存在しないエッジ

  • 偽陰性(False Negative: FN): 推定したグラフにはないが真のグラフには存在するエッジ

名称

定義

真陽性率 (True Positive Rate: TPR)

\(\dfrac{TP}{TP + FN}\)

偽陽性率 (False Positive Rate: FPR)

\(\dfrac{\text{reverse} + FP}{TN + FP}\)

適合率 (Precision)

\(\dfrac{TP}{TP + FP}\)

再現率 (Recall)

\(\dfrac{TP}{TP + FN}\)

F1 Score

\(2 \times \dfrac{\text{適合率} \times \text{再現率}}{\text{適合率} + \text{再現率}}\)

偽発見率 (False Discovery Rate: FDR)

\(\dfrac{\text{reverse} + FP}{TP + FP}\)

誤りの総数 (No. of Non-Negative Entries: NNZ)

\(TP + FP\)

構造ハミング距離 (Structural Hamming Distance: SHD)

不正確なエッジの数を合計したもの。小さいほど正解に近くなる指標

G-Score

\(\dfrac{TP - FP}{TP + FN}\) もしくは \(0\) のうち最大値の大きいほう

構造ハミング距離#

不正解のエッジの数を合計したもの。

具体的には、

  1. 余分なエッジ

  2. 欠落したエッジ

  3. 誤った方向のエッジ

の合計

G-Score#

TPからFPを引いた数と0の最大値を正例の数(TP+FN)で割ったもの。

\[ \mathrm{G-Score} = \frac{\max\big(0, (TP-FP)\big)}{TP+FN} \]

FPが多いと分子が減る → G-Scoreは誤検出(FP)へのペナルティをかけているペナルティつきRecall

参考#