統計学の誤用や望ましい作法#

Recommendations for accurate reporting in medical research statistics#

Mansournia, M. A., & Nazemipour, M. (2024). Recommendations for accurate reporting in medical research statistics. The Lancet, 403(10427), 611-612.

医学分野における統計分析の推奨事項

  • 量的変数は平均・標準偏差かmedianとIQRを報告する。分析に使う表やヒストグラムの補足資料を提供する。

  • すべてのモデルの仮定を確認する(可能であればグラフを使用して)

  • p値は0.05や0.01などの水準で二分化せず、そのままの値を表示する(たとえば、p 値 0.032 は、p<0.05 ではなく、p=0.032 とする)ただし、不等式 p<0.0001 を使用すると、非常に小さな p 値を報告できる

  • 区間推定値内のすべての効果が臨床的に重要でない場合を除き、結果を効果がないと報告しない

  • 95% CI との関連性を適切に推定し、臨床的重要性に基づいて結果を解釈する

  • 有意性検定ではなく、背景情報をもとに交絡因子を認識して因果DAG(causal directed acyclic graphs)として説明する。

  • 欠損データの割合が結果に影響を与える可能性があるほど高い場合は、単に不完全なレコードを破棄するだけではない方法 (欠損確率の逆重み付けや多重代入など) を使用する

  • その目的のために開発された手法を使用して、比率推定におけるまばらなデータの偏りを評価し、処理する

  • 結果の頻度が高い場合は、オッズ比ではなく、リスク比またはリスク差を報告する

  • モデルが乗法的であっても、加法的な相互作用を評価する

Statistics Done Wrong(『ダメな統計学』)#

Statistics Done Wrong

日本語書籍:ダメな統計学 - 株式会社 勁草書房

  • p-hacking、多重検定

  • 平均への回帰

  • 交絡

  • 相関と因果

  • シンプソンのパラドックス