統計学の誤用や望ましい作法#
Recommendations for accurate reporting in medical research statistics#
医学分野における統計分析の推奨事項
量的変数は平均・標準偏差かmedianとIQRを報告する。分析に使う表やヒストグラムの補足資料を提供する。
すべてのモデルの仮定を確認する(可能であればグラフを使用して)
p値は0.05や0.01などの水準で二分化せず、そのままの値を表示する(たとえば、p 値 0.032 は、p<0.05 ではなく、p=0.032 とする)ただし、不等式 p<0.0001 を使用すると、非常に小さな p 値を報告できる
区間推定値内のすべての効果が臨床的に重要でない場合を除き、結果を効果がないと報告しない
95% CI との関連性を適切に推定し、臨床的重要性に基づいて結果を解釈する
有意性検定ではなく、背景情報をもとに交絡因子を認識して因果DAG(causal directed acyclic graphs)として説明する。
欠損データの割合が結果に影響を与える可能性があるほど高い場合は、単に不完全なレコードを破棄するだけではない方法 (欠損確率の逆重み付けや多重代入など) を使用する
その目的のために開発された手法を使用して、比率推定におけるまばらなデータの偏りを評価し、処理する
結果の頻度が高い場合は、オッズ比ではなく、リスク比またはリスク差を報告する
モデルが乗法的であっても、加法的な相互作用を評価する
Statistics Done Wrong(『ダメな統計学』)#
日本語書籍:ダメな統計学 - 株式会社 勁草書房
p-hacking、多重検定
平均への回帰
交絡
相関と因果
シンプソンのパラドックス