検定の有意水準について

Chi-Square Test for the Variance 論文作成

両側検定と片側検定の違いとは?
については以下のサイトなど既に詳しく沢山書かれているので是非読んでみてください
https://toukeigaku-jouhou.info/2018/02/01/difference-between-two-sided-and-one-sided-test/

ここでは少し掘り下げてみたいと思います

一般的に検定では5%有意差が用いられます
両側検定では5%有意差を使うとすると、片側検定でも5%を使うのは適切と言えるのでしょうか?
私の知見では不適切となります

こちらのガイドラインStatistical Principles for Clinical Trialsでは片側検定では2.5%を使う事が推奨されています
  The approach of setting type I errors for one-sided tests at half the conventional type I error used in two-sided tests is preferable in regulatory settings.

片側検定をあえて使う場面が無いので普段意識されない事も多いかと思いますが、場合によっては致命的になり得るポイントです

有意水準は
両側検定では5%、片側検定では2.5%

そもそも有意水準については5%で良いのか、という議論もあるようですが…

では何が両側検定で何が片側検定なのか?
という疑問に当たりませんか?
調べてみました
統計の専門家ではありませんので不確かな情報でぜひ校正をお願いしたいと思います

調べた限りは

  • 片側検定になるもの:カイ二乗検定、またロジスティック回帰
  • 両側検定になるもの:正規分布やt検定で連続値を見たり、二項分布で何らかの検定する場合

日本語で言うとこのような印象ですが
ここのリンクでのカイ二乗検定の議論を見るとそもそも片側検定、両側検定の定義とは、に行き当たります

統計的テキスト解析(11)~テキストにおける分割表の分析~
カイ二乗検定 グラフ 引用あり

カイ二乗検定のグラフ形状からupper tailのみを検定しているためone-tailed testと言えるが、対立仮説の設定によってはtwo-sided testである可能性はあると言及されています

ただし一番スコアの良い回答ではカイ二乗検定は適合度の検定のためそもそもtwo-sided testを考えるのはナンセンスと言っています

sideとtailを明確に使い分けるのが理解に役立つかもしれません
日本語だと常に「両側・片側」のみで話が混同してるものか多いので参考にしづらそうです

カイ二乗分布の統計量は「食い違いの測度」で分子が偏差の二乗になっているのでtwo-sidedもone-sidedも同じ(食い違いは絶対値で表されている)
強いて言えばone-tailed testという事なのでしょうか?(読者に投げかけるスタイル)

アメリカのNational institute of standards and technologyという、計測値の標準を管理してる公的機関の解説では、左右両方のsideとtailを含めた解説がありました
https://www.itl.nist.gov/div898/handbook/eda/section3/eda358.htm

ロジスティック回帰のwald統計量もカイ二乗分布の統計量なので、ロジスティック回帰のsideについても理解が深まるようです
私はまだその深淵に辿り着いていません

私の偉大な師匠曰く

カイ二乗分布の統計量と、wald統計量の形を並べて眺めてみると、分母・分子の全体の形が似ています
Σ(偏差の二乗)÷〇〇
カイ二乗は平均、Wald統計量は分散で、違うやん…となるのですが、統計の式変形マジックあるあるで、平均値=2×分散と変換できるため、自由度pのカイ二乗統計量=Wald統計量となります


ガンマ分布使った詳しいカイ二乗の解説
wald統計量とはバイナリーデータで使うカイ二乗分布の食い違いの測度計算が、離散値から連続値に一般化されたもの

なるほど分からん
分かったような気もするけど分からん
誰か教えてください

コメント

タイトルとURLをコピーしました