三群以上のデータを比較する場合には、t検定ではなく分散分析(ANOVA)を使用します。ANOVAは、複数の群の平均値がすべて同じかどうかを検定する方法です。この記事では、Rを使って三群のパラメトリック検定を行う方法を紹介します。
1. 一元配置分散分析(One-way ANOVA)
一元配置分散分析は、1つの独立変数(要因)を持つ場合に使用されます。たとえば、3つのグループ間で平均値が異なるかどうかを検定する際に用います。
# データの作成
group1 <- rnorm(30, mean = 5)
group2 <- rnorm(30, mean = 6)
group3 <- rnorm(30, mean = 7)
# データを1つのデータフレームにまとめる
data <- data.frame(
value = c(group1, group2, group3),
group = factor(rep(c("group1", "group2", "group3"), each = 30))
)
# 一元配置分散分析の実行
anova_result <- aov(value ~ group, data = data)
summary(anova_result)
上記のコードでは、三群(group1, group2, group3)の平均が同じかどうかを検定しています。`summary(anova_result)`で、分散分析の結果を確認できます。
2. 事後検定(TukeyのHSD検定)
ANOVAが有意であることが確認された場合、どのグループ間に差があるのかを調べるために事後検定を行います。TukeyのHSD検定は、この目的に広く使用される方法です。
# 事後検定(TukeyのHSD検定)
TukeyHSD(anova_result)
`TukeyHSD(anova_result)`は、各グループ間のペア比較を行い、有意な差があるかどうかを確認できます。
3. 分散の等質性の確認
ANOVAを行う前提条件として、各グループの分散が等しい(等分散性)ことが求められます。Rでは`bartlett.test`関数を用いて等分散性を検定することができます。
# バートレット検定による等分散性の確認
bartlett.test(value ~ group, data = data)
この検定でp値が有意でない場合、分散は等しいと判断されます。
まとめ
三群以上の比較には、t検定の代わりに分散分析(ANOVA)を使用します。ANOVAの結果が有意であれば、TukeyのHSD検定などの事後検定を行い、どのグループ間に有意差があるのかを確認します。事前に分散の等質性を確認することも重要です。
コメント