ロジスティック回帰は、二値の結果を予測するための統計的手法です。Rを使ってロジスティック回帰モデルを作成し、データを解析する方法について説明します。
必要なパッケージ
まず、ロジスティック回帰を実行するために必要なパッケージをロードします。基本的にはstats
パッケージが標準で提供されていますが、データの前処理やモデルの評価にdplyr
やcaret
などのパッケージも役立ちます。
library(dplyr)
library(caret)
データの準備
例として、Rの組み込みデータセットであるmtcars
を使用し、車の重量(wt
)と馬力(hp
)を基に、車が自動(am = 1
)か手動(am = 0
)かを予測します。
data("mtcars")
mtcars <- mtcars %>%
mutate(am = factor(am, levels = c(0, 1), labels = c("Manual", "Automatic")))
ロジスティック回帰モデルの作成
glm()
関数を使用してロジスティック回帰モデルを作成します。family = binomial
を指定することで、ロジスティック回帰を行うことができます。
model <- glm(am ~ wt + hp, data = mtcars, family = binomial)
モデルの概要を確認する
summary()
関数でモデルの詳細な結果を確認します。
summary(model)
モデルの予測を行う
モデルを使用して新しいデータに対する予測を行います。
predictions <- predict(model, newdata = mtcars, type = "response")
predicted_class <- ifelse(predictions > 0.5, "Automatic", "Manual")
モデルの評価
実際の値と予測値を比較して、モデルの精度を評価します。
confusionMatrix(data = factor(predicted_class, levels = c("Manual", "Automatic")),
reference = mtcars$am)
まとめ
ロジスティック回帰は、二値の結果を予測するために非常に有効な手法です。Rを使えば簡単にモデルを構築し、予測を行うことができます。ぜひ、さまざまなデータセットで試してみてください。