Rでロジスティック回帰を行う方法【R備忘録】


ロジスティック回帰は、二値の結果を予測するための統計的手法です。Rを使ってロジスティック回帰モデルを作成し、データを解析する方法について説明します。

スポンサーリンク

必要なパッケージ

まず、ロジスティック回帰を実行するために必要なパッケージをロードします。基本的にはstatsパッケージが標準で提供されていますが、データの前処理やモデルの評価にdplyrcaretなどのパッケージも役立ちます。

library(dplyr)
library(caret)
スポンサーリンク

データの準備

例として、Rの組み込みデータセットであるmtcarsを使用し、車の重量(wt)と馬力(hp)を基に、車が自動(am = 1)か手動(am = 0)かを予測します。

data("mtcars")
mtcars <- mtcars %>%
  mutate(am = factor(am, levels = c(0, 1), labels = c("Manual", "Automatic")))
スポンサーリンク

ロジスティック回帰モデルの作成

glm()関数を使用してロジスティック回帰モデルを作成します。family = binomialを指定することで、ロジスティック回帰を行うことができます。

model <- glm(am ~ wt + hp, data = mtcars, family = binomial)
スポンサーリンク

モデルの概要を確認する

summary()関数でモデルの詳細な結果を確認します。

summary(model)
スポンサーリンク

モデルの予測を行う

モデルを使用して新しいデータに対する予測を行います。

predictions <- predict(model, newdata = mtcars, type = "response")
predicted_class <- ifelse(predictions > 0.5, "Automatic", "Manual")
スポンサーリンク

モデルの評価

実際の値と予測値を比較して、モデルの精度を評価します。

confusionMatrix(data = factor(predicted_class, levels = c("Manual", "Automatic")),
                reference = mtcars$am)
スポンサーリンク

まとめ

ロジスティック回帰は、二値の結果を予測するために非常に有効な手法です。Rを使えば簡単にモデルを構築し、予測を行うことができます。ぜひ、さまざまなデータセットで試してみてください。


コメント

タイトルとURLをコピーしました