Rでは、データフレーム内の各列に異なるデータ型(numeric
、character
、factor
など)を持たせることができます。データの処理をする際には、列のデータ型を変更したい場合がよくあります。以下に、いくつかの型変更方法を紹介します。
1. 列のデータ型をnumeric
型に変更
以下の例では、データフレームのage
列を文字列から数値に変換します。
# サンプルデータ
data <- data.frame(
name = c("Alice", "Bob", "Charlie"),
age = c("25", "30", "35")
)
# age列をcharacter型からnumeric型に変換
data$age <- as.numeric(data$age)
# 結果を表示
print(data)
2. 列をfactor
型に変換
factor
型は、カテゴリカルデータを扱うのに便利です。以下は、性別の列をfactor
型に変換する例です。
# サンプルデータ
data <- data.frame(
name = c("Alice", "Bob", "Charlie"),
gender = c("Female", "Male", "Male")
)
# gender列をfactor型に変換
data$gender <- as.factor(data$gender)
# 結果を表示
print(data)
3. 列をcharacter
型に変換
データの表示や処理において、factor
型を文字列(character
型)に戻したい場合は、as.character()
を使います。
# gender列をfactor型からcharacter型に変換
data$gender <- as.character(data$gender)
# 結果を表示
print(data)
4. データフレーム全体の型を確認
データフレーム全体の各列の型を確認するには、str()
関数を使用します。
# データフレームの構造を表示
str(data)
以上が、Rでデータフレーム内の列の型を変更する基本的な方法です。型を適切に変更することで、データの処理や分析をスムーズに行うことができます。
コメント