当前位置:   article > 正文

R语言学习笔记10-向量-矩阵-数组-数据框-列表对比

R语言学习笔记10-向量-矩阵-数组-数据框-列表对比

在R语言中,对于常用的数据结构:向量、矩阵、数组、数据框和列表,它们在数据处理和分析中各有不同的应用和特点,有时候在理解上会容易搞混,所以打算单独整理下他们的结构对比,用于加深理解

向量(Vector)

向量是R中最基本的数据结构,可存储相同类型的元素

  • 格式示例:
# 数值型向量
numeric_vector <- c(1, 2, 3, 4, 5)

# 字符型向量
character_vector <- c("Alice", "Bob", "Charlie")
> numeric_vector
[1] 1 2 3 4 5
> character_vector
[1] "Alice"   "Bob"     "Charlie"
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 特点:
    • 只能包含同一种数据类型的元素
    • 可以是数值型、字符型、逻辑型等

矩阵(Matrix)

矩阵是由相同数据类型的元素按行列组成的二维数据结构

  • 格式示例:
# 创建一个3行2列的数值型矩阵
numeric_matrix <- matrix(1:6, nrow = 3, ncol = 2)

# 创建一个2行3列的字符型矩阵
character_matrix <- matrix(c("A", "B", "C", "D", "E", "F"), nrow = 2, ncol = 3)    
> numeric_matrix
     [,1] [,2]
[1,]    1    4
[2,]    2    5
[3,]    3    6
> character_matrix
     [,1] [,2] [,3]
[1,] "A"  "C"  "E" 
[2,] "B"  "D"  "F" 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 特点:
    • 所有元素必须是相同的数据类型
    • 可以通过行和列来访问元素

数组(Array)

数组是由相同类型的元素组成的多维数据结构

  • 格式示例:
# 创建一个3维数组,每维度为2x2的数值型数组
numeric_array <- array(1:12, dim = c(2, 2, 3))
> numeric_array
, , 1

     [,1] [,2]
[1,]    1    3
[2,]    2    4

, , 2

     [,1] [,2]
[1,]    5    7
[2,]    6    8

, , 3

     [,1] [,2]
[1,]    9   11
[2,]   10   12
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 特点:
    • 可以有多个维度,每个维度可以有不同的长度
    • 所有元素必须是相同的数据类型

数据框(Data Frame)

数据框是R中常用的二维表格型数据结构,类似于数据库中的表格,每列可以是不同类型的数据(例如数值、字符、因子等)

  • 格式示例:
# 创建一个数据框
df <- data.frame(
  name = c("Alice", "Bob", "Charlie"),
  age = c(25, 30, 28),
  gender = c("F", "M", "M")
)
> df
     name age gender
1   Alice  25      F
2     Bob  30      M
3 Charlie  28      M
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 特点:
    • 可以存储不同类型的数据
    • 列名可以用来访问列数据

列表(List)

列表是一种复合数据结构,可以包含不同类型的数据对象,每个元素可以是向量、矩阵、数据框或其他列表等

  • 格式示例:
# 创建一个列表
my_list <- list(
  numeric_vector = c(1, 2, 3),
  character_vector = c("Alice", "Bob", "Charlie"),
  numeric_matrix = matrix(1:4, nrow = 2),
  df = data.frame(
    name = c("Alice", "Bob"),
    age = c(25, 30)
  )
)
> my_list
$numeric_vector
[1] 1 2 3

$character_vector
[1] "Alice"   "Bob"     "Charlie"

$numeric_matrix
     [,1] [,2]
[1,]    1    3
[2,]    2    4

$df
   name age
1 Alice  25
2   Bob  30
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 特点:
    • 可以包含不同类型和结构的元素
    • 可以通过名称或索引来访问每个元素

综合分析和对比

  • 存储内容:

    • 向量、矩阵和数组主要用于存储数值、字符等基本数据类型
    • 数据框用于存储表格型数据,每列可以有不同的数据类型
    • 列表则是一种更为灵活的结构,可以混合存储各种数据类型和结构
  • 访问方式:

    • 向量、矩阵、数组通过索引来访问元素
    • 数据框通过列名或列索引来访问列数据
    • 列表通过名称或索引来访问每个元素,元素可以是任意R对象
  • 应用场景:

    • 使用向量、矩阵和数组进行数值计算和统计分析
    • 使用数据框进行数据整理、分析和可视化
    • 使用列表对复杂的数据结构进行管理和操作,适合于存储和传递不同类型的数据对象
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/一键难忘520/article/detail/902628
推荐阅读
相关标签
  

闽ICP备14008679号