赞
踩
多维数组是一种用于存储多维数据的数据结构,与矩阵相似但可以具有超过两个维度
1. 多维数据结构:可以是三维、四维甚至更高维度的数据结构,由多个维度的索引组成
2. 统计和科学计算:适用于存储和操作高维数据,例如立方体数据(三维数组)、四维数据集等
3. 元素访问和运算:支持类似于矩阵的索引和运算,但需要指定多个维度
可使用 array() 函数创建多维数组, 其中dim对应单词dimension,表示纬度
array(data, dim = c(dim1, dim2, ...))
其中 data 是数组的元素,dim 是一个向量,指定数组每个维度的大小
# 创建一个三维数组
arr <- array(1:24, dim = c(2, 3, 4))
print(arr)
输出:
, , 1 [,1] [,2] [,3] [1,] 1 3 5 [2,] 2 4 6 , , 2 [,1] [,2] [,3] [1,] 7 9 11 [2,] 8 10 12 , , 3 [,1] [,2] [,3] [1,] 13 15 17 [2,] 14 16 18 , , 4 [,1] [,2] [,3] [1,] 19 21 23 [2,] 20 22 24
与矩阵类似,可以使用索引访问和操作多维数组的元素
# 访问多维数组元素
element <- arr[1, 2, 3] # 访问第一行,第二列,第三层的元素
print(element) # 输出 15
# 修改多维数组元素
arr[1, 2, 3] <- 100
print(arr[1, 2, 3]) # 输出 100
可对多维数组进行类似于矩阵的运算,如加法、乘法等
# 创建两个三维数组
arr1 <- array(1:24, dim = c(2, 3, 4))
arr2 <- array(24:1, dim = c(2, 3, 4))
# 加法运算
arr_sum <- arr1 + arr2
print(arr_sum)
可以使用 dim() 函数获取多维数组的维度信息
# 获取多维数组的维度
arr_dims <- dim(arr1)
print(arr_dims) # 输出 2 3 4,表示 2 行 3 列 4 层
可使用 abind 包中的函数将多个数组按照指定的维度进行合并,或者使用索引进行拆分
library(abind) # 合并多个数组 arr1 <- array(1:12, dim = c(2, 3, 2)) arr2 <- array(13:24, dim = c(2, 3, 2)) arr_combined <- abind(arr1, arr2, along = 3) print(arr_combined) # 输出: # , , 1 # # [,1] [,2] [,3] # [1,] 1 3 5 # [2,] 2 4 6 # # , , 2 # # [,1] [,2] [,3] # [1,] 7 9 11 # [2,] 8 10 12 # # , , 3 # # [,1] [,2] [,3] # [1,] 13 15 17 # [2,] 14 16 18 # # , , 4 # # [,1] [,2] [,3] # [1,] 19 21 23 # [2,] 20 22 24 # 拆分多维数组 arr_split <- arr_combined[, , 1:2] print(arr_split)
along 参数指定了沿着哪个维度合并数组,也就是说它确定了在合并多个数组时,这些数组如何沿着指定的维度进行对齐和连接,这里 along = 3 意味着 arr1 和 arr2 在第三维度(也就是在层数或深度上)进行合并
可对多维数组的元素进行逻辑判断和条件筛选,获取满足条件的子集
# 逻辑操作
arr1 <- array(1:12, dim = c(2, 3, 2))
# 判断大于 5 的元素
arr_above_5 <- arr1[arr1 > 5]
print(arr_above_5)
可使用 aperm() 函数进行多维数组的转置操作,或使用 array_reshape() 函数重新调整数组的维度结构
# 旋转数组
arr_rotated <- aperm(arr1, c(3, 2, 1)) # 交换第1维和第3维
print(arr_rotated)
# 翻转数组的某一维
arr_flipped <- arr1[, , 2:1] # 翻转第3维
print(arr_flipped)
# 重塑数组维度
arr_reshaped <- array_reshape(arr1, c(3, 4))
print(arr_reshaped )
可对多维数组的每个元素应用函数或进行逐元素的数学操作
# 应用函数到每个元素
arr_squared <- arr1 ^ 2
# 逐元素加法
arr_sum <- arr1 + 10
R 提供了多维数组的统计函数,这些函数可对特定维度进行汇总计算,如求和、均值、最大值、最小值等
# 计算每层的均值
mean_per_layer <- apply(arr1, c(1, 2), mean)
print(mean_per_layer)
# 计算每列的总和
sum_per_column <- apply(arr1, 2, sum)
print(sum_per_column)
可使用 for 循环遍历数组的各个维度来进行更复杂的操作
# 计算每个切片的均值
for (i in 1:dim(arr1)[3]) {
slice_mean <- mean(arr1[, , i])
print(paste("Mean of slice", i, "is", slice_mean))
}
reshape2 包提供了 melt() 和 dcast() 函数来处理和转换数据结构
library(reshape2)
# 将多维数组转换为长格式数据框
melted_arr <- melt(arr1)
print(melted_arr)
# 从长格式数据框转换回多维数组
arr_recast <- dcast(melted_arr, Var1 + Var2 ~ Var3, value.var = "value")
print(arr_recast)
purrr 包提供了功能强大的工具来对数组进行复杂的函数操作
library(purrr)
# 对每个切片应用函数
apply_fun <- map(arr1, ~mean(.x)) # 计算每个切片的均值
print(apply_fun)
可对数组进行条件筛选,并根据条件对元素进行修改
# 将小于 5 的元素替换为 0
arr1[arr1 < 5] <- 0
print(arr1)
可以利用逻辑子集选择对数组进行筛选
# 获取第一个切片中大于 4 的元素
arr_subset <- arr1[ , , 1][arr1[ , , 1] > 4]
print(arr_subset)
data.table 包提供了高效的数据处理能力,可以用于对数组数据的处理和分析
library(data.table)
# 将数组转换为 data.table
dt <- as.data.table(arr1, keep.rownames = TRUE)
print(dt)
# 使用 data.table 进行操作
dt_summary <- dt[, .(Sum = sum(V1)), by = rn]
print(dt_summary)
tidyverse 包提供了强大的数据处理功能,可以用于对数组进行复杂的数据转换操作
library(tidyverse)
# 将数组转换为 tibble
arr_tibble <- tibble::as_tibble(arr1, .name_repair = "minimal")
print(arr_tibble)
# 使用 dplyr 对 tibble 进行数据操作
arr_summary <- arr_tibble %>%
group_by(dim1, dim2) %>%
summarize(mean_value = mean(value))
print(arr_summary)
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。