当前位置:   article > 正文

从零开始编写深度学习库(四)Eigen::Tensor学习使用及代码重构_eigen::tensorfixedsize

eigen::tensorfixedsize

从零开始编写深度学习库(四)Eigen::Tensor学习使用及代码重构

博客http://blog.csdn.net/hjimce

微博黄锦池-hjimce   qq:1393852684

一、构造函数(1)矩阵大小可变构造函数Class Tensor<data_type, rank>

  1. // Create a tensor of rank 3 of sizes 2, 3, 4. This tensor owns
  2. // memory to hold 24 floating point values (24 = 2 x 3 x 4).
  3. Tensor<float, 3> t_3d(2, 3, 4);//构建一个float类型,3维矩阵,每一维的长度分别为(2,3,4)
  4. // Resize t_3d by assigning a tensor of different sizes, but same rank.
  5. t_3d = Tensor<float, 3>(3, 4, 3);
二、构造函数(2)矩阵大小固定构造函数Class TensorFixedSize<data_type, Sizes<size0, size1, ...>>

这个在写代码的时候,就要固定矩阵的大小,不能用变量来指定矩阵大小,编译阶段直接编译固定大小的矩阵。相比于Tensor可变大小,其计算速度比较快。

  1. // Create a 4 x 3 tensor of floats.
  2. TensorFixedSize<float, Sizes<4, 3>> t_4x3;
三、构造函数(3)数据初始化构造函数TensorMap<Tensor<data_type, rank>>(data, size0, size1, ...),参数data:要初始化的数据数组地址,(size0,size1,……)矩阵每一维的长度,rank:矩阵的维度。

需要注意的是,该构造函数并没有在内存中另外拷贝一份data中的数据,而仅仅是数据指针映射,所以一旦构造,该tensor矩阵也是大小不可变的。

  1. // Map a tensor of ints on top of stack-allocated storage.
  2. int storage[128]; // 2 x 4 x 2 x 8 = 128
  3. TensorMap<Tensor<int, 4>> t_4d(storage, 2, 4, 2, 8);//构造一个int类型,大小为(2,4,2,8)的四维矩阵,数据从storage中映射,没有拷贝数据
  4. // The same storage can be viewed as a different tensor.
  5. // You can also pass the sizes as an array.
  6. TensorMap<Tensor<int, 2>> t_2d(storage, 16, 8);
  7. // You can also map fixed-size tensors. Here we get a 1d view of
  8. // the 2d fixed-size tensor.
  9. TensorFixedSize<float, Sizes<4, 5>> t_4x3;
  10. TensorMap<Tensor<float, 1>> t_12(t_4x3.data(), 12);

四、tensor元素访问<data_type> tensor(index0, index1...)这个比较简单,直接采用下标小括号访问。


  1. // Set the value of the element at position (0, 1, 0);
  2. Tensor<float, 3> t_3d(2, 3, 4);
  3. t_3d(0, 1, 0) = 12.0f;
  4. // Initialize all elements to random values.
  5. for (int i = 0; i < 2; ++i) {
  6. for (int j = 0; j < 3; ++j) {
  7. for (int k = 0; k < 4; ++k) {
  8. t_3d(i, j, k) = ...some random value...;
  9. }
  10. }
  11. }
  12. // Print elements of a tensor.
  13. for (int i = 0; i < 2; ++i) {
  14. LOG(INFO) << t_3d(i, 0, 0);
  15. }

五、auto自动类型特殊功能:auto只能用于非数值访问表达式,延迟计算,这个类似于深度学习常用库中的符号编程,比如:

  1. Tensor<float, 3> t3 = t1 + t2;
  2. auto t4 = t1 + t2;

t4的数值并没有被真正的计算出来,也不存在内存数值。所以如果要打印t4的具体数值:

  1. Tensor<float, 3> t3 = t1 + t2;
  2. cout << t3(0, 0, 0); // OK prints the value of t1(0, 0, 0) + t2(0, 0, 0)
  3. auto t4 = t1 + t2;
  4. cout << t4(0, 0, 0); // Compilation error!
就会出现编译错误。如果要获取t4的正真数值的时候,我们要具体定义类型类似于变量t3的定义方法。

  1. auto t4 = t1 + t2;
  2. Tensor<float, 3> result = t4; // Could also be: result(t4);这样就能获取t4中的数值了
  3. cout << result(0, 0, 0);

所以如果希望矩阵经过一些列的计算后,到最后才获取具体的结果,可以采用auto:

  1. // One way to compute exp((t1 + t2) * 0.2f);
  2. auto t3 = t1 + t2;
  3. auto t4 = t3 * 0.2f;
  4. auto t5 = t4.exp();
  5. Tensor<float, 3> result = t5;
  6. // Another way, exactly as efficient as the previous one:
  7. Tensor<float, 3> result = ((t1 + t2) * 0.2f).exp();

六、auto符号表达式效率

采用符号表达式,没有计算中间结果,无疑编写更方便,不过有的时候会提高效率,有的时候反而会降低效率,具体得看表达式。如果希望临时计算某个中间结果,可以采用的方法:

  • Assignment to a Tensor, TensorFixedSize, or TensorMap.
  • Use of the eval() method.
  • Assignment to a TensorRef.
(1)Assigning to a Tensor, TensorFixedSize, or TensorMap.

如果已经知道最后的表达式输出矩阵大小,建议采用TensorFixedSize效率更高,比如

  1. auto t3 = t1 + t2; // t3 is an Operation.
  2. auto t4 = t3 * 0.2f; // t4 is an Operation.
  3. auto t5 = t4.exp(); // t5 is an Operation.
  4. Tensor<float, 3> result = t5; // The operations are evaluated.最后一句需要改成如下语句:
TensorFixedSize<float, Sizes<4, 4, 2>> result = t5;

(2)eval()计算中间结果,有的时候效率更高,比如下面的效率比较低:

  1. Tensor<...> X ...;
  2. Tensor<...> Y = ((X - X.maximum(depth_dim).reshape(dims2d).broadcast(bcast))
  3. * beta).exp();
采用先就算出X的最大值,可以减少重复计算,保证maximum()只计算一次 ,大大提高效率

  1. Tensor<...> Y =
  2. ((X - X.maximum(depth_dim).eval().reshape(dims2d).broadcast(bcast))
  3. * beta).exp();

七、减少不必要的计算,采用符号编程,计算指定元素TensorRef。

有的时候,我们并不需要计算一整个输出矩阵,可能我们仅仅想要计算矩阵某个元素的数值而已,如果一整个矩阵计算,然后再拿出具体元素,无疑浪费不必要的计算。

  1. // Create a TensorRef for the expression. The expression is not
  2. // evaluated yet.
  3. TensorRef<Tensor<float, 3> > ref = ((t1 + t2) * 0.2f).exp();
  4. // Use "ref" to access individual elements. The expression is evaluated
  5. // on the fly.
  6. float at_0 = ref(0, 0, 0);
  7. cout << ref(0, 1, 0);
这个类似于稀疏矩阵,如果你要获取一整个矩阵,建议不要用这个,效率反而更低。

八、硬件、多线程、指令集等加速设置devices:在默认情况下,是采用cpu单线程,比如下面的代码:

  1. Tensor<float, 2> a(30, 40);
  2. Tensor<float, 2> b(30, 40);
  3. Tensor<float, 2> c = a + b;

此时C的计算,默认是cpu 单线程。可以通过设置device,指定运行设备:

  1. DefaultDevice my_device;
  2. c.device(my_device) = a + b;
device可选参数:DefaultDevice, ThreadPoolDevice 、GpuDevice三个类的对象。设置device,必须知道c的大小。

采用多线程,线程池:

  1. // Create the Eigen ThreadPoolDevice.
  2. Eigen::ThreadPoolDevice my_device(4 /* number of threads to use */);
  3. // Now just use the device when evaluating expressions.
  4. Eigen::Tensor<float, 2> c(30, 50);
  5. c.device(my_device) = a.contract(b, dot_product_dims);
九、一些常用的函数API

1、矩阵的维度:int NumDimensions

  1. Eigen::Tensor<float, 2> a(3, 4);
  2. cout << "Dims " << a.NumDimensions;
  3. => Dims 2

2、矩阵形状:Dimensions dimensions()

  1. Eigen::Tensor<float, 2> a(3, 4);
  2. const Eigen::Tensor<float, 2>::Dimensions& d = a.dimensions();
  3. cout << "Dim size: " << d.size << ", dim 0: " << d[0]
  4. << ", dim 1: " << d[1];
  5. => Dim size: 2, dim 0: 3, dim 1: 4
3、获取指定维度大小: Index dimension(Index n)

  1. Eigen::Tensor<float, 2> a(3, 4);
  2. int dim1 = a.dimension(1);
  3. cout << "Dim 1: " << dim1;
  4. => Dim 1: 4
4、获取矩阵元素个数: Index size()

  1. Eigen::Tensor<float, 2> a(3, 4);
  2. cout << "Size: " << a.size();
  3. => Size: 12
十、矩阵初始化API

1、所有元素初始化:setConstant(const Scalar& val),用于把一个矩阵的所有元素设置成一个指定的常数。

  1. a.setConstant(12.3f);
  2. cout << "Constant: " << endl << a << endl << endl;
  3. =>
  4. Constant:
  5. 12.3 12.3 12.3 12.3
  6. 12.3 12.3 12.3 12.3
  7. 12.3 12.3 12.3 12.3
  1. Eigen::Tensor<string, 2> a(2, 3);
  2. a.setConstant("yolo");
  3. cout << "String tensor: " << endl << a << endl << endl;
  4. =>
  5. String tensor:
  6. yolo yolo yolo
  7. yolo yolo yolo

2、全部置零:setZero()

3、从列表、数据初始化:setValues({..initializer_list})

  1. Eigen::Tensor<float, 2> a(2, 3);
  2. a.setValues({{0.0f, 1.0f, 2.0f}, {3.0f, 4.0f, 5.0f}});
  3. cout << "a" << endl << a << endl << endl;
  4. =>
  5. a
  6. 0 1 2
  7. 3 4 5
如果给定的数组数据,少于矩阵元素的个数,那么后面不足的元素其值不变:

  1. Eigen::Tensor<int, 2> a(2, 3);
  2. a.setConstant(1000);
  3. a.setValues({{10, 20, 30}});
  4. cout << "a" << endl << a << endl << endl;
  5. =>
  6. a
  7. 10 20 30
  8. 1000 1000 1000
4、随机初始化: setRandom()

  1. a.setRandom();
  2. cout << "Random: " << endl << a << endl << endl;
  3. =>
  4. Random:
  5. 0.680375 0.59688 -0.329554 0.10794
  6. -0.211234 0.823295 0.536459 -0.0452059
  7. 0.566198 -0.604897 -0.444451 0.257742
当然也可以设置指定的随机生成器,类似于python 的 random seed。也可以选择初始化方法:

  • UniformRandomGenerator
  • NormalRandomGenerator
5、数据指针: Scalar* data() and const Scalar* data() const,一般用于与其它库、类型数据转换的时候使用,比如opencv mat类型等

  1. Eigen::Tensor<float, 2> a(3, 4);
  2. float* a_data = a.data();
  3. a_data[0] = 123.45f;
  4. cout << "a(0, 0): " << a(0, 0);
  5. => a(0, 0): 123.45
十一、Tensor对象常用成员函数

1、构造相同形状的矩阵,数值初始化为val:constant(const Scalar& val)

  1. Eigen::Tensor<float, 2> a(2, 3);
  2. a.setConstant(1.0f);
  3. Eigen::Tensor<float, 2> b = a + a.constant(2.0f);
  4. Eigen::Tensor<float, 2> c = b * b.constant(0.2f);
  5. cout << "a" << endl << a << endl << endl;
  6. cout << "b" << endl << b << endl << endl;
  7. cout << "c" << endl << c << endl << endl;
  8. =>
  9. a
  10. 1 1 1
  11. 1 1 1
  12. b
  13. 3 3 3
  14. 3 3 3
  15. c
  16. 0.6 0.6 0.6
  17. 0.6 0.6 0.6
2、构造形状相同,数值随机初始化:

  1. Eigen::Tensor<float, 2> a(2, 3);
  2. a.setConstant(1.0f);
  3. Eigen::Tensor<float, 2> b = a + a.random();
  4. cout << "a" << endl << a << endl << endl;
  5. cout << "b" << endl << b << endl << endl;
  6. =>
  7. a
  8. 1 1 1
  9. 1 1 1
  10. b
  11. 1.68038 1.5662 1.82329
  12. 0.788766 1.59688 0.395103
十二、运算符操作:这些操作都是element wise 操作

除了加减乘除之外,还有逻辑运算:

  • operator&&(const OtherDerived& other)
  • operator||(const OtherDerived& other)
  • operator<(const OtherDerived& other)
  • operator<=(const OtherDerived& other)
  • operator>(const OtherDerived& other)
  • operator>=(const OtherDerived& other)
  • operator==(const OtherDerived& other)
  • operator!=(const OtherDerived& other)
两个矩阵的逻辑运算返回的都是布尔类型矩阵。

十三、选择运算:Selection (select(const ThenDerived& thenTensor, const ElseDerived& elseTensor)

  1. Tensor<bool, 3> if = ...;
  2. Tensor<float, 3> then = ...;
  3. Tensor<float, 3> else = ...;
  4. Tensor<float, 3> result = if.select(then, else);
如果if矩阵中的对应元素为1,那么返回的矩阵的对应元素选择then中对应的元素值,否则选择else中的元素值。



















声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小小林熬夜学编程/article/detail/79216
推荐阅读
相关标签
  

闽ICP备14008679号