当前位置:   article > 正文

numpy的dtype,astype_numpy astype

numpy astype

综述:

np类型的a如果直接修改如:a.dtype='int16',那么直接会修改a,会导致长度的不一致,如果要直接修改则要采用astype方法如:b=a.astype('int16'),a保持不变,b的长度等于a,并且type由a变成了int16,或者调用b=np.array(a,dtype='int16'),效果和astype一样。另外b=np.array(a,dtype=np.int16)中的np.int16是一样的

float类型默认float64=float,int类型默认int64=int,uint类型默认uint64=uint。产生数组的时候如果指定,默认就是float64.

很重要:
np.array模型数据类型是float,等于float64,但是pytorch中默认是float32,所以现在转,省的以后转格式。

np.array(matrix, dtype="float32")

开始

>>> import numpy as np

生成一个浮点数组

>>> a = np.random.random(4)

看看信息

  1. >>> a
  2. array([ 0.0945377 , 0.52199916, 0.62490646, 0.21260126])
  3. >>> a.dtype
  4. dtype('float64')
  5. >>> a.shape
  6. (4,)

改变dtype,发现数组长度翻倍!

  1. >>> a.dtype = 'float32'
  2. >>> a
  3. array([ 3.65532693e+20, 1.43907535e+00, -3.31994873e-25,
  4. 1.75549972e+00, -2.75686653e+14, 1.78122652e+00,
  5. -1.03207532e-19, 1.58760118e+00], dtype=float32)
  6. >>> a.shape
  7. (8,)


改变dtype,数组长度再次翻倍!

  1. >>> a.dtype = 'float16'
  2. >>> a
  3. array([ -9.58442688e-05, 7.19000000e+02, 2.38159180e-01,
  4. 1.92968750e+00, nan, -1.66034698e-03,
  5. -2.63427734e-01, 1.96875000e+00, -1.07519531e+00,
  6. -1.19625000e+02, nan, 1.97167969e+00,
  7. -1.60156250e-01, -7.76290894e-03, 4.07226562e-01,
  8. 1.94824219e+00], dtype=float16)
  9. >>> a.shape
  10. (16,)

改变dtype='float',发现默认就是float64,长度也变回最初的4

  1. >>> a.dtype = 'float'
  2. >>> a
  3. array([ 0.0945377 , 0.52199916, 0.62490646, 0.21260126])
  4. >>> a.shape
  5. (4,)
  6. >>> a.dtype
  7. dtype('float64')

把a变为整数,观察其信息

  1. >>> a.dtype = 'int64'
  2. >>> a
  3. array([4591476579734816328, 4602876970018897584, 4603803876586077261,
  4. 4596827787908854048], dtype=int64)
  5. >>> a.shape
  6. (4,)

改变dtype,发现数组长度翻倍!

  1. >>> a.dtype = 'int32'
  2. >>> a
  3. array([ 1637779016, 1069036447, -1764917584, 1071690807, -679822259,
  4. 1071906619, -1611419360, 1070282372])
  5. >>> a.shape
  6. (8,)

改变dtype,发现数组长度再次翻倍!

  1. >>> a.dtype = 'int16'
  2. >>> a
  3. array([-31160, 24990, 13215, 16312, 32432, -26931, -19401, 16352,
  4. -17331, -10374, -197, 16355, -20192, -24589, 13956, 16331], dtype=int16)
  5. >>> a.shape
  6. (16,)

改变dtype,发现数组长度再次翻倍!

  1. >>> a.dtype = 'int8'
  2. >>> a
  3. array([ 72, -122, -98, 97, -97, 51, -72, 63, -80, 126, -51,
  4. -106, 55, -76, -32, 63, 77, -68, 122, -41, 59, -1,
  5. -29, 63, 32, -79, -13, -97, -124, 54, -53, 63], dtype=int8)
  6. >>> a.shape
  7. (32,)

改变dtype,发现整数默认int64!

  1. >>> a.dtype = 'int'
  2. >>> a.dtype
  3. dtype('int64')
  4. >>> a array([4591476579734816328, 4602876970018897584, 4603803876586077261,
  5. 4596827787908854048], dtype=int64)
  6. >>> a.shape
  7. (4,)

二、换一种玩法

很多时候我们用numpy从文本文件读取数据作为numpy的数组,默认的dtype是float64。
但是有些场合我们希望有些数据列作为整数。如果直接改dtype='int'的话,就会出错!原因如上,数组长度翻倍了!!!


下面的场景假设我们得到了导入的数据。我们的本意是希望它们是整数,但实际上是却是浮点数(float64)

  1. >>> b = np.array([1., 2., 3., 4.])
  2. >>> b.dtype
  3. dtype('float64')

用 astype(int) 得到整数,并且不改变数组长度

  1. >>> c = b.astype(int)
  2. >>> c
  3. array([1, 2, 3, 4])
  4. >>> c.shape
  5. (4,)
  6. >>> c.dtype
  7. dtype('int64')

如果直接改变b的dtype的话,b的长度翻倍了,这不是我们想要的(当然如果你想的话)如果是float64转到int64那么长度不变,如果转到int32那么长度就会改变

  1. >>> b
  2. array([ 1., 2., 3., 4.])
  3. >>> b.dtype = 'int32'
  4. >>> b.dtype
  5. dtype('int32')
  6. >>> b
  7. array([         0, 1072693248,          0, 1073741824,          0,
  8.        1074266112,          0, 1074790400], dtype=int32)
  9. >>> b.shape
  10. (8,)

三、结论

numpy中的数据类型转换,不能直接改原数据的dtype!  只能用函数astype()。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/繁依Fanyi0/article/detail/730216
推荐阅读
相关标签
  

闽ICP备14008679号