其实,浮点数是采用科学计数法的方式来表示的,例如十进制小数 1.234,用科学计数法表示,可以有多种方式:
1.234 == 0.1234*10^1
1.234 == 1.234*10^0
1.234 == 12.34*10^(-1)
1.234 == 123.4*10^(-2)我们可以看见,小数点在整数值表达式中的是漂浮不动的,因此我们称之为浮点数。但是在计算机中,数值是以二进制存储的,那在计算机中的浮点数,又是如何存储的呢?
对于我们程序员来说,说到浮点数,大多想到的是float,double,long double等浮点数类型,为什么要设置不同的精度来表示浮点数呢,他们在内存中的存储是有什么不同吗,以上就是我们今天需要探讨的内容
然后我们下滑可以找到具体的不同类型的申明和定义,其中对于float,double,long double等的最大值,最小值以及相关参数都做出了明确的说明
- int main()
- {
- int n = 9;
- float* pFloat = (float*)&n;
- printf("n的值为:%d\n", n);
- printf("*pFloat的值为:%f\n", *pFloat);
- *pFloat = 9.0;
- printf("num的值为:%d\n", n);
- printf("*pFloat的值为:%f\n", *pFloat);
- return 0;
- }
num 和 *pFloat 在内存中明明是同一个数,为什么浮点数和整数的解读结果会差别这么大? 要理解这个结果,就一定要搞懂浮点数在计算机内部的表示方法
V = (-1)^S * M * R^E
S:符号位,取值 0 或 1,决定一个数字的符号,0 表示正,1 表示负M:尾数,用小数表示,例如前面所看到的 1.234 * 10^0,1.234 就是尾数
R:基数,表示十进制数 R 就是 10,表示二进制数 R 就是 2
E:指数,用整数表示,例如前面看到的 10^-1,-1 即是指数
举例来说:十进制的 5.0 ,写成二进制是 101.0 ,相当于 1.01×2^2 。那么,按照上面 V 的格式,可以得出 S=0 , M=1.01 , E=2 。十进制的 -5.0 ,写成二进制是 - 101.0 ,相当于 - 1.01×2^2 。那么, S=1 , M=1.01 , E=2 。
直到1985年,IEEE 组织推出了浮点数标准,就是我们经常听到的 IEEE754 浮点数标准,这个标准统一了浮点数的表示形式,并提供了 2 种浮点格式:
单精度浮点数 float:32 位,符号位 S 占 1 bit,指数 E 占 8 bit,尾数 M 占 23 bit
双精度浮点数 float:64 位,符号位 S 占 1 bit,指数 E 占 11 bit,尾数 M 占 52 bit
尾数 M 的第一位总是 1(因为 1 <= M < 2),因此这个 1 可以省略不写,它是个隐藏位,这样单精度 23 位尾数可以表示了 24 位有效数字,双精度 52 位尾数可以表示 53 位有效数字
指数 E 是个无符号整数,表示 float 时,一共占 8 bit,所以它的取值范围为 0 ~ 255。但因为指数可以是负的,所以规定在存入 E 时在它原本的值加上一个中间数 127,这样 E 的取值范围为 -127 ~ 128。表示 double 时,一共占 11 bit,存入 E 时加上中间数 1023,这样取值范围为 -1023 ~ 1024。
E 不全为 0 或不全为 1这时,浮点数就采用下面的规则表示,即指数E的计算值减去127(或1023),得到真实值,再将 有效数字M前加上第一位的1。比如:
0 01111110 00000000000000000000000
这时,浮点数的指数E等于1-127(或者1-1023)即为真实值, 有效数字M不再加上第一位的1,而是还原为0.xxxxxx的小数。这样做是为了表示±0,以及接近于 0的很小的数字。
我们先来看第二个输出,我们定义的 n 为整形,所以分析如下
我们写出 9 的二进制码:
00000000 00000000 00000000 00001001
0 00000000 00000000000000000001001
那么此时,我们使用 %f 浮点数的方式打印
S = 0
E = -126
M = 0.00000000000000000001001
n = (-1)^0 * 0.00000000000000000001001 * 2^(-126)
我们接下来看第三个输出,我们是使用 9.0 进行的赋值,所以是浮点数的赋值方法
我们写出 9.0 的二进制码
(-1)^0 * 1.001 * 2^3
因为9.0是正数,所以S = 0, 这里的 3 是十进制,转化为二进制就是 10000010, M 就是在001后再补20个比特位(0)
0 10000010 00100000000000000000000
此时我们使用 %d 的整形打印,电脑会认为我们存储的 是整形的补码,然后进行打印
01000001000100000000000000000000 —— 补码
01000001000100000000000000000000 —— 反码
01000001000100000000000000000000 —— 源码
可以看到 1091567616 正好是我们第三个输出的结果
