赞
踩
(感谢知乎大神的解惑)
上一篇博客引了一个有趣的位运算算法,可以通过位运算大致算出一个浮点数的平方根,虽然查找了相关资料,但是还是对原理有些困惑。
下面是代码:
float sqrt3(const float x)
{
union
{
int i;
float x;
} u;
u.x = x;
u.i = (1 << 29) + (u.i >> 1) - (1 << 22);
return u.x;
}
这个方法的误差还是有的(而且有点大)
首先,C中union 的存储方法与struct不同,union只存储一个成员变量,union的存储大小为字节对齐后所需空间最“大”的成员。
这个函数中的i(int),x(float)共用一个32位存储空间
一个浮点数由两部分组成:底数M和指数E,底数部分占用23bit使用二进制数来表示浮点数的实际值;指数部分占用8bit,第一位来表示正负,所以指数部分范围为(-126~128)
再通过指数部分的值来调整底数部分的值,如果指数为负,则左移,反而反之
所以一个浮点数可以表示为
x=(-1)^s * (2^E) * M
这个算法的思想就是将E缩小为原来的一半,所以结果就是开方
(指数部分必须减去127才是真正的指数)
所以让新的e为当前e的一半,可以列下列方程
2(x - 127) = (x` - 127)
解得x = x`/2 + 63
至此,发现原算法中u.i>>1可以实现/2,(1<<29) - (1<<22) 为63
u.i>>1不仅把指数也右移了,也把尾数右移了,所以导致结果只是一个近似值
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。