当前位置:   article > 正文

【算法/数论】欧拉筛法详解:过程详述、正确性证明、复杂度证明

欧拉筛法

一、什么是筛法

筛法就是求出小于等于 n n n的所有素数的方法,在数论中发挥着很大的作用。

二、欧拉筛法详解

筛法进行复杂度优化,所采用的一个惯用思路是:找到一个素数后,就将它的倍数标记为合数,也就是把它的倍数“筛掉”;如果一个数没有被比它小的素数“筛掉”,那它就是素数。欧拉筛法的大致思路也是如此,就是其中有些细节有差异。欧拉筛法拥有线性的复杂度,而且编码较简单,应用十分广泛。

我们先给出代码:

bool isprime[MAXN]; // isprime[i]表示i是不是素数
int prime[MAXN]; // 现在已经筛出的素数列表
int n; // 上限,即筛出<=n的素数
int cnt; // 已经筛出的素数个数

void euler()
{
    memset(isprime, true, sizeof(isprime)); // 先全部标记为素数
    isprime[1] = false; // 1不是素数
    for(int i = 2; i <= n; ++i) // i从2循环到n(外层循环)
    {
        if(isprime[i]) prime[++cnt] = i;
        // 如果i没有被前面的数筛掉,则i是素数
        for(int j = 1; j <= cnt && i * prime[j] <= n; ++j)
        // 筛掉i的素数倍,即i的prime[j]倍
        // j循环枚举现在已经筛出的素数(内层循环)
        {
            isprime[i * prime[j]] = false;
            // 倍数标记为合数,也就是i用prime[j]把i * prime[j]筛掉了
            if(i % prime[j] == 0) break;
            // 最神奇的一句话,如果i整除prime[j],退出循环
            // 这样可以保证线性的时间复杂度
        }
    }
}
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25

假设要筛出n以内的素数。我们先把所有数标记为素数。枚举i2n,所以因为i是从小到大的,如果i没有被前面的数(比它小的数)标记为合数,那i就是素数,加入素数列表。现在用i来筛后面的数,枚举已经筛出来的素数prime[j]j=1~cnt),标记i * prime[j]为合数,当iprime[j]的倍数时退出循环,i++

思路很简单,也很莫名其妙。首先我们看似无法保证每个合数都被筛掉,也无法保证复杂度为线性(因为有两层循环)。要解决这些问题,必须经过深入的思考。

三、欧拉筛法正确性的证明

假设我们要筛掉合数 a a a,且 a a a的最小质因数为 p 1 p_1 p1,令 a = p 1 b a=p_1b a=p1b。那么显然 b < a b<a b<a b b b先被外层循环碰到。现在 b b b要筛掉它的倍数。因为 p 1 p_1 p1 a a a的最小质因数,所以 b b b的最小质因数必不小于 p 1 p_1 p1,这样就保证 b b b筛掉 a a a前不会在if(i % prime[j] == 0) break;处跳出循环。即使 b b b的最小质因数等于 p 1 p_1 p1,也会先筛掉 a a a后再退出循环。这样就保证了每个合数都会被筛掉。

四、欧拉筛法时间复杂度的证明

欧拉筛法的时间、空间复杂度为 Θ ( n ) \Theta(n) Θ(n)。空间复杂度是显然的。下面证明时间复杂度为线性。

我们的核心就是要证明一个合数只会被筛掉一次,即标记isprime[它]=1一次。首先,对于 a = p 1 b a=p_1b a=p1b b b b当然只会筛掉 a a a一次,因为我们从小到大枚举prime[j],也就是说b * prime[j]递增,因此不可能遇到 a a a两次。会不会有其他的数筛掉 a a a呢?假设 a a a又被 c c c筛掉了,其中 a = p x c a=p_xc a=pxc p x p_x px就是 c c c用来筛掉 a a aprime[j]
①若 c > b c>b c>b,则 p x < p 1 p_x<p_1 px<p1,与 p 1 p_1 p1 a a a最小的质因数矛盾,假设不成立;
②若 c < b c<b c<b,则 p x > p 1 p_x>p_1 px>p1,这意味着 p 1 p_1 p1 c c c的质因数。那么 c c c从小到大筛掉它的素数倍,在筛到 p 1 c p_1c p1c时就break了,所以根本轮不到 a a a

综上所述,每个数都只会被筛掉一次,再加上外层的i的循环是线性复杂度,总的时间复杂度是线性的。

感性地理解:一开始i很小的时候一次能筛掉很多素数,后面超过 n 2 \frac n2 2n之后就几乎不用做什么事情了。所以虽然有两层循环,把每次循环加起来还是线性的复杂度。


这个算法远远没有埃拉托斯特尼筛法直观,需要细细品味。不过背过板子就好啦。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/酷酷是懒虫/article/detail/947503
推荐阅读
相关标签
  

闽ICP备14008679号