【算法/数论】欧拉筛法详解：过程详述、正确性证明、复杂度证明

作者：酷酷是懒虫 | 2024-08-08 10:00:41

踩

欧拉筛法

文章目录

一、什么是筛法

筛法就是求出小于等于 $n$ 的所有素数的方法，在数论中发挥着很大的作用。

二、欧拉筛法详解

筛法进行复杂度优化，所采用的一个惯用思路是：找到一个素数后，就将它的倍数标记为合数，也就是把它的倍数“筛掉”；如果一个数没有被比它小的素数“筛掉”，那它就是素数。欧拉筛法的大致思路也是如此，就是其中有些细节有差异。欧拉筛法拥有线性的复杂度，而且编码较简单，应用十分广泛。

我们先给出代码：

bool isprime[MAXN]; // isprime[i]表示i是不是素数
int prime[MAXN]; // 现在已经筛出的素数列表
int n; // 上限，即筛出<=n的素数
int cnt; // 已经筛出的素数个数

void euler()
{
    memset(isprime, true, sizeof(isprime)); // 先全部标记为素数
    isprime[1] = false; // 1不是素数
    for(int i = 2; i <= n; ++i) // i从2循环到n（外层循环）
    {
        if(isprime[i]) prime[++cnt] = i;
        // 如果i没有被前面的数筛掉，则i是素数
        for(int j = 1; j <= cnt && i * prime[j] <= n; ++j)
        // 筛掉i的素数倍，即i的prime[j]倍
        // j循环枚举现在已经筛出的素数（内层循环）
        {
            isprime[i * prime[j]] = false;
            // 倍数标记为合数，也就是i用prime[j]把i * prime[j]筛掉了
            if(i % prime[j] == 0) break;
            // 最神奇的一句话，如果i整除prime[j]，退出循环
            // 这样可以保证线性的时间复杂度
        }
    }
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

假设要筛出n以内的素数。我们先把所有数标记为素数。枚举i从2到n，所以因为i是从小到大的，如果i没有被前面的数（比它小的数）标记为合数，那i就是素数，加入素数列表。现在用i来筛后面的数，枚举已经筛出来的素数prime[j]（j=1~cnt），标记i * prime[j]为合数，当i是prime[j]的倍数时退出循环，i++。

思路很简单，也很莫名其妙。首先我们看似无法保证每个合数都被筛掉，也无法保证复杂度为线性（因为有两层循环）。要解决这些问题，必须经过深入的思考。

三、欧拉筛法正确性的证明

假设我们要筛掉合数 $a$ ，且 $a$ 的最小质因数为 $p_1$ ，令 $a=p_1b$ 。那么显然 $b < a$ ， $b$ 先被外层循环碰到。现在 $b$ 要筛掉它的倍数。因为 $p_1$ 是 $a$ 的最小质因数，所以 $b$ 的最小质因数必不小于 $p_1$ ，这样就保证 $b$ 筛掉 $a$ 前不会在if(i % prime[j] == 0) break;处跳出循环。即使 $b$ 的最小质因数等于 $p_1$ ，也会先筛掉 $a$ 后再退出循环。这样就保证了每个合数都会被筛掉。

四、欧拉筛法时间复杂度的证明

欧拉筛法的时间、空间复杂度为 $\Theta(n)$ 。空间复杂度是显然的。下面证明时间复杂度为线性。

我们的核心就是要证明一个合数只会被筛掉一次，即标记isprime[它]=1一次。首先，对于 $a=p_1b$ ， $b$ 当然只会筛掉 $a$ 一次，因为我们从小到大枚举prime[j]，也就是说b * prime[j]递增，因此不可能遇到 $a$ 两次。会不会有其他的数筛掉 $a$ 呢？假设 $a$ 又被 $c$ 筛掉了，其中 $a=p_xc$ ， $p_x$ 就是 $c$ 用来筛掉 $a$ 的prime[j]。
①若 $c > b$ ，则 $p_x<p_1$ ，与 $p_1$ 是 $a$ 最小的质因数矛盾，假设不成立；
②若 $c < b$ ，则 $p_x>p_1$ ，这意味着 $p_1$ 是 $c$ 的质因数。那么 $c$ 从小到大筛掉它的素数倍，在筛到 $p_1c$ 时就break了，所以根本轮不到 $a$ 。

综上所述，每个数都只会被筛掉一次，再加上外层的i的循环是线性复杂度，总的时间复杂度是线性的。

感性地理解：一开始i很小的时候一次能筛掉很多素数，后面超过 $\frac n2$ 之后就几乎不用做什么事情了。所以虽然有两层循环，把每次循环加起来还是线性的复杂度。

这个算法远远没有埃拉托斯特尼筛法直观，需要细细品味。不过背过板子就好啦。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/酷酷是懒虫/article/detail/947503