杜教筛
用途
当数论函数求值这种简单题考地太多了,出题人也觉得无聊。于是就开始研究数论函数的和。
如:求下面式子的值。
n∑i=1ϕ(i) (n<1012)
这一类问题就算利用高效的线性筛我们对他也无能为力。甚至分段打表这种奇技淫巧都拿他没办法。因此我们需要采用一些特殊的做法,将时间复杂度优化至线性以下。
这类做法一般有扩展埃氏筛、杜教筛、洲阁筛等等。其中扩展埃氏筛可扩展性最强。但杜教筛在其领域内仍有扩展埃氏筛无法解决的问题。
杜教筛大概起源于网站 Project Euler,并由 DuYH 引入国内 OI 界。
数论分块
杜教筛的前置技能树并不大,而数论分块是其必备技能之一。
先看如何求前 n 个正整数的约数之和。
n∑i=1σ(i) (n<1016)
当然,我们需要先对公式变形。
n∑i=1σ(i)=n∑i=1j≤n∑i|ji=n∑i=1i⋅⌊ni⌋
这里运用了一个常用的数学技巧,简单说就是换个角度看问题。为了求每个数的约数的和,我们不妨枚举约数,统计有多少个数有这个约数。这也就是第一个等号的来由。
换个角度看问题:下面有 n 堆箱子,第 i 堆的箱子数是 ⌊ni⌋,显然一堆一堆数箱子总数就是 ∑⌊ni⌋。
但是,如果我们横着数每一层有多少箱子,我们同样可以得到一样的结果:
– 第 1 层:n个箱子
– 第 2 层:因为 ∀i∈[1,⌊n2⌋]都有 ⌊ni⌋≥2,所以第二层有 ⌊n2⌋个箱子
– 第 i 层:⌊ni⌋个箱子
所以箱子总数也可以算出是 ∑⌊ni⌋
然而为什么要这样变形呢?因为对于某一段连续的 i,⌊ni⌋的值可能是相同的。总共存在的这样的段数可以证明是 √n级别的。
定理 1:⌊ni⌋的取值有 O(√n)个
证明 1:对于任意相邻的 i,j∈[1,√n],⌊ni⌋和 ⌊nj⌋都是不小于 √n的数。不难看出,⌊ni⌋和 ⌊nj⌋之间的数对应的 ⌊nx⌋不是 i就是 j。因此 ⌊ni⌋的取值在 [1,√n]和 (√n,n]之间分布的数量都不会超过 √n。
这样,对于每一段连续相等的 ⌊ni⌋,直接用该值与对应 i的和相乘即可。
例题:∑ni=1ϕ(i)
杜教筛的精髓便在于利用有关被求和函数的某些容易求和的公式,通过之前说的换个角度看问题的方法求得函数前缀和。
对于欧拉函数的前缀和,我们可以利用欧拉函数的一个性质:
∑d|nϕ(d)=n
这个性质可以看成是:ϕ(n)=n−∑d|n,d<nϕ(d),即将 n减去所有与他不互质的数的个数,就是与他互质的数的个数。设 S(n)=∑ni=1ϕ(i)。
有了这个性质,我们可以知道:
n∑i=1∑d|iϕ(d)=n⋅(n+1)2
利用之前说过的" 换个角度" 法,可以推出:
n∑i=1∑d|iϕ(d)=n∑d=1⌊nd⌋⋅ϕ(d)=n∑i=1⌊ni⌋∑j=1ϕ(j)
因此:
S(n)=n∑i=1ϕ(i)=n⋅(n+1)2−n∑i=2⌊ni⌋∑j=1ϕ(j)=n⋅(n+1)2−n∑i=2S(⌊ni⌋)
这里,原问题 S(n)被分解为了 √n 个子问题的和,可以证明,这时时间复杂度已经小于 O(n) 了,约为 O(n34)。
复杂度证明:
我们使用同一法来简单证明。总时间复杂度可以看成是所有在递归过程中出现过的 n 对应的时间复杂度的和。
显然并不是每一个 [1,n] 之间的数都出现了,具体哪些出现了呢?大致是所有 ⌊ni⌋
在每个 ⌊ni⌋上花费的时间又是 O(√⌊ni⌋) 的,因此:
T(n)=√n∑i=1√ni+√i
显然这个式子中 √i 的项每一项都不大于 √ni 的项,因此可以忽略。那么
T(n)=√n∑i=1√ni≤∫√n1√n√x=2√n√√n=O(n34)
进一步优化,我们可以让时间复杂度减少到 O(n23)
如果我们用线性筛预处理出前 O(nt) 个 S 的值,那么上面的积分适就可以写成:
∫n1−t1√n√x=O(n1−0.5t)
显然,当 O(nt)=O(n1−0.5t) 时时间复杂度最优,为 O(n23),t 取 23。
例题:∑ni=1μ(i)
同样的,我们找一个与 μ 有关的容易求和的公式:
∑d|nμ(d)=[n=1]
与之前的步骤一样:
n∑i=1∑d|iμ(d)=n∑i=1S(⌊ni⌋)
所以
S(n)=1−n∑i=2S(⌊ni⌋)
但是也要注意,并不是所有函数都可以利用一个有关整除的求和公式就可以了,有时还是需要对函数性质细致的分析得到一些稍微奇怪一点但是依旧可以用的公式。
题目
1. 莫比乌斯函数之和 (51nod1244)
公式推导已在上文中给出,下面只给出代码
2. 循环之美 (NOI2016)
给定 n,m,k,求有多少对 i,j 满足 ij在 k 进制下是纯循环小数 (n,m≤109,k≤2000)。
题目可以转化为:
n∑i=1m∑j=1[(i,j)==1]⋅[(j,k)==1]
这个公式有多种变形方式,可以从两个方括号中的任意一个入手。下面给出直接从第二个方括号入手的解答。
f(n,m,k)=n∑i=1m∑j=1[(i,j)==1]⋅[(j,k)==1]=∑d|kμ(d)n∑i=1⌊md⌋∑j=1[(i,jd)=1]=∑d|kμ(d)n∑i=1⌊md⌋∑j=1[(i,j)=1]⋅[(i,d)=1]=∑d|kμ(d)f(md,n,d)
这个式子形式和杜教筛很像,但是由于 n 和 m 的出现,对于每一个 k 并不是只需要计算一次,而是会有多组用到的 f 的 k 相等但 n,m 不相等。可以证明其复杂度是低于 O(ω(k)2)的。其中 ω(k)为 k 的因子个数
f的递归出口是 k=1或 n=0。当 k 等于 1 时,我们需要求互质的 i,j对数,这个是一个简单的莫比乌斯反演。
f(n,m,1)=n∑i=1m∑j=1[(i,j)=1]=n∑d=1⌊nd⌋⌊md⌋μ(d)
这个函数貌似可以用数论分块 O(√n)求解,前提是我们需要提前知道 n 以内 μ(d)的前缀和。这尼玛就很恶心了。就算我们用杜教筛,时间复杂度仍然会达到可怕的 O(n7/6)。但是并不是这样的。
我们之前说到说杜教筛真正用到的 S(d)只有那几个 S(⌊ni⌋),而这里的所有 f(x)的 x也都是 ⌊ni⌋ ,所以杜教筛的复杂度完全没有提高。
那么这个算法的时间复杂度就是 O(ω(k)2+n2/3)
不过,下面的代码是基于拆第一个方括号的方法的。
3 条评论
Linyk · 2021年11月6日 9:47 上午
谢谢 dalao 的讲解❤
Linshey · 2020年12月22日 9:59 下午
谢谢 dalao 的讲解 ❤
Early · 2020年3月31日 7:55 下午
谢谢 dalao 的讲解❤