二次算术程序(Quadratic Arithmetic Program)是一种算术电路,具体来说是将秩 1 约束系统(R1CS)表示为一组多项式。它是在秩 1 约束系统上使用拉格朗日插值推导出来的。与 R1CS 不同,二次算术程序(QAP)可以通过 Schwartz-Zippel 引理在 O(1) 时间内进行相等性测试。
核心思想
在关于 Schwartz-Zippel 引理的章节中,我们看到可以通过将两个向量转换为多项式,然后对多项式运行 Schwartz-Zippel 引理测试,从而在 O(1) 时间内测试它们是否相等。(需要澄清的是,测试本身是 O(1) 时间的,而将向量转换为多项式会产生额外的开销)。
因为秩 1 约束系统完全由向量运算组成,我们的目标是测试
La∘Ra=?Oa
是否在 O(1) 时间而不是 O(n) 时间内成立(其中 n 是 L、R 和 O 中的行数)。
但在此之前,我们需要了解表示向量的多项式与向量之间关系的一些关键属性。
对于这里的所有数学运算,我们假设我们在有限域中进行,但为了简洁起见,我们省略了 modp 符号。
向量加法和多项式加法之间的同态
向量加法同态于多项式加法
如果我们取两个向量,用多项式对它们进行插值,然后将这些多项式相加,我们得到的多项式,与我们将向量相加然后再对求和后的向量进行插值得到的多项式是相同的。
用更数学化的语言来说,令 L(v) 为对向量 v 使用 (1,2,...,n) 作为 x 值进行拉格朗日插值所得到的多项式,其中 n 是 v 的长度。以下等式成立:
L(v+w)=L(v)+L(w)
换句话说,对向量 v 和 w 进行插值后得到的多项式之和,与对向量 v+w 进行插值得到的多项式是相同的。
示例演示
令 f1(x)=x2 且 f2(x)=x3,f1 插值 (1,1),(2,4),(3,9) 或向量 [1,4,9],f2 插值 [1,8,27]。
向量之和为 [2,12,36],很明显 x3+x2 对其进行了插值。令 f3(x)=f1(x)+f2(x)=x3+x2。
f3(1)f3(2)f3(3)=1+1=2=8+4=12=27+9=36
用 Python 测试数学逻辑
对提出的数学恒等式进行单元测试并不能证明它的绝对真实性,但它确实说明了正在发生的事情。鼓励读者尝试几个不同的向量,以验证该恒等式是否成立。
import galois
import numpy as np
p = 17
GF = galois.GF(p)
xs = GF(np.array([1,2,3]))
# two arbitrary vectors
v1 = GF(np.array([4,8,2]))
v2 = GF(np.array([1,6,12]))
def L(v):
return galois.lagrange_poly(xs, v)
assert L(v1 + v2) == L(v1) + L(v2)
标量乘法
令 λ 为一个标量(具体来说,是有限域中的一个域元素)。那么
L(λv)=λL(v)
示例演示
假设我们的 3 个点对应 [3,6,11]。对其进行插值的多项式为 f(x)=x2+2。如果我们将向量乘以 3,我们得到 [9,18,33]。对其进行插值的多项式是
from scipy.interpolate import lagrange
x_values = [1, 2, 3]
y_values = [9, 18, 33]
print(lagrange(x_values, y_values))
# 2
# 3 x + 6
3x2+6,它等于 3⋅(x2+2)。
代码示例演示
import galois
import numpy as np
p = 17
GF = galois.GF(p)
xs = GF(np.array([1,2,3]))
# arbitrary vector
v = GF(np.array([4,8,2]))
# arbitrary constant
lambda_ = GF(15)
def L(v):
return galois.lagrange_poly(xs, v)
assert L(lambda_ * v) == lambda_ * L(v)
标量乘法本质上是向量加法
当我们说“将向量乘以 3”时,我们实际上是在说“将向量自身相加三次”。因为我们只在有限域中进行运算,所以我们不需要关心像“0.5”这样标量的解释。
我们可以将逐元素加法下的向量(在有限域中)和加法下的多项式(也在有限域中)都视为群(groups)。
本章最重要的结论是
有限域中加法下的向量群同态于有限域中加法下的多项式群。
这很关键,因为向量相等性测试需要 O(n) 时间,而多项式相等性测试只需 O(1) 时间。
因此,尽管测试 R1CS 的相等性需要 O(n) 时间,我们可以利用这种同态性在 O(1) 时间内测试 R1CS 的相等性。
这就是二次算术程序(Quadratic Arithmetic Program)的本质。
多项式形式的秩 1 约束系统
考虑矩形矩阵和向量之间的矩阵乘法可以写成向量加法和标量乘法的形式。
例如,如果我们有一个 3×4 的矩阵 A 和一个 4 维向量 v,那么我们可以将矩阵乘法写为
A⋅v=a11a21a31a12a22a32a13a23a33a14a24a34v1v2v3v4
我们通常将向量 v 想象为“翻转”并与每一行进行内积(广义点积),即
A⋅v=a11⋅v1+a12⋅v2+a13⋅v3+a14⋅v4a21⋅v1+a22⋅v2+a23⋅v3+a24⋅v4a31⋅v1+a32⋅v2+a33⋅v3+a34⋅v4
然而,我们也可以将矩阵 A 拆分为一系列向量,如下所示:
A=a11a21a31,a12a22a32,a13a23a33,a14a24a34
然后将每个向量乘以向量 v 中的一个标量:
A⋅v=a11a21a31⋅v1+a12a22a32⋅v2+a13a23a33⋅v3+a14a24a34⋅v4
我们已纯粹用向量加法和标量乘法表达了 A 和 v 之间的矩阵乘法。
因为我们之前已经确定,有限域中加法下的向量群同态于有限域中加法下的多项式群,所以我们可以用表示这些向量的多项式来表达上述计算。
简洁地测试 Av1=Bv2
假设我们有矩阵 A 和 B 满足
A=[6437]B=[31296]
以及向量 v1 和 v2
v1=[24]v2=[22]
我们想要测试
Av1=Bv2
是否成立。
显然,我们可以执行矩阵算术运算,但最终的检查将需要 n 次比较,其中 n 是 A 和 B 的行数。我们希望在 O(1) 时间内完成。
首先,我们将矩阵乘法 Av1 和 Bv2 转换为加法下的向量群:
AB=[64],[37]=[312],[96]
我们现在希望在多项式群中找到
[64]⋅2+[37]⋅4=?[312]⋅2+[96]⋅2
的同态等价物。
让我们在 x 值 [1,2] 的区间内将每个向量转换为多项式:
p1(x)[64]⋅2+p2(x)[37]⋅4=?q1(x)[312]⋅2+q2(x)[96]⋅2
我们将调用一些 Python 代码来计算拉格朗日插值:
import galois
import numpy as np
p = 17
GF = galois.GF(p)
x_values = GF(np.array([1, 2]))
def L(v):
return galois.lagrange_poly(x_values, v)
p1 = L(GF(np.array([6, 4])))
p2 = L(GF(np.array([3, 7])))
q1 = L(GF(np.array([3, 12])))
q2 = L(GF(np.array([9, 6])))
print(p1)
# 15x + 8 (mod 17)
print(p2)
# 4x + 16 (mod 17)
print(q1)
# 9x + 11 (mod 17)
print(q2)
# 14x + 12 (mod 17)
最后,我们可以通过调用 Schwartz-Zippel 引理来检查
p1(x)⋅2+p2(x)⋅4=?q1(x)⋅2+q2(x)⋅2
是否为真:
import random
u = random.randint(0, p)
tau = GF(u) # a random point
left_hand_side = p1(tau) * GF(2) + p2(tau) * GF(4)
right_hand_side = q1(tau) * GF(2) + q2(tau) * GF(2)
assert left_hand_side == right_hand_side
最后的 assert 语句能够通过进行单次比较(而不是 n 次比较)来测试 Av1=Bv2。
R1CS 到 QAP:简洁地测试 La∘Ra=Oa
既然我们知道如何简洁地测试 Av1=Bv2,我们是否也可以简洁地测试 La∘Ra=Oa 呢?
这些矩阵有 m 列,因此让我们将每个矩阵分解为 m 个列向量,并在 (1,2,...,n) 上对它们进行插值,以各自生成 m 个多项式。
令 u1(x),u2(x),...,um(x) 为对 L 的列向量进行插值的多项式。
令 v1(x),v2(x),...,vm(x) 为对 R 的列向量进行插值的多项式。
令 w1(x),w2(x),...,wm(x) 为对 O 的列向量进行插值的多项式。
不失一般性,假设我们有 4 列(m=4)和 3 行(n=3)。
直观上,这可以表示为
L=l11l21l31l12l22l32l13l23l33l14l24l34u1(x)u2(x)u3(x)u4(x)R=r11r21r31r12r22r32r13r23r33r14r24r34v1(x)v2(x)v3(x)v4(x)
O=o11o21o31o12o22o32o13o23o33o14o24o34w1(x)w2(x)w3(x)w4(x)
因为将列向量乘以标量同态于将多项式乘以标量,所以每个多项式都可以乘以见证(witness)中各自对应的元素。
例如,
La=l11l21l31l12l22l32l13l23l33l14l24l34a1a2a3a4
变成了
=[u1(x)u2(x)u3(x)u4(x)]a1a2a3a4=a1u1(x)+a2u2(x)+a3u3(x)+a4u4(x)=i=1∑4aiui(x)
观察最终结果是一个度数至多为 n−1 的单一多项式,因为 u1(x),…,un(x) 的度数至多为 n−1。
这源于我们构造它们的方式:L 的每一列都有 n 个项,并且通过拉格朗日插值对 n 个点进行插值会产生一个度数至多为 n−1 的多项式。
在一般情况下,将 m 个列分别转换为多项式之后,La 可以写为
i=1∑maiui(x)
使用与上面相同的步骤,R1CS La∘Ra=Oa 中的每个矩阵-见证乘积可以转换为
La→i=1∑maiui(x)Ra→i=1∑maivi(x)Oa→i=1∑maiwi(x)
由于每个求和项都产生一个单一多项式,我们可以将它们写为:
LaRaOa→i=1∑maiui(x)=u(x)→i=1∑maivi(x)=v(x)→i=1∑maiwi(x)=w(x)
为什么要对所有的列进行插值?
由于同态性 L(v1)+L(v2)=L(v1+v2) 和 L(λv)=λL(v),如果我们将 u(x) 计算为 L(La),得到的结果与对 L 的各列应用拉格朗日插值,然后将每个多项式乘以 a 中对应的元素并对结果求和得到的结果是相同的。
换句话说,
i=1∑maiui(x)=L(La)∣ui(x) is the Lagrange interpolation of column i of L
那么为什么不只计算一次拉格朗日插值而不是 m 次呢?
我们需要区分是谁在使用 QAP。验证者(以及我们稍后将介绍的可信设置)不知道见证 a,因此无法计算 L(La)。这是证明者可以做的一个优化,但零知识(ZK)协议中的其他参与方无法使用该优化。
所有相关方都需要在进行任何证明和验证之前,对 QAP——即矩阵的多项式插值——达成共识。
多项式度数不平衡
然而,我们不能简单地将最终结果表达为
u(x)v(x)=w(x)
因为多项式的度数(degree)不匹配。
将两个多项式相乘,其结果多项式的度数等于相乘的两个多项式度数之和。
因为 u(x)、v(x) 和 w(x) 各自的度数都是 n−1,所以 u(x)v(x) 通常的度数将是 2n−2,而 w(x) 的度数是 n−1,因此尽管它们相乘所对应的底层向量是相等的,但多项式本身并不相等。
这是因为我们之前建立的同态仅针对向量加法,而不是哈达玛乘积(Hadamard product)。
然而,u(x)v(x) 所插值的向量,即
((1,u(1)v(1)),(2,u(2)v(2)),...,(n,u(n)v(n)))
与 w(x) 所插值的向量是相同的,即
((1,w(1)),(2,w(2)),...,(n,w(n)))
换句话说
((1,u(1)v(1)),(2,u(2)v(2)),...,(n,u(n)v(n)))=((1,w(1)),(2,w(2)),...,(n,w(n)))
尽管“底层”的向量相等,但对它们进行插值的多项式并不相等。
底层相等的例子
假设 u(x) 是对以下点进行插值的多项式
(1,2),(2,4),(3,8)
而 v(x) 是对以下点进行插值的多项式
(1,4),(2,2),(3,8)
如果我们视 u(x) 插值了向量 [2,4,8] 而 v(x) 插值了向量 [4,2,8],那么我们可以看到它们的乘积多项式插值了这两个向量的哈达玛乘积。[2,4,8] 和 [4,2,8] 的哈达玛乘积为 [8,8,64]。
如果我们将 u(x) 和 v(x) 乘在一起,我们得到 w(x)=4x4−18x3+36x2−42x+28。
我们可以从下面的图表中看到,乘积多项式插值了这两个向量的哈达玛乘积 [8,8,64]。

那么如果它们在 (1,2,...,n) 上插值了相同的 y 值,我们怎么才能“使得” w(x) 等于 u(x)v(x) 呢?
对 0 向量进行插值
如果 v1∘v2=v3,那么 v1∘v2=v3+0。
我们不需要用拉格朗日插值对 0 进行插值并得到 f(x)=0(记住拉格朗日插值会找到最低度数的插值多项式),我们可以使用一个更高度数的多项式来平衡度数的不匹配。
例如,下图中黑色的多项式(b(x))插值了 [(1,0),(2,0),(3,0)]:

现在,由于 4x4−18x3+8x2+42x−36 是 [0,0,0] 的有效插值,我们可以将原始等式写为
u(x)v(x)=w(x)+b(x)
等式就平衡了!
b(x) 是简单地通过 u(x)v(x)−w(x) 计算得出的(蓝色多项式减去红色多项式)
然而,我们不能让证明者挑选任意的 b(x),否则他们即使在没有插值相同向量(在我们的例子中是 [8,8,64])的情况下,也可以挑选一个能平衡 u(x)v(x) 和 w(x) 的 b(x)。证明者在选择 b(x) 时拥有太多的灵活性。具体来说,我们希望要求 b(x) 在 x=1,2,…,n 处有根——也就是说,去插值 0 向量。这样一来,v1∘v2=v3+0 的多项式转换依然会遵循底层的向量。
为了限制他们对 b(x) 的选择,我们可以使用以下定理:
多项式乘积的根的并集
定理:如果 h(x)=f(x)g(x),且 f(x) 有根的集合 {rf},g(x) 有根的集合 {rg},那么 h(x) 拥有的根为 {rf}∪{rg}。
示例
令 f(x)=(x−3)(x−4) 且 g(x)=(x−5)(x−6)。那么 h(x)=f(x)g(x) 的根为 {3,4,5,6}。
我们可以利用上面的定理强制使得 b(x) 的根在 x=1,2,…,n 处。
强制 b(x) 为零向量
我们将 b(x) 分解为 b(x)=h(x)t(x),其中 t(x) 是多项式
t(x)=(x−1)(x−2)…(x−n)
那么与 t(x) 相乘的任何多项式对应的也将是零向量,因为它必然会在 x=1,2,…,n 处有根。
因此,我们将在我们的等式中把 b(x) 替换为 h(x)t(x)。
从而,我们的等式将变为
u(x)v(x)=w(x)+h(x)t(x)
我们利用基础代数就可以计算出 h(x):
h(x)=t(x)u(x)v(x)−w(x)
QAP 端到端
假设我们有一个具备矩阵 L、R 和 O 以及见证向量 a 的 R1CS。
La∘Ra=Oa
这些矩阵有 n 列和 m 行,其中 n=4 且 m=3。
即,L、R 和 O 如下所示:
L=l11l21l31l12l22l32l13l23l33l14l24l34R=r11r21r31r12r22r32r13r23r33r14r24r34O=o11o21o31o12o22o32o13o23o33o14o24o34
且见证向量 a 是
a=a1a2a3a4
我们将每个矩阵分解为 m 个列向量,并在 (1,2,...,n) 上对它们进行插值,每个矩阵生成 m 个多项式。
L=u1(x)l11l12l13l14u2(x)l21l22l23l24u3(x)l31l32l33l34u4(x)l41l42l43l44
R=v1(x)r11r12r13r14v2(x)r21r22r23r24v3(x)r31r32r33r34v4(x)r41r42r43r44
O=w1(x)o11o12o13o14w2(x)o21o22o23o24w3(x)o31o32o33o34w4(x)o41o42o43o44
每一个矩阵-向量乘积 La、Ra 和 Oa 在同态上等价于以下多项式:
i=1∑4aiui(x)i=1∑maivi(x)i=1∑maiwi(x)=a1u1(x)+a2u2(x)+a3u3(x)+a4u4(x)=u(x)=a1v1(x)+a2v2(x)+a3v3(x)+a4v4(x)=v(x)=a1w1(x)+a2w2(x)+a3w3(x)+a4w4(x)=w(x)
在我们的例子中,t(x) 将是
t(x)=(x−1)(x−2)(x−3)
而 h(x) 将是
h(x)=t(x)u(x)v(x)−w(x)
原始 R1CS 的 QAP 表示的最终公式为
i=1∑4aiui(x)i=1∑4aivi(x)=i=1∑4aiwi(x)+h(x)t(x)
QAP 的最终公式
QAP 就是以下公式:
i=1∑maiui(x)i=1∑maivi(x)=i=1∑maiwi(x)+h(x)t(x)
其中 ui(x)、vi(x) 和 wi(x) 分别是对 L、R 和 O 的列进行插值的多项式,t(x) 为 (x−1)(x−2)...(x−n),其中 n 是 L、R 和 O 的行数,而 h(x) 是
h(x)=t(x)∑i=1maiui(x)∑i=1maivi(x)−∑i=1maiwi(x)
使用二次算术程序的简洁零知识证明
假设我们有一种方法使得验证者可以向证明者发送一个随机值 τ,并且证明者会以如下形式回应:
ABC=u(τ)=v(τ)=w(τ)+h(τ)t(τ)
验证者可以检查 AB=C 并接受证明者拥有一个有效的、同时满足 R1CS 和 QAP 的见证 a。
然而,这将要求验证者信任证明者正在正确地求值这些多项式,而我们目前并没有一种机制来强制证明者这样做。
在下一章中,我们将基于本章的讨论展示 将 R1CS 转换为 QAP 的 Python 代码。
接下来我们将讨论可信设置(trusted setups),开始着手解决如何让证明者诚实地对多项式进行求值的问题。
原文首发于 2023 年 8 月 23 日