【译】N 皇后问题 – 构造法原理与证明 时间复杂度O(1)

  • [原] E.J.Hoffman; J.C.Loessi; R.C.Moore
  • The Johns Hopkins University Applied Physics Laboratory
  • *[译]* EXP 2017-12-29

注意

由于原文使用了“m皇后”进行描述,所以本文从现在开始也使用“m皇后”进行描述。
我这里就不调整为大多数人习惯的“n皇后”了,避免某些数学公式参数混淆。


*【写在前面】*

这是现在网上流传的一套关于M皇后问题的构造法公式,但是这套公式是怎么得来的,却鲜有人知。而文本会详细阐述这套公式的推导过程:

img


1. 前言

文本核心内容主要译自 E.J.Hoffman、 J.C.Loessi 和 R.C.Moore 发表于 Mathematics Magazine 《数学杂志》 上的学术论文 《Constructions for the Solution of the m Queens Problem》 。

该论文已被美国数学协会 Mathematical Association of America 公开,具体期数为 Vol.42, No.2 (Mar., 1969), pp. 66-72。

该文献可从以下途径购买

该文献的英文原文链接

2. 问题背景

M皇后问题: 在M×M格的国际象棋上摆放M个皇后,使其不能互相攻击,即任意两个皇后都不能处于同一行、同一列或同一斜线上。

根据场景,又有三种衍生问题

  • ① 共有多少种摆法(即有多少种可行解)
  • ② 求出所有可行解
  • ③ 求任意一个可行解

问题① 属于 禁位排列 问题,目前是存在通项公式直接求解的。

问题② 属于 搜索 问题,在网上也有多种解法,主流是 回溯法(另有衍生的位运算变种算法),但不管如何优化,回溯法都有一个致命的问题:M值不能过大(一般M=30已是极限)。

问题③ 属于 问题② 的子集,因此很多人的切入点依然是回溯法,也有启发式算法的解法:如遗传算法、还有刘汝佳在《算法艺术与信息学竞赛》提出的启发式修补算法。启发式算法在M<10000左右都是可解的,但是因为启发式算法均存在随机性,收敛速度视不同的收敛因子而变化(我看过某篇论文称启发式算法在M=10000时的耗时等价于回溯法M=30的耗时)。

但早在1969年, 问题③ 的解就被 E.J.Hoffman、 J.C.Loessi 和 R.C.Moore 找到了潜在的数学规律,通过推导出数学公式,利用 构造法 使得该问题可在 O(1) 的时间复杂度得到解。

3. 译者的话

① 原文写得有点艰涩,有些中间步骤是跳过了。我就加上自己的理解做了意译,并补上了跳过的步骤和图示,但是核心的推导思路和步骤不会修改。

② 原文首先给出了3个构造式(其实就是m皇后问题的通解式),然后以此为结论展开了一系列的推导证明这3个构造式是正确的。但是这3个构造式真正是怎么得来,原作者并没有说,估计是原作者做了大量的演绎、从m皇后的特解找到了潜在规则所总结出来的通解。

4. 译文:m皇后问题的构造解法

4.1. 数学模型定义

m皇后问题最初是由Gauss(高斯)提出的,该问题描述如下:

是否有可能在一个m×m的国际棋盘上放置m个皇后使得她们无法互相攻击?(注:皇后是国际象棋中的一种棋子,她可以对横、竖、斜三个方向的棋子发起攻击)

这是一个有趣的问题,我们可以将其约束到一个 数学模型 进行描述:

把棋盘定义为一个m×m的方格矩阵,那么对于任意方格可以使用有序对 (i, j) 以表示其行列坐标,其中 1 ≤ i ≤ m 表示该方格的行编号, 1 ≤ j ≤ m 表示该方格的列编号。

同时我们再为每个方格定义一组对角编号:

自左上到右下方向为主对角线,对于主对角线上的方格 (i, j) ,显然有:

  m - j + i = MAJOR_CONSTANT —— 译者注:这个公式对后续推导起到重要作用

其中 MAJOR_CONSTANT 称之为主对角常数,显然有 1 ≤ MAJOR_CONSTANT ≤ m ,将其定义为方格 (i, j) 的主对角编号。

进一步地,令自右上到左下方向为次对角线,对于次对角线上的方格 (i, j) ,显然有:

  i + j - 1 = MINOR_CONSTANT —— 译者注:这个公式对后续推导起到重要作用

其中 MINOR_CONSTANT 称之为次对角常数,显然有 1 ≤ MINOR_CONSTANT ≤ m ,将其定义为方格 (i, j) 的次对角编号。

m皇后问题的解模型【图 1】 m皇后问题的解模型

至此,m皇后问题的解模型可以定义为如下:

放置m个皇后到一个m×m的方格矩阵,使得皇后们的所在的方格同时满足下面所有条件:

  • ① 行编号唯一
  • ② 列编号唯一
  • ③ 主对角编号唯一
  • ④ 次对角编号唯一

这个模型足以解决所有m皇后问题(但仅适用于 m ≥ 4 的情况,因为 m = 2、3 时无解,m = 1 的解就不需要讨论了) —— 译者注:这个大前提条件会在最后进行论证


4.2. m皇后通解:三个构造式

由于通解公式相对复杂,为了便于说明,此处不从过程推导出结论,而是反其道而行之:先给出结论的通解公式(且不考虑公式是怎么推演出来的),再证明之。

m皇后问题的解的共由3个构造式组成。

4.2.1. 【构造式A】

令 m = 2n,其中 n = 2, 3, 4, …

构造式A仅适用于m是偶数的情况,它由两个子公式组成:

img

使用构造式A解决12皇后问题的解【图 2】 使用构造式A解决12皇后问题的解

4.2.2. 【构造式B】

令 m = 2n,其中 n = 2, 3, 4, …

构造式B同样仅适用于m是偶数的情况,它同样由两个子公式组成:

img

使用构造式B解决14皇后问题的解【图 3】 使用构造式B解决14皇后问题的解

4.2.3. 【构造式C】

构造式C是构造式A或B的扩展推导式,仅适用于m+1是奇数的情况:

当已使用构造式A或B求得一个m×m的皇后问题的解时,若同时增加第 m+1 行和第 m+1 列,那么第 m+1 个皇后应放置在坐标为 (m+1, m+1) 的方格。

构造式C解集图示(在前面构造式B的示例解集基础上增加一行一列)【图 4】 构造式C解集图示(在前面构造式B的示例解集基础上增加一行一列)


4.3. 三个构造式的正确性证明

要证明构造式是成立的,只需要证明每个构造式导出的皇后位置均满足

  • ① 行编号唯一
  • ② 列编号唯一
  • ③ 主对角编号唯一
  • ④ 次对角编号唯一

4.3.1. 【构造式A】的证明

4.3.1.1. 【构造式A】

令 m = 2n,其中 n = 2, 3, 4, …(即m≥4且是偶数):

img

构造式含义:若把棋盘在横中轴线切开,很明显解集是呈中心旋转对称的,其中上半部分对应PA-1的解集,下半部分对应PA-2的解集:

构造式A解集图示【图 5】 构造式A解集图示

4.3.1.2. 【定理A】

定理A

对于m皇后问题,当 n != 3λ + 1 (其中 λ = 0, 1, 2, ... )时,则必定可以使用【构造式A】求解。

4.3.1.3. 【定理A】的证明

① 行列编号的唯一性证明:

  • 根据 PA-1 导出的皇后位置为 (k, 2k) ,其中 1 ≤ k ≤ n
  • 根据 PA-2 导出的皇后位置为 (2n+1-l, 2n+1-2l) ,其中 1 ≤ l ≤ n
  • 明显地,PA-1 的每个皇后放置在前n行的每个奇数列,PA-2 的每个皇后放置在后n行的每个偶数列,亦即每行每列均有且只有一个皇后,行列编号的唯一性得证

② 主对角编号的唯一性证明:

img

 受 k、l 的取值范围影响,显然是不可能的,主对角编号的唯一性得证

③ 次对角编号的唯一性证明:

img

 由此可知当 n != 3λ + 1λ = 0, 1, 2, ...)时,次对角编号是唯一的

 综上①②③,定理A得证


4.3.2. 【构造式B】的证明

4.3.2.1. 【构造式B】

令 m = 2n,其中 n = 2, 3, 4, …(即 m ≥ 4 且是偶数):

img

为了便于说明,对 PB-1 和 PB-2 的对m取mod运算做一下等价处理

img

构造式含义:若把棋盘在横中轴线切开,很明显解集是呈中心旋转对称的,其中上半部分对应 PB-1 的解集,下半部分对应 PB-2 的解集。同时根据列编号 mod m 部分的取值( ≥m<m ),PB-1 与 PB-2 的解集又分别拆分成两个分段函数子集:

构造式B解集图示【图 6】 构造式B解集图示

4.3.2.2. 【定理B】

定理B

对于m皇后问题,当 n != 3λ (其中 λ = 1, 2, 3, ... )时,则必定可以使用【构造式B】求解。

4.3.2.3. 【定理B】的证明

① 行列编号的唯一性证明:

img

 明显地:

  • 当n是偶数时,PB-1 的每个皇后放置在前n行的每个偶数列,PA-2 的每个皇后放置在后n行的每个奇数列;
  • 当n是奇数时,PB-1 的每个皇后放置在前n行的每个奇数列,PA-2 的每个皇后放置在后n行的每个偶数列。
  • 亦即不论n的奇偶性如何,每行每列均有且只有一个皇后,行列编号的唯一性得证

② 主对角编号的唯一性证明:

img

  • 化简(1)得 k+l = 4n-2,但因为 MIN(k+l) = 2,此时 n = 1,与前提条件 m=2n≥4 ⇒ n≥2 矛盾,因此(1)不成立。
  • 化简(4)得 k'+l' = 2n+4,与 MAX(k'+l') = 2n 矛盾,因此(4)不成立。
  • 化简(5)得 k+k' = 2n 从取值范围看显然不成立。
  • 化简(6)得 l'-l = 2n 从取值范围看显然不成立。
  • 化简(2)得 k+l' = 4,化简(3)得 k'+l = 4
  • 由于 kl 的取值范围相同, k'l' 的取值范围相同,因此有:

img

 而 n = 3 不在定理B的前提条件 n != 3λλ = 1, 2, 3, ...)范围内,可以直接排除。

 因此 n > 3(否则 k'l' 不能存在),所以不存在 n = 2n = 3 取值的可能性,亦即(2)(3)实际均不成立。

 综上,(1)(2)(3)(4)(5)(6)均不成立,主对角编号的唯一性得证

③ 次对角编号的唯一性证明:

img

  • 化简(1)得 2n = 3(k+l-2),因此 k+l-2 必为偶数,令 2λ = k+l-2λ = 1, 2, 3, ...),则有 2n=3(2λ) ⇒ n=3λ,即当且仅当 n = 3λ 时(1)成立。
  • 化简(2)得 4n = 3(k+l'-2),因此 k+l'-2 必为二重偶数(即至少能被2整除两次),令 4λ = k+l'-2λ = 1, 2, 3, ...),则有 4n=3(4λ) ⇒ n=3λ,即当且仅当 n = 3λ 时(2)成立。
  • 化简(3)得 4n = 3(k'+l-2),因此 k'+l-2 必为二重偶数(即至少能被2整除两次),令 4λ = k'+l-2λ = 1, 2, 3, ...),则有 4n=3(4λ) ⇒ n=3λ,即当且仅当 n = 3λ 时(3)成立。
  • 化简(4)得 2n = k'+l'-2,但从 k'l' 的取值范围可知 MAX(k'+l'-2) = n+n-2 = 2n-2,亦即 2n > k'+l'-2,因此(4)不成立。
  • 化简(5)得 2n = 3(k'-k),因此 k'-k 必为偶数,令 2λ = k'-kλ = 1, 2, 3, ...),则有 2n=3(2λ) ⇒ n=3λ,即当且仅当 n = 3λ 时(5)成立。
  • 化简(6)得 2n = 3(l'-l),因此 l'-l 必为偶数,令 2λ = l'-lλ = 1, 2, 3, ...),则有 2n=3(2λ) ⇒ n=3λ,即当且仅当 n = 3λ 时(6)成立。

 由此可知,当 n != 3λλ = 1, 2, 3, ...)时,(1)(2)(3)(4)(5)(6)均不成立,次对角编号的唯一性得证

 综上①②③,定理B得证


4.3.3. 【构造式C】的证明

4.3.3.1. 两条【引理】

我们定义棋盘上由方格 (1, 1)(2, 2)(3, 3)、 …、 (m, m) 连线所得的对角线为标准对角线,亦即标准对角线的行列编号必有 i == j

构造式C解集图示【图 7】 构造式C解集图示

在证明构造式C之前,首先需要证明两条引理

  • 【引理A】 使用构造式A得到的解,没有任何皇后的坐标是在标准对角线上的。
  • 【引理B】 使用构造式B得到的解,没有任何皇后的坐标是在标准对角线上的。

① 【引理A】的证明:

img

 k = 0 与取值范围 k = 1, 2, 3, ..., n 矛盾,l = 0 与取值范围 l = 1, 2, 3, ..., n 矛盾,因此假设不成立,【引理A】得证

② 【引理B】的证明:

img

 由于 2n=m≥4 ⇒ n≥2,因此(1)(3)不成立,否则 k,l ≤ 0,与取值范围矛盾。

 又由于(2)(4)的取值范围 k,l ≤ n,(2)(4)明显不成立。

 因此假设不成立,【引理B】得证

4.3.3.2. 【定理C】

定理C

对于可使用【构造式A】或【构造式B】求解的m皇后问题,若同时增加第 m+1 行和第 m+1 列,使其延展为 m+1 皇后问题,那么这个 m+1 皇后问题也是可解的,且第 m+1 个皇后应放置在坐标为 (m+1, m+1) 的方格。

4.3.3.3. 【定理C】的证明

① 行列编号的唯一性证明:

 由于【定理C】是从【定理A】或【定理B】上扩展的,且【定理A】与【定理B】的所有皇后的行列编号唯一性已得到证明,而【定理C】的第 m+1 行与第 m+1 列是新增的,那么第 m+1 个皇后的行列编号也必定是唯一的,因此所有皇后的行列编号必定也是唯一的。

② 主对角编号的唯一性证明:

 由于第 m+1 个皇后的主对角线与标准对角线是重合的,而通过【引理A】与【引理B】可知在m×m范围内的标准对角线上不存在任何皇后,换言之标准对角线上只有第 m+1 个皇后,所以主对角线编号是唯一的。

③ 次对角编号的唯一性证明:

 对于第 m+1 条次对角线,上面只有 (m+1, m+1) 一个方格,显然次对角线编号是唯一的。


4.4. 大前提条件m≥4的证明

上述所有的证明,都是基于一开始给出的大前提条件:

  • 对于构造式A或B:令 m = 2n,其中 n = 2, 3, 4, …(即 m≥4 且 m是偶数)
  • 对于构造式C:在构造式A或B可解的基础上令 m+1(即 m≥5 且 m是奇数)

亦即m皇后问题( m≥4 且 m是偶数)可通过【构造式A】或【构造式B】求解,而 m+1 皇后问题( m+1≥5 且 m是奇数)则可通过【构造式C】求解。

至于为什么 m=1、 m=2 或 m=3 时并不适用于构造式A、B、C就是这里要讨论的。

首先当 m=1 时,虽然是有明确的唯一解,但并不存在 m=2n 的形式。而n作为三个构造式的重要变量,既然一开始就不存在n值,构造式A、B、C也就无从谈起了。

 那么需要证明的,就是为什么 m=2 与 m=3 也不可取?

 证明:

img

  不难发现,(2)中 m=2 是在 m<4 范围内没有被约束条件限制的特例

  但当 m=2 时 n=1,不妨把 n=1 代入 PB-1 与 PB-2,取值范围均矛盾,无法计算列坐标编号。

  因此对于【定理A】与【定理B】而言,m=2 都是不可解的,从而导致 m=3 也不可用【定理C】求解。

 证毕(事实上,通过画图可以明显发现 m=2、 m=3 是无解的)。

5. 译者后记:通解转换式(编程用)

在原作者提出的三个构造式A、B、C中,均使用 (i, j)二维坐标形式标记每个皇后的位置,从数学角度上更易于表达作者的思想,但是不便于编程使用。

为此译者在这里补充针对构造式A、B、C的转换公式,使用一维坐标形式标记每个皇后位置,以配合编程使用(其实这就是目前网上普遍流传的m皇后问题构造式)。

 一维坐标的标记方式为:从第1行开始,依次写出m个数字,分别代表每行的皇后列坐标。亦即行坐标为数序(索引/下标),列坐标为数值。

 如序列 [5, 3, 1, 6, 8, 2, 4, 7] 等价于 (1,5), (2,3), (3,1), (4,6), (5,8), (6,2), (7,4), (8,7)

5.1. 【构造式A】的转换式

 约束条件:n != 3λ + 1(其中λ = 0, 1, 2, ...

  • 即:m != 2(3λ+1) ⇒ (m mod 6) != 2(m为偶数)
  • 且:m-1 != 6λ+2 ⇒ (m mod 6) != 3(m为奇数,此时适用于构造式C)

 当m为偶数时:

  • 把行编号 1~n 代入 PA-1,可得到第 1~n 行的解序列: [2, 4, 6, 8, ..., m]
  • 把行编号 n+1~2n 代入 PA-2,可得到第 n+1~m 行的解序列: [1, 3, 5, 7, ..., m-1]
  • 合并两个解序列,就是构造式A的通解转换式(A1):
      [2, 4, 6, 8, ..., m], [1, 3, 5, 7, ..., m-1] ………………………………………………………(A1)

 当m为奇数时:

  • 把行编号 1~m-1 代入(A1),可得到第 1~m-1 行的解序列: [2, 4, 6, 8, ..., m-1], [1, 3, 5, 7, ..., m-2]
  • 然后直接套用构造式C(增加第m行第m列),则可得到通解转换式(A2):
      [2, 4, 6, 8, ..., m-1], [1, 3, 5, 7, ..., m-2], [m] ………………………………………………(A2)

5.2. 【构造式B】的转换式

 约束条件:不满足构造式A约束条件的,都可使用构造式B求解。

  • 即:m mod 6 = 2 (m为偶数)
  • 或:m mod 6 = 3(m为奇数,此时适用于构造式C)

 当m为偶数时, n=m/2

  若n为偶数:

  • 把行编号 1~n 代入 PB-1,可得到第1~n 行的解序列(注:PB-1是分段函数): [n, n+2, ..., m], [2, 4, 6, ..., n-2]
  • 把行编号 n+1~2n 代入 PB-2,可得到第 n+1~m 行的解序列(注:PB-2是分段函数): [n+3, n+5, ..., m-1], [1, 3, 5, ..., n+1]
  • 合并两个解序列,就是构造式B的通解转换式(B1):
      [n,n+2,...,m], [2,4,6,...,n-2], [n+3,n+5,...,m-1], [1,3,5,...,n+1] ………………………………………(B1)

  若n为奇数:

  • 把行编号 1~n 代入 PB-1,可得到第 1~n 行的解序列(注:PB-1是分段函数): [n, n+2, ..., m-1], [1, 3, 5, ..., n-2]
  • 把行编号 n+1~2n 代入 PB-2,可得到第 n+1~m 行的解序列(注:PB-2是分段函数): [n+3, n+5, ..., m], [2, 4, 6, ..., n+1]
  • 合并两个解序列,就是构造式B的通解转换式(B2):
      [n, n+2, ..., m-1], [1, 3, 5, ..., n-2], [n+3, n+5, ..., m], [2, 4, 6, ..., n+1] ………………………(B2)

 当m为奇数时, n=(m-1)/2

  若n为偶数:

  • 把行编号 1~m-1 代入(B1),可得到第 1~m-1 行的解序列: [n, n+2, ..., m-1], [2, 4, 6, ..., n-2], [n+3, n+5, ..., m-2], [1, 3, 5, ..., n+1]
  • 然后直接套用构造式C(增加第m行第m列),则可得到通解转换式(B3):
      [n, n+2, ..., m-1], [2, 4, 6, ..., n-2], [n+3, n+5, ..., m-2], [1, 3, 5, ..., n+1], [m] ………………(B3)

  若n为奇数:

  • 把行编号 1~m-1 代入(B2),可得到第 1~m-1 行的解序列: [n, n+2, ..., m-2], [1, 3, 5, ..., n-2], [n+3, n+5, ..., m-1], [2, 4, 6, ..., n+1]
  • 把行编号1然后直接套用构造式C(增加第m行第m列),则可得到通解转换式(B4):
      [n, n+2, ..., m-2], [1, 3, 5, ..., n-2], [n+3, n+5, ..., m-1], [2, 4, 6, ..., n+1], [m] ………………(B4)

5.3. 小结:通解转换式归整

img