假如你對數獨解法感興趣,你可能聽說過精確覆蓋問題。給定全集 X
和 X
的子集的集合 Y
,存在一個 Y 的子集 Y*,使得 Y* 構成 X 的一種分割。
這兒有個Python寫的例子。
1 2 3 4 5 6 7 8 |
X = {1, 2, 3, 4, 5, 6, 7} Y = { 'A': [1, 4, 7], 'B': [1, 4], 'C': [4, 5, 7], 'D': [3, 5, 6], 'E': [2, 3, 6, 7], 'F': [2, 7]} |
這個例子的唯一解是['B', 'D', 'F']。
精確覆蓋問題是NP完備(譯註:指沒有任何一個夠快的方法可以在合理的時間內,意即多項式時間 找到答案)。X演算法是由大牛高德納發明並實現。他提出了一種高效的實現技術叫舞蹈鏈,使用雙向連結串列來表示該問題的矩陣。
然而,舞蹈鏈實現起來可能相當繁瑣,並且不易寫地正確。接下來就是展示Python奇蹟的時刻了!有天我決定用Python來編寫X
演算法,並且我想出了一個有趣的舞蹈鏈變種。
演算法
主要的思路是使用字典來代替雙向連結串列來表示矩陣。我們已經有了 Y
。從它那我們能快速的訪問每行的列元素。現在我們還需要生成行的反向表,換句話說就是能從列中快速訪問行元素。為實現這個目的,我們把X轉換為字典。在上述的例子中,它應該寫為
1 2 3 4 5 6 7 8 |
X = { 1: {'A', 'B'}, 2: {'E', 'F'}, 3: {'D', 'E'}, 4: {'A', 'B', 'C'}, 5: {'C', 'D'}, 6: {'D', 'E'}, 7: {'A', 'C', 'E', 'F'}} |
眼尖的讀者能注意到這跟Y的表示有輕微的不同。事實上,我們需要能快速刪除和新增行到每列,這就是為什麼我們使用集合。另一方面,高德納沒有提到這點,實際上整個演算法中所有行是保持不變的。
以下是演算法的程式碼。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 |
def solve(X, Y, solution=[]): if not X: yield list(solution) else: c = min(X, key=lambda c: len(X[c])) for r in list(X[c]): solution.append(r) cols = select(X, Y, r) for s in solve(X, Y, solution): yield s deselect(X, Y, r, cols) solution.pop() def select(X, Y, r): cols = [] for j in Y[r]: for i in X[j]: for k in Y[i]: if k != j: X[k].remove(i) cols.append(X.pop(j)) return cols def deselect(X, Y, r, cols): for j in reversed(Y[r]): X[j] = cols.pop() for i in X[j]: for k in Y[i]: if k != j: X[k].add(i) |
真的只有 30 行!
格式化輸入
在解決實際問題前,我們需要將輸入轉換為上面描述的格式。可以這樣簡單處理
1 |
X = {j: set(filter(lambda i: j in Y[i], Y)) for j in X} |
但這樣太慢了。假如設 X 大小為 m,Y 的大小為 n,則迭代次數為 m*n。在這例子中的數獨格子大小為 N,那需要 N^5 次。我們有更好的辦法。
1 2 3 4 |
X = {j: set() for j in X} for i in Y: for j in Y[i]: X[j].add(i) |
這還是 O(m*n) 的複雜度,但是是最壞情況。平均情況下它的效能會好很多,因為它不需要遍歷所有的空格位。在數獨的例子中,矩陣中每行恰好有 4 個條目,無論大小,因此它有N^3的複雜度。
優點
- 簡單: 不需要構造複雜的資料結構,所有用到的結構Python都有提供。
- 可讀性: 上述第一個例子是直接從Wikipedia上的範例直接轉錄下來的!
- 靈活性: 可以很簡單得擴充套件來解決數獨。
求解數獨
我們需要做的就是把數獨描述成精確覆蓋問題。這裡有完整的數獨解法程式碼,它能處理任意大小,3×3,5×5,即使是2×3,所有程式碼少於100行,幷包含doctest!(感謝Winfried Plappert 和 David Goodger的評論和建議)