30 行 Python 程式碼搞定 X 演算法

威士忌發表於2014-07-22

假如你對數獨解法感興趣,你可能聽說過精確覆蓋問題。給定全集 和 的子集的集合 ,存在一個 Y 的子集 Y*,使得 Y* 構成 X 的一種分割。

這兒有個Python寫的例子。

這個例子的唯一解是['B', 'D', 'F']。

精確覆蓋問題是NP完備(譯註:指沒有任何一個夠快的方法可以在合理的時間內,意即多項式時間 找到答案)X演算法是由大牛高德納發明並實現。他提出了一種高效的實現技術叫舞蹈鏈,使用雙向連結串列來表示該問題的矩陣。

然而,舞蹈鏈實現起來可能相當繁瑣,並且不易寫地正確。接下來就是展示Python奇蹟的時刻了!有天我決定用Python來編寫演算法,並且我想出了一個有趣的舞蹈鏈變種。

演算法

主要的思路是使用字典來代替雙向連結串列來表示矩陣。我們已經有了 Y。從它那我們能快速的訪問每行的列元素。現在我們還需要生成行的反向表,換句話說就是能從列中快速訪問行元素。為實現這個目的,我們把X轉換為字典。在上述的例子中,它應該寫為

眼尖的讀者能注意到這跟Y的表示有輕微的不同。事實上,我們需要能快速刪除和新增行到每列,這就是為什麼我們使用集合。另一方面,高德納沒有提到這點,實際上整個演算法中所有行是保持不變的。

以下是演算法的程式碼。

真的只有 30 行!

格式化輸入

在解決實際問題前,我們需要將輸入轉換為上面描述的格式。可以這樣簡單處理

但這樣太慢了。假如設 X 大小為 m,Y 的大小為 n,則迭代次數為 m*n。在這例子中的數獨格子大小為 N,那需要 N^5 次。我們有更好的辦法。

這還是 O(m*n) 的複雜度,但是是最壞情況。平均情況下它的效能會好很多,因為它不需要遍歷所有的空格位。在數獨的例子中,矩陣中每行恰好有 4 個條目,無論大小,因此它有N^3的複雜度。

優點

  • 簡單: 不需要構造複雜的資料結構,所有用到的結構Python都有提供。
  • 可讀性: 上述第一個例子是直接從Wikipedia上的範例直接轉錄下來的!
  • 靈活性: 可以很簡單得擴充套件來解決數獨。

求解數獨

我們需要做的就是把數獨描述成精確覆蓋問題。這裡有完整的數獨解法程式碼,它能處理任意大小,3×3,5×5,即使是2×3,所有程式碼少於100行,幷包含doctest!(感謝Winfried Plappert 和 David Goodger的評論和建議)

相關文章