常用投票規則下的優勝者決定問題(winner determination)的計算複雜性是計算社會選擇(computational social choice)領域中歷史悠久的基本問題。從實際應用的角度出發,我們往往希望優勝者決定問題的計算複雜性比較低。然而對於一些經典投票規則例如 Kemeny,Slater 等,其優勝者決定問題在最壞情況(worst-case)下已被證明是 NP-hard 的,即對於大規模問題例項,目前暫不存在高效的演算法來確定優勝者。平均情況(average-case)分析雖然比最壞情況分析稍微實際一些,但是其對於輸入例項的分佈假設相當敏感:例如在計算社會選擇理論中被稱為 Impartial Culture 的假設,要求投票者對於候選者的排序服從獨立的均勻隨機分佈。許多經驗性證據表明這類分佈假設並不貼近現實。
Spielman and Teng(2004)引入了平滑分析(smoothed analysis),擴充並結合了最壞情況分析與平均情況分析。其主要想法是演算法的輸入資料往往是真實值(ground truth)的微小擾動之後的值。對於任何確定的問題例項,自然會在上面加一個諸如高斯噪音的小擾動形成機率分佈,而演算法的執行時間是該分佈下的期望執行時間。由此,演算法的平滑執行時間定義如下圖所示:
透過改變擾動的幅度,平滑執行時間完美地架起了最壞情況執行時間與平均情況執行時間之間的橋樑。可以看出,當擾動趨於零時,平滑執行時間等價於最壞情形執行時間,而當擾動非常大時,平滑執行時間等價於均勻分佈下的演算法執行時間。對於適當的擾動幅度,平滑分析能夠結合兩者優點,提供接近真實資料與現實應用場景的演算法分析。
平滑分析最著名的應用是線性規劃問題,它為最壞情況下需要指數多步驟的單純形法為什麼在實際中的執行速度非常快提供了有力且令人信服的解釋。在機器學習,均衡分析,組合最佳化等領域,平滑分析也得到了廣泛應用。例如納什均衡計算的平滑複雜度是PPAD-complete的。然而,常用投票規則下的優勝者決定問題,乃至任何計算社會選擇領域內的計算問題的平滑複雜性卻沒有任何結果。
實際上,這個問題不僅僅是計算社會選擇領域內的理論問題。由於投票機制是自動決策系統中的重要一環,平滑複雜性的研究對於人工智慧中也有實際意義。考慮如下例子:當一個智慧系統的開發者為了群體決策想要實現一種投票規則例如 Kemeny 來達到共識。這個系統需要估計計算 Kemeny 優勝者的執行時間,來決定分配多少計算資源以獲得及時的決策。它可以透過智慧體過往的行為來學習並預測其偏好,但是隻能得到關於偏好排序的機率分佈。這個機率分佈可以刻畫成真實偏好排序加上隨機噪音後的結果。在這種情況下,是否存在一種期望執行時間是多項式的演算法呢?
本文首次提供瞭如下公開問題的理論結果:常用投票機制下的優勝者決定問題的平滑複雜性是什麼?
我們採用了單人偏好模型(single agent preference model, Xia (2020))來分析這個問題。在此模型下,每個投票者可以選擇集合中的任何一個偏好機率分佈(等價於存在一個惡意對手為每個投票者選擇任意相關的真實偏好,然後自然為每個投票者加上獨立的擾動)。我們證明了如下定理:
[定理]:對於滿足一定條件的單人偏好模型,如果存在平滑執行時間為多項式的計算 Kemeny 或者 Slater 的演算法,那麼 NP=RP。
定理中對於單人偏好模型的假設覆蓋了一大類計算社會選擇領域內已知的統計模型,而 NP=RP 一般被認為是不成立的(常見的複雜性理論假設)。因此,該定理指出在平滑分析框架下,Kemeny 和 Slater 規則的優勝者決定問題依舊是困難的。雖然如此,我們得到關於引數化一般情形平滑複雜性的部分正面結果:對於一大類基於計算社會選擇中經典的 Mallows 統計模型的單人偏好模型,原有的動態規劃演算法對於引數規模受限問題例項以高機率在多項式時間內輸出結果。
圖文 | 鄭煒強
Distributed and Automated Games and Managerial Economics (daGAME)