模擬退火演算法Python程式設計(2)約束條件的處理

youcans發表於2021-05-02

1、最優化與線性規劃

   最優化問題的三要素是決策變數、目標函式和約束條件。

   線性規劃(Linear programming),是研究線性約束條件下線性目標函式的極值問題的優化方法,常用於解決利用現有的資源得到最優決策的問題。

  簡單的線性規劃問題可以用 Lingo軟體求解,Matlab、Python 中也有求解線性規劃問題的庫函式或求解器,很容易學習和使用,並不需要用模擬退火演算法。但是,由一般線性規劃問題所衍生的整數規劃、混合規劃、0/1規劃、二次規劃、非線性規劃、組合優化問題,則並不是呼叫某個庫函式都能處理的。而模擬退火演算法在很多複雜問題中具有較好的適應性,可以作為一種入門的通用智慧演算法來學習。

  也就是說,如果只是處理線性規劃問題,就不要用模擬退火演算法了。但如果是現有方法無法處理的複雜優化問題,或者對某類、某個優化問題你不知道用什麼方法處理了,這時用模擬退火演算法還是能解決的。

  本文使用懲罰函式法,分析模擬退火演算法處理線性規劃問題,相關內容也適用於非線性規劃問題。

2、模擬退火演算法處理約束條件

   線性規劃問題是約束優化問題,而模擬退火演算法則更適合處理無約束優化問題。對於優化問題中的約束條件,模擬退火演算法有幾種常用的處理方法:

  1. 決策變數取值的上下限約束。此類約束條件比較容易處理,只要設定初始解、新解在決策變數取值的上下限之間就可以解決。例如,(1)設定產生新解的隨機數的上下限為決策變數的上下限,即 [Xmin, Xmax];(2)設定產生新解的隨機數的上下限為當前解與決策變數的上下限,即 [Xnow, Xmax];(3)通過條件判斷,當新解超出決策變數上下限,則令其取上下限,即 xNew = max(min(xNew, xMax), xMin)。當然,這些處理方式,都會影響隨機數的概率分佈,因而也影響模擬退火演算法的優化效能,在此不做深入討論。

  2. 檢驗法處理不等式約束問題。在模擬退火演算法的迭代過程中,將每次產生的新解代入每個不等式約束函式,判斷是否滿足約束條件;如果新解不滿足約束條件,則捨棄這個新解,返回重新產生一個新解進行檢驗,直到產生的新解滿足全部約束條件為止。這個方法的思路簡單,每次迭代都在可行域內進行,但是對於約束條件眾多、苛刻的複雜問題,多次產生的新解都不能滿足約束條件,會使計算時間很長,甚至停滯不前。

  3. 消元法處理等式約束問題。對於等式約束,很難通過隨機產生的新解滿足約束條件,通常不能使用檢驗法處理。消元法是通過解方程將等式約束中的某個決策變數表示為其它決策變數的線性關係後,代入目標函式和不等式約束條件中,從而消去該約束條件。消元法不僅解決了等式約束問題,而且減少了決策變數的數量,從而有效簡化了優化問題的複雜度,是一舉兩得的處理方法。但是,對於非線性等式約束,求解非線性方程組也是非常困難的,消元法並不是普遍都能適用的。

  4. 更為通用的處理約束條件的方法是懲罰函式法,以下進行介紹。

3、懲罰函式法

  懲罰函式法是一類常用的處理約束條件的技術,在模擬退火演算法中處理約束條件非常有效。方法的思想是將約束條件轉化為懲罰函式,附加在原有的目標函式上構造新的目標函式;當不滿足約束條件時,通過懲罰函式使新的目標函式變差而被捨棄。

  懲罰函式法有外點法和內點法。外點法對可行域外的點(即不滿足約束的點)施加懲罰,對可行域內部的點不懲罰,從而使迭代點向可行域D逼近。 內點法是在可行域內部進行搜尋,約束邊界起到類似圍牆的作用,使目標函式無法穿過,就把搜尋點限制在可行域內了,因此只適用於不等式約束。

  考慮約束優化問題:  
$$
min: f(X)
$$
滿足限制
$$
c_i(X)\leq0
$$
懲罰函式法將問題轉化成如下無約束問題
$$
min: L_k(X)=f(X)+\sigma_k\sum_{i}{g(c_i(X))}
$$
其中
$$
g(c_i(X))=max(0,c_i(X))^2
$$

在上述方程,g(ci(X)) 稱為外部罰函式,sigma(k) 稱為懲罰因子。在每一次迭代中,sigma(k) 都增大,然後求解該無約束問題。將每一次迭代的結果將組成一個序列,此序列的極限即為原約束問題的解。

4、數模案例

  雖然對於線性規劃問題並不推薦使用模擬退火演算法求解。但為了便於理解,本文仍使用之前的線性規劃問題作為處理約束條件的案例。對於非線性規劃問題,以及非線性約束問題,處理方法都是類似的,將在後續進行介紹。

4.1 問題描述:

  某廠生產甲乙兩種飲料,每百箱甲飲料需用原料6千克、工人10名,獲利10萬元;每百箱乙飲料需用原料5千克、工人20名,獲利9萬元。
  今工廠共有原料60千克、工人150名,又由於其他條件所限甲飲料產量不超過8百箱。
  (1)問如何安排生產計劃,即兩種飲料各生產多少使獲利最大?

4.2 問題建模:

  決策變數:
    x1:甲飲料產量(單位:百箱)
    x2:乙飲料產量(單位:百箱)
  目標函式:
    max fx = 10x1 + 9x2
  約束條件:
    6x1 + 5x2 <= 60
    10x1 + 20x2 <= 150
  取值範圍:
    給定條件:x1, x2 >= 0,x1 <= 8
    推導條件:由 x1,x2>=0 和 10*x1+20*x2<=150 可知:0<=x1<=15;0<=x2<=7.5
    因此,0 <= x1<=8,0 <= x2<=7.5

4.3 懲罰函式法求解約束優化問題:

  構造懲罰函式:
    p1 = (max(0, 6*x1+5*x2-60))**2
    p2 = (max(0, 10*x1+20*x2-150))**2
  說明:如存在等式約束,例如:x1 + 2*x2 = m,也可以轉化為懲罰函式:
    p3 = (x1+2*x2-m)**2
    P(x) = p1 + p2 + ...
  構造增廣目標函式:
    L(x,m(k)) = min(fx) + m(k)*P(x)
    m(k):懲罰因子,隨迭代次數 k 逐漸增大

  在模擬退火演算法中,m(k) 隨外迴圈迭代次數逐漸增大,但在內迴圈中應保持不變。

5、模擬退火演算法 Python 程式:懲罰函式法求解約束優化線性規劃問題

# 模擬退火演算法 程式:懲罰函式法求解線性規劃問題
# Program: SimulatedAnnealing_v2.py
# Purpose: Simulated annealing algorithm for function optimization
# v2.0: 使用懲罰函式法處理約束問題
# Copyright 2021 YouCans, XUPT
# Crated:2021-05-01

#  -*- coding: utf-8 -*-
import math                         # 匯入模組
import random                       # 匯入模組
import pandas as pd                 # 匯入模組 YouCans, XUPT
import numpy as np                  # 匯入模組 numpy,並簡寫成 np
import matplotlib.pyplot as plt     
from datetime import datetime


# 子程式:定義優化問題的目標函式
def cal_Energy(X, nVar, mk): 	# m(k):懲罰因子,隨迭代次數 k 逐漸增大
    p1 = (max(0, 6*X[0]+5*X[1]-60))**2
    p2 = (max(0, 10*X[0]+20*X[1]-150))**2
    fx = -(10*X[0]+9*X[1])
    return fx+mk*(p1+p2)


# 子程式:模擬退火演算法的引數設定
def ParameterSetting():
    cName = "funcOpt"           # 定義問題名稱
    nVar = 2                    # 給定自變數數量,y=f(x1,..xn)
    xMin = [0, 0]               # 給定搜尋空間的下限,x1_min,..xn_min
    xMax = [8, 7.5]             # 給定搜尋空間的上限,x1_max,..xn_max

    tInitial = 100.0            # 設定初始退火溫度(initial temperature)
    tFinal  = 1                 # 設定終止退火溫度(stop temperature)
    alfa    = 0.98              # 設定降溫引數,T(k)=alfa*T(k-1)
    meanMarkov = 100            # Markov鏈長度,也即內迴圈執行次數
    scale   = 0.5               # 定義搜尋步長,可以設為固定值或逐漸縮小
    return cName, nVar, xMin, xMax, tInitial, tFinal, alfa, meanMarkov, scale


# 模擬退火演算法
def OptimizationSSA(nVar,xMin,xMax,tInitial,tFinal,alfa,meanMarkov,scale):
    # ====== 初始化隨機數發生器 ======
    randseed = random.randint(1, 100)
    random.seed(randseed)  # 隨機數發生器設定種子,也可以設為指定整數

    # ====== 隨機產生優化問題的初始解 ======
    xInitial = np.zeros((nVar))   # 初始化,建立陣列
    for v in range(nVar):
        # random.uniform(min,max) 在 [min,max] 範圍內隨機生成一個實數
        xInitial[v] = random.uniform(xMin[v], xMax[v])
    # 呼叫子函式 cal_Energy 計算當前解的目標函式值
    fxInitial = cal_Energy(xInitial, nVar, 1) # m(k):懲罰因子,初值為 1

    # ====== 模擬退火演算法初始化 ======
    xNew = np.zeros((nVar))         # 初始化,建立陣列
    xNow = np.zeros((nVar))         # 初始化,建立陣列
    xBest = np.zeros((nVar))        # 初始化,建立陣列
    xNow[:]  = xInitial[:]          # 初始化當前解,將初始解置為當前解
    xBest[:] = xInitial[:]          # 初始化最優解,將當前解置為最優解
    fxNow  = fxInitial              # 將初始解的目標函式置為當前值
    fxBest = fxInitial              # 將當前解的目標函式置為最優值
    print('x_Initial:{:.6f},{:.6f},\tf(x_Initial):{:.6f}'.format(xInitial[0], xInitial[1], fxInitial))

    recordIter = []                 # 初始化,外迴圈次數
    recordFxNow = []                # 初始化,當前解的目標函式值
    recordFxBest = []               # 初始化,最佳解的目標函式值
    recordPBad = []                 # 初始化,劣質解的接受概率
    kIter = 0                       # 外迴圈迭代次數,溫度狀態數
    totalMar = 0                    # 總計 Markov 鏈長度
    totalImprove = 0                # fxBest 改善次數
    nMarkov = meanMarkov            # 固定長度 Markov鏈

    # ====== 開始模擬退火優化 ======
    # 外迴圈,直到當前溫度達到終止溫度時結束
    tNow = tInitial                 # 初始化當前溫度(current temperature)
    while tNow >= tFinal:           # 外迴圈,直到當前溫度達到終止溫度時結束
        # 在當前溫度下,進行充分次數(nMarkov)的狀態轉移以達到熱平衡
        kBetter = 0                 # 獲得優質解的次數
        kBadAccept = 0              # 接受劣質解的次數
        kBadRefuse = 0              # 拒絕劣質解的次數

        # ---內迴圈,迴圈次數為Markov鏈長度
        for k in range(nMarkov):    # 內迴圈,迴圈次數為Markov鏈長度
            totalMar += 1           # 總 Markov鏈長度計數器

            # ---產生新解
            # 產生新解:通過在當前解附近隨機擾動而產生新解,新解必須在 [min,max] 範圍內
            # 方案 1:只對 n元變數中的一個進行擾動,其它 n-1個變數保持不變
            xNew[:] = xNow[:]
            v = random.randint(0, nVar-1)   # 產生 [0,nVar-1]之間的隨機數
            xNew[v] = xNow[v] + scale * (xMax[v]-xMin[v]) * random.normalvariate(0, 1)
            # random.normalvariate(0, 1):產生服從均值為0、標準差為 1 的正態分佈隨機實數
            xNew[v] = max(min(xNew[v], xMax[v]), xMin[v])  # 保證新解在 [min,max] 範圍內

            # ---計算目標函式和能量差
            # 呼叫子函式 cal_Energy 計算新解的目標函式值
            fxNew = cal_Energy(xNew, nVar, kIter)
            deltaE = fxNew - fxNow

            # ---按 Metropolis 準則接受新解
            # 接受判別:按照 Metropolis 準則決定是否接受新解
            if fxNew < fxNow:  # 更優解:如果新解的目標函式好於當前解,則接受新解
                accept = True
                kBetter += 1
            else:  # 容忍解:如果新解的目標函式比當前解差,則以一定概率接受新解
                pAccept = math.exp(-deltaE / tNow)  # 計算容忍解的狀態遷移概率
                if pAccept > random.random():
                    accept = True  # 接受劣質解
                    kBadAccept += 1
                else:
                    accept = False  # 拒絕劣質解
                    kBadRefuse += 1

            # 儲存新解
            if accept == True:  # 如果接受新解,則將新解儲存為當前解
                xNow[:] = xNew[:]
                fxNow = fxNew
                if fxNew < fxBest:  # 如果新解的目標函式好於最優解,則將新解儲存為最優解
                    fxBest = fxNew
                    xBest[:] = xNew[:]
                    totalImprove += 1
                    scale = scale*0.99  # 可變搜尋步長,逐步減小搜尋範圍,提高搜尋精度
                    
        # ---內迴圈結束後的資料整理
        # 完成當前溫度的搜尋,儲存資料和輸出
        pBadAccept = kBadAccept / (kBadAccept + kBadRefuse)  # 劣質解的接受概率
        recordIter.append(kIter)  # 當前外迴圈次數
        recordFxNow.append(round(fxNow, 4))  # 當前解的目標函式值
        recordFxBest.append(round(fxBest, 4))  # 最佳解的目標函式值
        recordPBad.append(round(pBadAccept, 4))  # 最佳解的目標函式值

        if kIter%10 == 0:                           # 模運算,商的餘數
            print('i:{},t(i):{:.2f}, badAccept:{:.6f}, f(x)_best:{:.6f}'.\
                format(kIter, tNow, pBadAccept, fxBest))

        # 緩慢降溫至新的溫度,降溫曲線:T(k)=alfa*T(k-1)
        tNow = tNow * alfa
        kIter = kIter + 1
        fxBest = cal_Energy(xBest, nVar, kIter)  # 由於迭代後懲罰因子增大,需隨之重構增廣目標函式
        # ====== 結束模擬退火過程 ======

    print('improve:{:d}'.format(totalImprove))
    return kIter,xBest,fxBest,fxNow,recordIter,recordFxNow,recordFxBest,recordPBad

# 結果校驗與輸出
def ResultOutput(cName,nVar,xBest,fxBest,kIter,recordFxNow,recordFxBest,recordPBad,recordIter):
    # ====== 優化結果校驗與輸出 ======
    fxCheck = cal_Energy(xBest, nVar, kIter)
    if abs(fxBest - fxCheck)>1e-3:   # 檢驗目標函式
        print("Error 2: Wrong total millage!")
        return
    else:
        print("\nOptimization by simulated annealing algorithm:")
        for i in range(nVar):
            print('\tx[{}] = {:.6f}'.format(i,xBest[i]))
        print('\n\tf(x):{:.6f}'.format(cal_Energy(xBest,nVar,0)))

    # ====== 優化結果寫入資料檔案 ======
    nowTime = datetime.now().strftime('%m%d%H%M')       # '02151456'
    fileName = "..\data\{}_{}.dat".format(cName,nowTime)# 資料檔案的地址和檔名
    optRecord = {
        "iter":recordIter,
        "FxNow":recordFxNow,
        "FxBest":recordFxBest,
        "PBad":recordPBad}
    df_Record = pd.DataFrame(optRecord)
    df_Record.to_csv(fileName, index=False, encoding="utf_8_sig")
    with open(fileName, 'a+', encoding="utf_8_sig") as fid:
        fid.write("\nOptimization by simulated annealing algorithm:")
        for i in range(nVar):
            fid.write('\n\tx[{}] = {:.6f}'.format(i,xBest[i]))
        fid.write('\n\tf(x):{:.6f}'.format(cal_Energy(xBest,nVar,0)))
    print("寫入資料檔案: %s 完成。" % fileName)

    # ====== 優化結果圖形化輸出 ======
    plt.figure(figsize=(6, 4), facecolor='#FFFFFF')     # 建立一個圖形視窗
    plt.title('Optimization result: {}'.format(cName))  # 設定圖形標題
    plt.xlim((0, kIter))                                # 設定 x軸範圍
    plt.xlabel('iter')                                  # 設定 x軸標籤
    plt.ylabel('f(x)')                                  # 設定 y軸標籤
    plt.plot(recordIter, recordFxNow,'b-', label='FxNow')     # 繪製 FxNow 曲線
    plt.plot(recordIter, recordFxBest, 'r-', label='FxBest')  # 繪製 FxBest 曲線
    # plt.plot(recordIter,recordPBad,'r-',label='pBadAccept')  # 繪製 pBadAccept 曲線
    plt.legend()  # 顯示圖例
    plt.show()

    return


# 主程式
def main():

    # 引數設定,優化問題引數定義,模擬退火演算法引數設定
    [cName, nVar, xMin, xMax, tInitial, tFinal, alfa, meanMarkov, scale] = ParameterSetting()
    # print([nVar, xMin, xMax, tInitial, tFinal, alfa, meanMarkov, scale])

    # 模擬退火演算法    [kIter,xBest,fxBest,fxNow,recordIter,recordFxNow,recordFxBest,recordPBad] \
        = OptimizationSSA(nVar,xMin,xMax,tInitial,tFinal,alfa,meanMarkov,scale)
    # print(kIter, fxNow, fxBest, pBadAccept)

    # 結果校驗與輸出
    ResultOutput(cName, nVar,xBest,fxBest,kIter,recordFxNow,recordFxBest,recordPBad,recordIter)


if __name__ == '__main__':
    main()

6、執行結果

Optimization by simulated annealing algorithm:
    x[0] = 6.577964
    x[1] = 4.111469
    f(x):-102.782857

參考文獻:

(1)胡山鷹,陳丙珍,非線性規劃問題全域性優化的模擬退火法,清華大學學報,1997,37(6):5-9
(2)李歧強,具有約束指導的模擬退火演算法,系統工程,2001,19(3):49-55

版權說明:
原創作品
Copyright 2021 YouCans, XUPT
Crated:2021-05-01

相關文章