遺傳演算法中適值函式的標定與大變異演算法

iPytLab發表於2017-09-24

前言

本文嘗試對遺傳演算法中不同適值函式的標定(Scaling)方法進行下總結,並針對常用的線性標定和動態線性標定進行了Python實現,以裝飾器的形式新增到遺傳演算法框架GAFT中,這樣在使用GAFT執行遺傳演算法迭代的時候可以更加Pythonic的給自定義的適值函式進行標定。最後針對能夠防止早熟情況的大變異演算法進行了相應的實現。

目前(動態)線性標定裝飾器以及大變異運算元均已新增到GAFT中,gaft專案連結:

適值函式的標定

選擇壓力

The tendency to select the best member of the current generation is known as selective pressure.

選擇壓力也就是種群中最好個體與最壞個體被選中概率的差值,這個差距越大,選中好個體的趨勢就越大,則成為選擇壓力大。

適值函式的標定

一般情況下,直接拿目標函式作為適值函式十分的方便,但是很多情況下卻不能這麼做,例如對於求最小值問題,我們必須將目標函式取反才能作為適值函式(這是最簡單的情況)。

當我們遺傳演算法中不同個體適值函式的值相對差別很小的時候,我們根據適應度值的大小進行個體選擇的選擇壓力(Selective pressure)就會變小,選優的能力弱化,這個時候我們需要對原始的適值函式進行標定(Scaling)是的他們相對差別增大,進而增大選擇壓力,增強演算法的選優能力。

例如:

 WX20170924-205842@2x

區域性搜尋、廣域搜尋與選擇壓力的關係

在遺傳演算法中,區域性搜尋同廣域搜尋其實相互矛盾的,注重區域性搜尋則會陷入區域性最優,但是注重廣域搜尋會導致演算法精確開發能力不強。因此需要綜合兩者考慮,我們可以在搜尋剛剛開始的時候使用較小的選擇壓力來廣域搜尋,隨著迭代的進行可以動態的增大選擇壓力來使演算法偏向於區域性搜尋。

幾種不同的適值函式標定方法

對目標函式的標定方法一般有:線性標定、動態線性標定、冪律標定、對數標定等

線性標定

線性標定的形式:

WX20170924-210412@2x

其中f為標定後的適值函式,ff為原始的目標函式。

求最大值

對於求目標函式的最大值的時候, 即 arg max f(x)

我們取a=1,b=fmin+ξ, 其中ξ是一個較小的數,目的是使得種群中最差個體也有被選中的機會,不然自身減掉ffmin=0ξ的存在可以增加種群的多樣性。

最終的適值函式表示式:

WX20170924-210512@2x

求最小值

當我們需要求目標函式最小值的時候,arg min f(x),我們需要對目標函式進行取反操作, 即
a=1,b=fmaxf(x)+ξ

最終的適值函式表示式:

WX20170924-210641@2x

GAFT中新增對於目標函式的標定

由於適值函式標定並不針對某個目標函式,我便想通過裝飾器的方式來方便給任何自定義的fitness函式進行標定。對於基本的線性標定,我在GAEngine中新增了個帶引數的裝飾器:

這個時候如果我們在定義了一個自己的目標函式以後,想對其進行線性標定便可以使用engine的這個裝飾器對函式進行修飾即可, 像下面這樣:

其中裝飾器中的引數分別為:

  • target: 優化目標函式到最小值還是最大值,值可以是:'max'或者'min'
  • ksi: 即公式中ξξ

動態線性標定

動態線性標定是遺傳演算法中最常用的標定方法,他是基於上面提到的線性標定,線上性標定中的ξξ在動態線性標定中並不是一成不變的,而是隨著迭代次數的增加而變化。

動態線性標定的函式表示式:

WX20170924-210947@2x

其中,k為迭代指標,表示ξ會隨著迭代數而不同。

求最大值

當我們的優化目標是目標函式的最大值,這是我們取ak=1,bk=fmin+ξk, 這是的函式表達為:

WX20170924-211049@2x

求最小值

求最小值的時候需要取反操作,這時取ak=−1,bk=fmax+ξk, 最終函式表示式:

WX20170924-211157@2x

關於ξk

動態線性標定中的ξk作用同線性標定中的ξ選擇壓力調節值, 它的存在使得種群中最壞的個體仍有被選中的機會,但是動態標定中的ξkξk的值會隨著kk增大而減小。

ξkξk的取值: ξ0=M,ξk=ξk1r,r[0.9,0.999], 我們通過調節Mr來調節ξk

通過可以動態變化的ξk,我們可以使廣域搜尋範圍寬保持種群的多樣性,區域性搜尋保持收斂性,即,開始時希望選擇小,迭代到後面希望選擇壓力逐漸變大.

GAFT中新增給目標函式新增動態線性標定

與上面線性標定的方法相同,GAFT中同樣使用了標定裝飾器來裝飾使用者自定義的目標函式,實現程式碼:

這裡充分的利用Python的閉包,在engine中獲取當前種群最大值與最小值的相關資料。

在指令碼中修飾目標函式便可以這樣:

其他標定方法

這裡簡要的介紹下其他標定方法。

冪律標定

  • 函式表示式: f=fα
  • α的取值, α>1增大選擇壓力, α<1減小選擇壓力

對數標定

  • 函式表示式: f=aLnf+b
  • 作用: 縮小目標函式之間的差別

指數標定

  • 函式表示式: f=aebf+c
  • 作用: 擴大目標函式間的差別

視窗技術

  • 函式表示式: f=affw
  • fw為前W代中的目標函式最小值,他考慮了各代fmin的波動,這樣fw具有記憶性

大變異演算法

眾所周知,簡單的遺傳演算法存在“早熟”的問題,也就是演算法過早的收斂到一個非全域性最優點,出現此問題的主要原因是一種被稱為“頂端優勢”的現象存在,即當演算法進行到某一代時,在種群中某個個體的適應度遠遠大於任何一個個體的適應度,導致選擇演算法總是會選到此個體生成子代個體,極限情況下就是所有個體都來自統一祖先,即”早熟”。除了對目標函式進行標定,我們可以通過大變異演算法來避免早熟。

大致思路: 當某代中所有個體集中在一起時,我們以一個遠大於通常變異概率的概率執行一次變異操作,具有大變異概率的變異操作能夠隨機、獨立的產生許多新的個體,從而是整個種群脫了“早熟”。

如何判斷種群個體的集中程度

通常採取比較種群中所有個體的適應度值的平均值favg與最大值fmax的接近程度來判斷,如果最大值與平均值越接近說明個體就越集中。

具體過程

當某一代的最大適應度fmax與平均適應度值favg滿足:

WX20170924-211455@2x

其中,0.5<α<1, 被稱為密集因子,表徵個體集中程度。隨後,我們以一個大變異概率進行一次變異操作(通常大5倍以上), 即“打散”。

大變異操作的兩個引數

  1. 密集因子α: 決定大變異操作在整個過程中所佔的比重,其數值約接近0.5,大變異操作越頻繁
  2. 大變異概率: 概率越大,大變異演算法的穩定性就越好,但是收斂速度可能會降低,當大變異概率的數值為0.5的時候,大變異操作就近似退化為隨機搜尋

GAFT中的大變異運算元

大變異操作與具體的變異運算元實現無關,這裡我還是依據內建的FlipBitMutation運算元為基礎, 具體的程式碼實現參見https://github.com/PytLab/gaft/blob/master/gaft/operators/mutation/flip_bit_mutation.py

總結

本文嘗試對遺傳演算法中不同適值函式的標定(Scaling)方法進行下總結,並針對常用的線性標定和動態線性標定進行了Python實現,以裝飾器的形式新增到遺傳演算法框架GAFT中,這樣在使用GAFT執行遺傳演算法迭代的時候可以更加Pythonic的給自定義的適值函式進行標定。最後針對能夠防止早熟情況的大變異演算法進行了相應的實現。

參考

  • 《MATLAB最優化計算(第三版)》
  • 馬鈞水, 劉貴忠, 賈玉蘭. 改進遺傳演算法搜尋效能的大變異操作[J]. 控制理論與應用, 1998(3):404-408.

打賞支援我寫出更多好文章,謝謝!

打賞作者

打賞支援我寫出更多好文章,謝謝!

遺傳演算法中適值函式的標定與大變異演算法

相關文章