前言
最近需要用到遺傳演算法來優化一些東西,最初是打算直接基於某些演算法實現一個簡單的函式來優化,但是感覺單純寫個非通用的函式執行後期改進運算元或者別人使用起來都會帶來困難,同時遺傳演算法基本概念和執行流程相對固定,改進也一般通過編碼機制,選擇策略,交叉變異運算元以及引數設計等方面,對於演算法的整體結構並沒有大的影響。這樣對於遺傳演算法來說,就非常適合寫個相對固定的框架然後給運算元、引數等留出空間以便對新演算法進行測試和改進。於是就動手寫了個遺傳演算法的小框架gaft,本文對此框架進行一些介紹並分別以一個一維搜尋和二維搜尋為例子對使用方法進行了介紹。
GitHub: github.com/PytLab/gaft
PyPI: pypi.python.org/pypi/gaft
目前框架只是完成了最初的版本,比較簡陋,內建了幾個基本的常用運算元,使用者可以根據介面規則實現自定義的運算元並放入框架中執行。我自己也會根據自己的需求後續新增更多的改進運算元,同時改進框架使其更加通用.
正文
遺傳演算法介紹
這裡我對遺傳演算法的基本概念進行簡要的介紹,並闡述gaft的設計原則。
簡單而言,遺傳演算法使用群體搜尋技術,將種群代表一組問題的可行解,通過對當前種群施加選擇,交叉,變異等一些列遺傳操作來產生新一代的種群,並逐步是種群進化到包含近似全域性最優解的狀態。下面我將遺傳學和遺傳演算法相關術語的對應關係總結一下:
術語
遺傳學術語 | 遺傳演算法術語 |
---|---|
群體 | 可行解集 |
個體 | 可行解 |
染色體 | 可行解的編碼 |
基因 | 可行解編碼的分量 |
基因形式 | 遺傳編碼 |
適應度 | 評價函式值 |
選擇 | 選擇操作 |
交叉 | 交叉操作 |
變異 | 變異操作 |
演算法特點
- 以決策變數的編碼作為運算物件,使得優化過程借鑑生物學中的概念成為可能
- 直接以目標函式作為搜尋資訊,確定搜尋方向很範圍,屬於無導數優化
- 同時使用多個搜尋點的搜尋資訊,算是一種隱含的並行性
- 是一種基於概率的搜尋技術
- 具有自組織,自適應和自學習等特性
演算法流程
gaft 設計原則
由於遺傳演算法的流程相對固定,我們優化演算法基本上也是在流程整體框架下對編碼機制,運算元,引數等進行修改,因此在寫框架的時候,我便想把那些固定的遺傳運算元,適應度函式寫成介面,並使用元類、裝飾器等方式實現對介面的限制和優化,這樣便可以方便後續自定義算符和適應度函式定製。最後將各個部分組合到一起組成一個engine然後根據演算法流程執行遺傳演算法對目標進行優化.
這樣我們便脫離每次都要寫遺傳演算法流程的繁瑣,每次只需要像寫外掛一樣實現自己的運算元和適應度函式便可以將其放入gaft開始對演算法進行測試或者對目標函式進行優化了。
GAFT檔案結構
此部分我對自己實現的框架的整體結構進行下介紹.
.
├── LICENSE
├── MANIFEST.in
├── README.rst
├── examples
│ ├── ex01
│ └── ex02
├── gaft
│ ├── __init__.py
│ ├── __pycache__
│ ├── analysis
│ ├── components
│ ├── engine.py
│ ├── operators
│ └── plugin_interfaces
├── setup.cfg
├── setup.py
└── tests
├── flip_bit_mutation_test.py
├── gaft_test.py
├── individual_test.py
├── population_test.py
├── roulette_wheel_selection_test.py
└── uniform_crossover_test.py複製程式碼
目前的檔案結果如上所示,
/gaft/components
中定義了內建的個體和種群型別,提供了兩種不同的遺傳編碼方式:二進位制編碼和實數編碼。/gaft/plugin_interfaces
中是外掛介面定義,所有的運算元定義以及on-the-fly分析的介面規則都在裡面,使用者可以根據此來編寫自己的外掛並放入到engine中。/gaft/operators
裡面是內建遺傳運算元,他們也是遵循/gaft/plugin_interfaces
中的規則進行編寫,可以作為編寫運算元的例子。其中運算元我目前內建了roulette wheel選擇運算元,uniform 交叉運算元和flipbit變異運算元,使用者可以直接使用內建運算元來使用gaft對自己的問題進行優化。/gaft/analysis
裡面是內建的on-the-fly分析外掛,他可以在遺傳演算法迭代的過程中對迭代過程中的變數進行分析,例如我在裡面內建了控制檯日誌資訊輸出,以及迭代適應度值的儲存等外掛方便對進化曲線作圖。/gaft/engine
便是遺傳演算法的流程控制模組了,他將所有的之前定義的各個部分組合到一起使用遺傳演算法流程進行優化迭代。
使用GAFT
下面我就以兩個函式作為例子來使用GAFT對目標函式進行優化.
一維搜尋
首先我們先對一個簡單的具有多個區域性極值的函式進行優化,我們來使用內建的運算元求函式
$$
f(x) = x + 10sin(5x) + 7cos(4x)
$$
的極大值,x的取值範圍為$[0, 10]$
先匯入需要的模組
from math import sin, cos # 匯入種群和內建運算元相關類 from gaft import GAEngine from gaft.components import GAIndividual from gaft.components import GAPopulation from gaft.operators import RouletteWheelSelection from gaft.operators import UniformCrossover from gaft.operators import FlipBitMutation # 用於編寫分析外掛的介面類 from gaft.plugin_interfaces.analysis import OnTheFlyAnalysis # 內建的存檔適應度函式的分析類 from gaft.analysis.fitness_store import FitnessStoreAnalysis # 我們將用兩種方式將分析外掛註冊到遺傳演算法引擎中複製程式碼
建立引擎
# 定義種群 indv_template = GAIndividual(ranges=[(0, 10)], encoding='binary', eps=0.001) population = GAPopulation(indv_template=indv_template, size=50) # 建立遺傳運算元 selection = RouletteWheelSelection() crossover = UniformCrossover(pc=0.8, pe=0.5) mutation = FlipBitMutation(pm=0.1) # 建立遺傳演算法引擎, 分析外掛和適應度函式可以以引數的形式傳入引擎中 engine = GAEngine(population=population, selection=selection, crossover=crossover, mutation=mutation, analysis=[FitnessStoreAnalysis])複製程式碼
自定義適應度函式
可以通過修飾符的方式將,適應度函式註冊到引擎中。
@engine.fitness_register def fitness(indv): x, = indv.variants return x + 10*sin(5*x) + 7*cos(4*x)複製程式碼
自定義on-the-fly分析外掛
也可以通過修飾符在定義的時候直接將外掛註冊到引擎中
@engine.analysis_register class ConsoleOutputAnalysis(OnTheFlyAnalysis): interval = 1 def register_step(self, ng, population, engine): best_indv = population.best_indv(engine.fitness) msg = 'Generation: {}, best fitness: {:.3f}'.format(ng, engine.fitness(best_indv)) engine.logger.info(msg) def finalize(self, population, engine): best_indv = population.best_indv(engine.fitness) x = best_indv.variants y = engine.fitness(best_indv) msg = 'Optimal solution: ({}, {})'.format(x, y) engine.logger.info(msg)複製程式碼
Ok, 開始跑(優化)吧!
我們這裡跑100代種群.
if '__main__' == __name__: # Run the GA engine. engine.run(ng=100)複製程式碼
內建的分析外掛會在每步迭代中記錄得到的每一代的最優個體,並生成資料儲存。
繪製一下函式本身的曲線和我們使用遺傳演算法得到的進化曲線:
優化過程動畫:
二維搜尋
下面我們使用GAFT內建運算元來搜尋同樣具有多個極值點的二元函式
$$
f(x) = ysin(2\pi x) + xcos(2\pi y)
$$
的最大值,x, y 的範圍為 $[-2, 2]$.
這裡我們就不自定義分析外掛了,直接使用內建的分析類,並在構造引擎時直接傳入.
'''
Find the global maximum for binary function: f(x) = y*sim(2*pi*x) + x*cos(2*pi*y)
'''
from math import sin, cos, pi
from gaft import GAEngine
from gaft.components import GAIndividual
from gaft.components import GAPopulation
from gaft.operators import RouletteWheelSelection
from gaft.operators import UniformCrossover
from gaft.operators import FlipBitMutation
# Built-in best fitness analysis.
from gaft.analysis.fitness_store import FitnessStoreAnalysis
from gaft.analysis.console_output import ConsoleOutputAnalysis
# Define population.
indv_template = GAIndividual(ranges=[(-2, 2), (-2, 2)], encoding='binary', eps=0.001)
population = GAPopulation(indv_template=indv_template, size=50)
# Create genetic operators.
selection = RouletteWheelSelection()
crossover = UniformCrossover(pc=0.8, pe=0.5)
mutation = FlipBitMutation(pm=0.1)
# Create genetic algorithm engine.
# Here we pass all built-in analysis to engine constructor.
engine = GAEngine(population=population, selection=selection,
crossover=crossover, mutation=mutation,
analysis=[ConsoleOutputAnalysis, FitnessStoreAnalysis])
# Define fitness function.
@engine.fitness_register
def fitness(indv):
x, y = indv.variants
return y*sin(2*pi*x) + x*cos(2*pi*y)
if '__main__' == __name__:
engine.run(ng=100)複製程式碼
進化曲線:
二維函式面:
搜尋過程動畫:
可見目前內建的基本運算元都能很好的找到例子中函式的最優點。
總結
本文主要介紹了本人開發的一個用於遺傳演算法做優化計算的Python框架,框架內建了遺傳演算法中常用的元件,包括不同編碼方式的個體,種群,以及遺傳運算元等。同時框架還提供了自定義遺傳運算元和分析外掛的介面,能夠方便快速搭建遺傳演算法流程並用於演算法測試。
目前框架僅僅處於初步階段,後續會在自己使用的過程中逐步完善更多的內建運算元,是框架更加通用。本文中的兩個優化例子均能在GitHub上找到原始碼(github.com/PytLab/gaft…)
目前的計劃:1. 新增更多的內建運算元; 2. 給內建運算元和元件新增C++ backend; 3. 並行化
參考
- 《智慧優化演算法及其MATLAB例項》
- 《MATLAB最優化計算》