epiACO - a method for identifying epistasis based on ant Colony optimization algorithm

撅嘴巴胡搞瞎搞發表於2017-10-18

epiACO相較於普通的蟻群演算法加入了適應性函式Svalue,路徑選擇策略以及路徑記憶性策略。其中的Svalue結合了互資訊和貝葉斯網路的優點,路徑選擇策略分為概率路徑選擇策略和隨機路徑選擇策略,路徑記憶性策略顧名思義,就是指會保留上一次迭代的備選路徑,並且和本次迭代結果進行比較。

本論文將epiACO演算法和epiMODE, TEAM, BOOST, SNPRuler, AntEpiseeker, AntMiner, MACOED, IACO 進行了比較,使用了相同的模擬資料以及老年斑病症的真實資料。

GWAS現在在研究複雜疾病的領域有著重要的角色,也證實了很多SNP位點和疾病相關聯。可是大多數SNP位點只能解釋符合孟德爾規律的疾病,對於非孟德爾規律的疾病無能為力。最近在GWAS的研究中發現SNP間的非線性關係(epistasis 異位顯性)可以解釋大部分複雜疾病的遺傳率。

目前異位顯性(epistasis)檢測方法大致可以根據其搜尋策略分為以下三種:全面搜尋、隨機搜尋和啟發式搜尋。
全面搜尋:計算所有SNP位點與表型的關聯,代表演算法有BOOST、TEAM、MDR , 其中MDR演算法是該搜尋策略中最流行的,但其搜尋時間較長,只限於小資料集。
隨機搜尋:該搜尋策略依賴資料集大小,因此不適合全基因組規模的大資料集。代表演算法有epiMODE、epiForest、BEAM。
啟發式搜尋:根據啟發式資訊和先驗概率充分減少時間複雜度,但啟發式搜尋容易丟失全域性最優解,陷入區域性最優。代表性演算法有SNPRuler。

很多蟻群優化演算法都屬於啟發式搜尋。AntEpiSeeker有兩個階段,需要大量的螞蟻數和迭代次數才可以找到可接受解。AntMiner將啟發式資訊加入了螞蟻選擇路徑的策略中,相比其他演算法而言,有著廣泛的搜尋能力,但時間成本較高。MACOED是一種監督啟發式搜尋策略,綜合了邏輯迴歸和貝葉斯網路,雖然該演算法在搜尋能力和計算可行性方面都比較出眾,但是其資訊素更新策略並沒有十分有效。

相關文章