AI工程師必備技能 - 凸最佳化介紹

贪心科技發表於2019-01-23

原文網址 : https://www.jiqizhixin.com/articles/2019-01-23-15

前言

最佳化方法是幾乎所有機器學習模型中最重要的核心部分，其重要性也是需要強調的。凸最佳化是最佳化方法論中的特例，是一個非常大的領域，想要細緻地學習需要花費不少時間，本文作為階段性學習的總結，透過演算法思維和常見演算法的目標函式引出凸最佳化內容，並介紹了作為演算法工程師我們最需要了解的凸最佳化領域的重要方法論，希望透過分享給大家，能夠對大家在演算法領域的學習有所幫助，如果本文中的方法論有誤的話，還請各路大神進行指正。

將業務場景中需要解決的問題轉化為數學問題，並寫出嚴格的數學模型（目標函式）
針對寫出的數學模型判斷凹凸性
根據目標的函式的凹凸性判斷問題型別（如果目標函式是凸函式，我們需要判斷該函式所屬問題型別，常見的問題型別有Linear Programming、Quadratic Programming等；如果目標函式是非凸函式，也需要判斷其所屬問題型別，常見有Setcover Problem，Max flow Problem等）
根據不同的問題型別使用不同的最佳化方法論解決問題。

其實在實際解決問題的過程中，其實大家都不太會在意第1,2個步驟點，可能都會直接透過經驗去查詢相應的工具解決問題，但是這樣的解決思路是不太好的，因為在這個過程中，我們可能不知道需要解決的問題和我們選擇的工具是否匹配，如果結果不太理想，我們可能也不知道其中的原因。但是如果我們在解決問題前，定義了嚴格的目標函式，我們不僅可以針對該目標函式選擇相應的最佳化方法，也可以根據業務場景，對目標函式進行相應調整，增加專案的成功率。

常見目標函式

我將工作中可能會用到的常見的一些演算法的目標函式進行了列舉，如下：

AI工程師必備技能 - 凸最佳化介紹 二. 凸集與凸函式

凸最佳化的重要性

從函式的凹凸性而言，我們通常把函式分為凸函式和非凸函式。凸函式是有且只有全域性最優解的，而非凸函式可能有多個區域性最優解，這些特性我會在下文中進行詳細解釋。在前言中，我提到過最佳化問題是機器學習模型中的核心部分，而針對不同模型，有不同的方法論對其目標函式進行最佳化。例如針對邏輯迴歸、線性迴歸這樣的凸函式，使用梯度下降或者牛頓法可以求出引數的全域性最優解，針對神經網路這樣的非凸函式，我們可能會找到許多區域性最優解。

不難看出，我們希望在實際解決問題過程中，都希望我們建立的目標函式是凸函式，這樣我們不必擔心區域性最優解問題，但實際上，我們遇到的問題大多數情況下建立的目標函式都是非凸函式，因此我們需要根據場景選擇不同的最佳化方法。

凸最佳化定義

就定義而言，凸最佳化是：在最小化（最大化）的最佳化要求下，目標函式是凸函式且約束條件所形成的可行域集合是一個凸集的最佳化方法，因此凸最佳化的判定條件有兩個，1.函式定義域是凸集 2.目標函式是凸函式。

凸集的定義：假設對於任意x, y ∈ C and 任意引數α ∈ [0, 1], 我們有αx + (1 − α)y ∈ C,集合C為凸集。

凸集的理解：對凸集的理解，我們可以分別從理論定義的角度和函式影像的角度兩方面理解。從定義上講，對於集合C中的任意兩個元素x和y，需要滿足αx + (1 − α)y 的值也需要在集合C中；從函式影像角度講，這個定義中的式子含義是，x、y兩點連線上的任意一個點都需要屬於集合C，如下圖所示，任何證明集合是凸集的方法都可以透過定義和函式影像兩方面進行。

AI工程師必備技能 - 凸最佳化介紹

凸集的性質：兩個凸集的交集也是凸集。

常見凸集與證明方法：

AI工程師必備技能 - 凸最佳化介紹

凸函式定義：函式f的定義域為凸集，對於定義域裡的任意x, y，函式滿足： AI工程師必備技能 - 凸最佳化介紹

AI工程師必備技能 - 凸最佳化介紹

凸函式與凹函式之間的關係：如果f(x)是凸函式，則-f(x)是凹函式

凸函式的證明方法（函式定義域為凸集的前提下）：

AI工程師必備技能 - 凸最佳化介紹

常見凸函式及證明：

AI工程師必備技能 - 凸最佳化介紹

三. 經典的凸最佳化問題

維基百科中羅列了一些經典的凸最佳化問題和對應的維基百科連結，在此總結一下：

Least squares（最小二乘法，常用，目標：線性關係；限制條件：線性關係）
Convex quadratic minimization with linear constraints（線性約束條件下的二次規劃問題，常用，目標：平方關係；限制條件：線性關係）
Linear programming（線性規劃）
Quadratic minimization with convex quadratic constraints
Conic optimization
Geometric programming
Second order cone programming
Semidefinite programming
Entropy maximization with appropriate constraints

四. 非凸最佳化問題的最佳化

在實際的業務應用場景中，我們定義出的目標函式很可能是非凸函式，非凸函式不僅可能存在很多區域性最優解，對我們尋找全域性最優解造成了很大的困擾，甚至有些最佳化方法論的複雜度非常高，可能O(P^N)這樣的NP hard問題，這樣的問題我們是沒有辦法很好進行最佳化的，因此我們在尋找最佳化方法論時，一定要選擇更合理的方法論。很多非凸最佳化問題可以轉化（並非是等價的）為凸最佳化問題，並給出問題的近似解。

鬆弛（Relaxation）

透過對問題限制條件的鬆弛，可以將原問題等價為凸最佳化問題。注：鬆弛原問題，只能得到一個可行域更大的問題，如果原問題是求最小，則鬆弛後的問題的最優值一定小於等於原問題的最優值，這也是一種給出下界的方法。鬆弛不僅僅用於整數約束，只要利於將定義域非凸變為凸集即可。

說起來可能比較抽象，我們透過下面的Set cover Problem來詳細說明一下

Set cover Problem

AI工程師必備技能 - 凸最佳化介紹

最佳化方法：

AI工程師必備技能 - 凸最佳化介紹

鬆弛（Relaxation）的問題點

透過上面Set cover Problem中透過relaxation的方式求解引數，我們不難發現，其實透過對問題的轉化，我們雖然能夠快速對問題求解了，但是我們求出來的最優解與原問題的最優解可能是相等，也可能有一定的誤差的，所以透過relaxation，我們需要證明relaxation得出的最優解和原問題的最優解的誤差範圍。

當我們拿到一個業務問題，一定需要按照演算法思維那一節做，先將問題轉換為一個嚴謹的數學問題，判斷我們寫出的目標函式的凹凸性，如果目標函式非凸，我們需要對問題的限制條件做一些轉化，進而求出轉化後問題的近似解，並證明其與原問題的誤差範圍。如果是凸函式，我們需要選擇相應的最佳化方法論進行最佳化，因為最佳化問題是機器學習演算法中的核心部分。

以上是對凸最佳化的方法論的一些總結與梳理，不得不說，凸最佳化是一個很深奧也很大的領域，並且透過一些非凸函式的最佳化方法論，也能感受出如果要嚴格解決一個數學問題，步驟是很嚴謹的，文中的觀點如果有錯誤的地方，還請各路大神不吝賜教。

參考：

貪心學院 - 做線上教育領域的MIT，立志於培養最頂級的工程師，www.greedyai.com
www2.imm.dtu.dk/pubdb/v
en.wikipedia.org/wiki/C

原文來自學員知乎作業：

https://zhuanlan.zhihu.com/p/55295699

AI工程師必備技能 - 凸優化介紹
2019-01-23
AI工程師優化
web前端工程師必備技能
2022-10-11
Web前端工程師
Yocto專案介紹及入門 -- 嵌入師工程師必備利器
2021-02-09
工程師
優秀的DevOps工程師必須具備的軟技能
2020-01-15
dev工程師
PHP全棧工程師必備技能select2的使用
2019-11-22
PHP全棧工程師
影像處理演算法工程師必備技能總結
2020-12-01
演算法工程師
Java程式設計師必備技能
2020-11-07
Java程式設計師
如何編寫介面測試用例？測試工程師必備技能！
2018-11-29
工程師
前端工程師必備資源
2019-01-24
前端工程師
資料分析師必備技能都有哪些？
2019-03-04
2019前端工程師必備前端開發資源必備
2019-10-30
前端工程師
DevOps 工程師成長日記系列一：必備知識與技能組合
2019-06-13
dev工程師
大資料測試工程師入門級必備技能，你get了嗎？
2018-12-26
大資料工程師
Java架構師必備技能：docker使用大全
2022-02-18
Java架構Docker
新手程式設計師必備10大技能
2021-07-14
程式設計師
Hacker必備技能
2024-10-09
打造個人貼身助理-小白必備AI技能
2024-07-15
AI
程式設計師必備技能-科學砍需求
2019-01-17
程式設計師
Git算不算程式設計師的必備技能？
2018-04-26
Git程式設計師
Linux運維工程師必備工具合集
2019-04-20
Linux運維工程師
裁員了！別錯過2024年大資料工程師必備的10項技能
2024-04-16
大資料工程師
從苦逼到牛逼！2019年最全最新Linux運維工程師必備技能圖譜……
2019-06-24
Linux運維工程師
測試開發工程必備技能之一：Mock的使用
2020-12-04
Mock
前端工程師必備：前端的模組化
2019-04-12
前端工程師
iOS工程師Mac上的必備軟體
2019-07-05
iOS工程師Mac
高薪全棧工程師必備 Linux 基礎
2019-01-29
高薪全棧工程師Linux
網路安全工作必備技能，系統安全有網路安全工程師來守護
2021-09-18
工程師
大資料開發工程師需要具備哪些技能？
2022-07-21
大資料工程師
前端切圖必備技能
2020-04-10
前端
一個合格的程式設計師，需要哪些必備技能？
2018-05-24
程式設計師
程式設計師必備技能：一鍵建立windows 服務
2024-02-03
程式設計師Windows
程式設計師必備畫圖技能之——時序圖
2020-07-13
程式設計師時序圖
前端工程師面試必備（持續更新中）
2019-05-06
前端工程師面試
分享一個 BACnet 除錯工具工程師必備
2024-08-05
除錯工程師
Python工程師具備哪些技能才能提升求職機率？
2021-07-14
Python工程師求職
新手入門必備：kylin安裝教程介紹！
2018-08-02
資料庫開發必備知識介紹
2023-01-30
資料庫
linux網路工程師需要掌握哪些技能？linux網路工程師技能分析
2019-01-23
Linux工程師

AI工程師必備技能 - 凸最佳化介紹

前言

目錄

四. 非凸最佳化問題的最佳化

相關文章