淺析拉格朗日乘數法及其對偶問題

葉小小qaq發表於2022-07-11

原文網址 : https://www.cnblogs.com/yj179101536/p/16456932.html

拉格朗日乘數(Lagrange Multipliers)法

在數學最優問題中，拉格朗日乘數法（以數學家約瑟夫·路易斯·拉格朗日命名）是一種尋找變數受一個或多個條件所限制的多元函式的極值的方法。這種方法將一個有n個變數與k個約束條件的最優化問題轉換為一個有n + k個變數的方程組的極值問題，其變數不受任何約束。這種方法引入了一種新的標量未知數，即拉格朗日乘數：約束方程的梯度（gradient）的線性組合裡每個向量的係數。此方法的證明牽涉到偏微分，全微分或鏈法，從而找到能讓設出的隱函式的微分為零的未知數的值。

引入問題

給定一個函式：$z = f(x, y)$如何求其極值點呢？
顯然根據多元函式求極值定理(必要條件)：設函式$z = f(x, y)$在點$(x_{0}, y_{0})$具有偏導數，且在點$(x_{0}, y_{0})$處有極值，則有
$f_{x}(x_{0}, y_{0})$ = 0, $f_{y}(x_{0}, y_{0})$ = 0
即：函式在點$(x_{0}, y_{0})$處有偏導且有極值則該點處偏導為0，具體方法不作敘述，參考高等數學Ⅱ
現在將問題難度加大，如果再加上約束條件呢？面積固定，求體積最大？

$V(x,y,z) = xyz$ $2xy+2xz+2yz = S$

正文

上圖是對拉格朗日乘數法的敘述
假設有兩個函式$f(x,y)$和$g(x,y)$，且這兩個函式的一階偏導數都是連續函式，在$g(x,y)=k$ and $\triangledown g(a,b)≠(0,0)$的前提下，函式$f(x,y)$在某個$(a,b)$點產生了區域性極值,可以找到一個實數$\lambda$使得$\triangledown f(a,b)=\lambda \triangledown g(a,b)$

$f(x,y)$是右圖中的3D曲面，左圖中的$g(x,y)$是約束條件,我們將$g(x,y)$向上面的$f(x,y)$進行投影可以得到曲面上有一條藍色的曲線，這條曲線就是在$g(x,y)$的約束條件下$f(x,y)$的所有取值點，接下來我們就要從中找到最值。

我們引入一個水平面$z=h$,水平面與曲面相交處的投影是一個橢圓，水平面向上移動時，會首先與曲面上藍色的曲線相交於圖上兩個綠色的點，此時如左圖（投影圖）所示，$h=2$。水平面繼續向上移動時會與曲面上藍色的曲線一直相交於4個點，直到相交於兩個點時，即為圖上的紅點，此時如左圖所示，$h=4$。當水平面繼續向上移動時就再也不可能與曲面上藍色的曲線相交了。如右圖我們可以知道$h=2$和$h=4$時的交點是在約束條件下曲面的極值點，並且此時的藍色曲線與水平面相切。在左圖中可以看出當處於極值點時$f(x,y)$和$g(x,y)$共同相切與同一條直線，所以此時兩函式在此交點的處的法向量是共線的，即$\triangledown f(x,y)=\lambda \triangledown g(x,y)$

Ep: Find the extreme values of the function $f(x,y)=x^{2}+2y^{2}$ on the circle $x^{2}+y^{2}=1\longrightarrow type1$

Sol: Let $g(x,y)=x^{2}+y^{2}$ and we get circle $\Rightarrow$ $g(x,y)=x^{2}+y^{2}=1$

If $\triangledown f(x,y)=\lambda \triangledown g(x,y)$, then $(f_{x},f_{y})=\lambda (g_{x},g_{y}) \Rightarrow (2x,4y)=\lambda (2x,2y)$

$\begin{cases}2x=2\lambda x\Rightarrow& 2x(\lambda-1)=0\Rightarrow x=0,\lambda=1\\4y=2\lambda y\Rightarrow & 2y=\lambda y\longrightarrow type2\end{cases}$

If x=0, then $type1 \Rightarrow y^{2}=1 \Rightarrow y=±1\Rightarrow(x,y)=(0,1)or(0,-1)$

If $\lambda$=1, then $type2 \Rightarrow2y=y\Rightarrow y=0\Rightarrow x^{2}=1\Rightarrow x=±1 \\\Rightarrow(x,y)=(1,0)or(-1,0)$

(x,y)	(0,1),(0,-1)	(1,0),(-1,0)
f(x,y)	2,2	1, 1
extremum	abs max value	abs min value

\[f(x,y)\:has\begin{cases}an\:abs\:max\:value\:2\:of\:(0,1),(0,-1)\\an\:abs\:min\:value\:1\:of\:(1,0),(-1,0)\end{cases} \]

簡言之

求解函式：$z=f(x,y)$在條件$\phi(x,y)=0$條件下的極值。

解：

建構函式$F(x,y)=f(x,y)+\lambda\phi(x,y)$,其中$\lambda$為拉格朗日乘數

\[\begin{cases}f_{x}(x,y)+\lambda\phi_{x}(x,y)=0 \\f_{y}(x,y)+\lambda\phi_{y}(x,y)=0,\\\phi(x,y)=0.\end{cases} \]

其中$(x,y)$就是極值點座標

自變數多於兩個的條件下

函式：$u=f(x,y,z,t)$在條件$\phi(x,y,z,t)=0, \Psi(x,y,z,t)=0$下的極值

建構函式：$F(x,y,z,t)=f(x,y,z,t)+\lambda_{1}\phi(x,y,z,t)+\lambda_{2}\Psi(x,y,z,t)$

其中$\lambda_{1},\lambda_{2}$均為拉格朗日乘數，同樣通過偏導為0以及約束條件求解

如：

函式：$u=x^{3}y^{2}z$，約束條件：$x,y,z$之和為12，求其最大值。

解：

建構函式：$F(x,y,z)=x^{3}y^{2}z+\lambda(x+y+z-12)$
分別求偏導：

\[\begin{cases}F^{’}_{x}=3x^{2}y^{2}z+\lambda=0\\F^{’}_{y}=2x^{3}yz+\lambda=0\\F^{’}_{z}=x^{3}y^{2}+\lambda=0\\x+y+z=12\end{cases} \]

唯一駐點：(6,4,2)
$u_{max}=6^{3}\cdot 4^{2}\cdot 2=6912$

例：

在第一卦限內作橢圓球面$\frac{x^{2}}{a^{2}}+\frac{y^{2}}{b^{2}}+\frac{z^{2}}{c^{2}}=1$的切平面，使切平面與三個座標面所圍成的四面體體積最小，求切點座標。

解：

設$P(x_{0},y_{0},z_{0})$為橢球面上的一點，令$F(x,y,z)=\frac{x^{2}}{a^{2}}+\frac{y^{2}}{b^{2}}+\frac{z^{2}}{c^{2}}-1$

則$F^{'}_{x}|_{p}=\frac{2x_{0}}{a^{2}},F^{'}_{y}|_{p}=\frac{2y_{0}}{b^{2}},F^{'}_{z}|_{p}=\frac{2z_{0}}{a^{2}}$

過$P(x_{0},y_{0},z_{0})$的切平面方程為
$\frac{x_{0}}{a^{2}}(x-x_{0})+\frac{y_{0}}{b^{2}}(y-y_{0})+\frac{z_{0}}{c^{2}}(z-z_{0})=0$

化簡為$\frac{x·x_{0}}{a^{2}}+\frac{y·y_{0}}{b^{2}}+\frac{z·z_{0}}{c^{2}}=1$

該切平面在三個軸上的截距各為$x=\frac{a^{2}}{x_{0}},y=\frac{b^{2}}{y_{0}},z=\frac{c^{2}}{z_{0}}$

所求四面體的體積$V=\frac{1}{6}xyz=\frac{a^{2}b^{2}c^{2}}{6x_{0}y_{0}z_{0}}$

在條件$\frac{x_{0}^{2}}{a^{2}}+\frac{y_{0}^{2}}{b^{2}}+\frac{z_{0}^{2}}{c^{2}}=1$下求V的最小值，

目標函式$V=\frac{a^{2}b^{2}c^{2}}{6x_{0}y_{0}z_{0}}$, 約束條件$\frac{x_{0}^{2}}{a^{2}}+\frac{y_{0}^{2}}{b^{2}}+\frac{z_{0}^{2}}{c^{2}}=1$

令$u=lnx_{0}+lny_{0}+lnz_{0}$

$L(x_{0},y_{0},z_{0})=lnx_{0}+lny_{0}+lnz_{0}+\lambda(\frac{x_{0}^{2}}{a^{2}}+\frac{y_{0}^{2}}{b^{2}}+\frac{z_{0}^{2}}{c^{2}}-1)$

由$\begin{cases}L^{'}_{x_{0}}=0,L^{'}_{y_{0}}=0,L^{'}_{z_{0}}=0\\\frac{x_{0}^{2}}{a^{2}}+\frac{y_{0}^{2}}{b^{2}}+\frac{z_{0}^{2}}{c^{2}}-1=0\end{cases}$
$L(x_{0},y_{0},z_{0})=lnx_{0}+lny_{0}+lnz_{0}+\lambda(\frac{x_{0}^{2}}{a^{2}}+\frac{y_{0}^{2}}{b^{2}}+\frac{z_{0}^{2}}{c^{2}}-1)$

即$\begin{cases}\frac{1}{x_{0}}+\frac{2\lambda x_{0}}{a^{2}}=0\\\frac{1}{y_{0}}+\frac{2\lambda y_{0}}{b^{2}}=0\\\frac{1}{z_{0}}+\frac{2\lambda z_{0}}{c^{2}}=0\\\frac{x_{0}^{2}}{a^{2}}+\frac{y_{0}^{2}}{b^{2}}+\frac{z_{0}^{2}}{c^{2}}-1=0\end{cases}$, 可得$\begin{cases}x_{0}=\frac{a}{\sqrt{3}}\\y_{0}=\frac{b}{\sqrt{3}}\\z_{0}=\frac{c}{\sqrt{3}}\end{cases}$

故當切點座標為$(\frac{a}{\sqrt{3}},\frac{b}{\sqrt{3}},\frac{c}{\sqrt{3}})$
四面體的體積最小$V_{min}=\frac{\sqrt{3}}{2}abc$

拉格朗日對偶(Lagrange duality)問題

利用拉格朗日對偶性，可以將約束最優化的原始問題(廣義拉格朗日極小極大問題)，轉變為無約束最優化的對偶問題(拉格朗日極大極小問題)。

原始問題

假設在$x\in R^{n}$下，$f(x),c_{i}(x),h_{j}(x)$連續且可微，約束最優化問題，如下

\[\min \limits_{x\in R^{n}}f(x)\\ s.t\:c_{i}(x)\leqslant0,\:i=1,2,...,k\\ h_{j}(x)=0,\:j=1,2,...,l \]

稱為約束最優化問題的原始問題。

引入廣義拉格朗日函式(generalized Lagrange function)
$L(x,\alpha,\beta)=f(x)+\displaystyle\sum\limits_{i=1}^k \alpha_{i}c_{i}(x)+\displaystyle\sum\limits_{j=1}^l \beta_{j}h_{j}(x)$
$x=(x^{(1)},x^{(2)},x^{(3)}...x^{(n)})^{T}\in R^{n}$
特別的$  \alpha_{i}\geqslant0$

定義$\theta_{p}(x)=\max \limits_{\alpha,\beta:\alpha_{i}\geqslant0}L(x,\alpha,\beta)$

若$x$違背原始的約束條件，$c_{i}(x)>0$則讓$\alpha_{i}$為$+\infty$，其他$\alpha和\beta$引數都為0，則$\theta_{p}(x)=+\infty$

若$x$違背原始的約束條件，$h_{i}(x)≠0$則讓$\beta_{i}h_{i}(x)=+\infty$，其他$\alpha和\beta$引數都為0，則$\theta_{p}(x)=+\infty$

若$x$滿足原始的約束條件，則讓全部的$\beta_{i}h_{i}(x)=0和\alpha_{i}c_{i}(x)=0，f(x)$是一個與$\alpha和\beta$無關的常量，則$\theta_{p}(x)=f(x)$，也就是$\theta_{p}(x)=\begin{cases}f(x)，x滿足原始問題約束\\+\infty，x不滿足原始問題約束\end{cases}$
則原問題(滿足約束條件下)等價於：$\min \limits_{x}\theta_{p}(x)=\min \limits_{x}\max \limits_{\alpha,\beta:\alpha_{i}\geqslant0}L(x,\alpha,\beta)=\min \limits_{x}f(x)$

即$\min \limits_{x}\theta_{p}(x)$與原始優化問題等價,所以常用$\min \limits_{x}\theta_{p}(x)$代表原始問題，下標 $P$ 表示原始問題，定義原始問題的最優值為：$p^{*}=\min \limits_{x}\theta_{p}(x)$

通過拉格朗日函式重新定義一個無約束的問題，這個無約束的問題等價於原來的約束優化問題，從而將約束問題無約束化。

對偶問題：

$\theta_{d}(\alpha,\beta)=\min \limits_{x}L(x,\alpha,\beta)$
這裡注意等式右邊是關於$x$的函式的最小化，$x$確定以後，最小值就只與$\alpha,\beta$有關，所以是一個關於$\alpha,\beta$的函式。

$\max \limits_{\alpha,\beta:\alpha_{i}\geqslant0}\theta_{d}(\alpha,\beta)=\max \limits_{\alpha,\beta:\alpha_{i}\geqslant0}\min \limits_{x}L(x,\alpha,\beta)$

這就是原始問題的對偶問題，再把原始問題寫出來：
$\min \limits_{x}\theta_{p}(x)=\min \limits_{x}\max \limits_{\alpha,\beta:\alpha_{i}\geqslant0}L(x,\alpha,\beta)$
形式上可以看出很對稱，只不過原始問題是先固定$L(x,\alpha,\beta)$中的$x$，優化出引數$\alpha,\beta$，再優化最優$x$;
而對偶問題是先固定$\alpha,\beta$ ，優化出最優$x$，然後再確定引數$\alpha,\beta$
定義對偶問題的最優值：$d^{*}=\max \limits_{\alpha,\beta:\alpha_{i}\geqslant0}\theta_{d}(\alpha,\beta)$

也就是說原始問題的最優值不小於對偶問題的最優值，但是我們要通過對偶問題來求解原始問題，就必須使得原始問題的最優值與對偶問題的最優值相等，當原始問題與對偶問題的最優值相等時，原始問題和對偶問題的可行解就是最優解。

原始問題與對偶問題的關係

由上述推導有：
$\max \limits_{\alpha,\beta:\alpha_{i}\geqslant0}\theta_{d}(\alpha,\beta)\leqslant\min \limits_{x}\theta_{p}(x)$
即：$d^{*}\leqslant p^{*}$

得出推論：
設$x^{*}和\alpha^{*},\beta^{*}$分別是原始問題和對偶問題的可行解，如果$d^{*}=p^{*}$，則$x^{*}和\alpha^{*},\beta^{*}$分別是原始問題和對偶問題的最優解。

所以，當原始問題和對偶問題的最優值相等：$d^{*}=p^{*}$時，可以用求解對偶問題來求解原始問題（當然是對偶問題求解比直接求解原始問題簡單的情況下），滿足什麼樣的條件才能使原始問題的最優值與對偶問題的最優值相等，KKT條件：

\[\nabla_{x}L(x,\alpha,\beta)=0\\ \nabla_{\alpha}L(x,\alpha,\beta)=0\\ \nabla_{\beta}L(x,\alpha,\beta)=0\\ \alpha_{i}c_{i}(x)=0,\:i=1,2,...,k\\ c_{i}(x)\leqslant0,\:i=1,2,...,k\\ \alpha_{i}\geqslant0,\:i=1,2,...,k\\ h_{j}(x)=0,\:j=1,2,...,l \]

前面三個條件對應各個變數的偏導數為0（這裡需要假設三個函式連續可微，若不連續，這裡的偏導數存在與否就不能夠保證），後面四個條件就是原始問題的約束條件以及拉格朗日乘子需要滿足的約束，其中$\alpha_{i}c_{i}=0$為對偶互補條件。

線性規劃的對偶問題——由拉格朗日對偶問題匯出
2024-06-23
拉格朗日對偶性
2020-05-21
一文理解拉格朗日對偶和KKT條件
2018-09-09
拉格朗日對偶性(Lagrange duality)
2019-08-05
拉格朗日插
2024-03-22
拉格朗日插值
2024-11-27
洛谷P4781 【模板】拉格朗日插值(拉格朗日插值)
2018-12-01
數值分析Python實現系列—— 一、拉格朗日插值法
2019-05-11
Python
拉格朗日(Lagrange)中值定理
2024-04-28
拉格朗日插值學習筆記
2024-04-20
筆記
BZOJ2655: calc(dp 拉格朗日插值)
2018-12-04
學習筆記：FFT與拉格朗日插值
2024-05-09
筆記FFT
Tomcat訪問日誌淺析
2018-11-10
Tomcat
淺析volatile原理及其使用
2018-11-20
深入理解SVM之對偶問題
2018-04-11
淺析RunLoop原理及其應用
2020-04-06
OOP
解析對偶理論與對偶單純性法
2021-09-11
尤拉計劃709：偶數袋
2020-04-05
C# Task若干問題淺析
2024-09-29
C#
一分鐘衝刺完拉格朗日差值
2024-05-04
對偶理論和對偶單純形法——Python實現
2024-06-01
Python
AutoMySQLBackup加密備份解密問題淺析
2024-05-14
MySql加密解密
淺析遊戲內的古建築風格及其背後的含義
2019-05-29
遊戲
洛谷P4593 [TJOI2018]教科書般的褻瀆(拉格朗日插值)
2018-12-03
深入理解SVM，軟間隔與對偶問題
2020-09-03
[譯]淺析t-SNE原理及其應用
2020-02-21
MyEclipse中連線MySQL的問題淺析ZP
2022-03-22
EclipseMySql
零拷貝(Zero-copy) 淺析及其應用
2020-07-08
對偶單純形法演算法精要
2024-09-01
演算法
通過 PHP 與 Python 程式碼對比淺析語法差異
2019-07-09
PHPPython
通過PHP與Python程式碼對比淺析語法差異
2019-07-19
PHPPython
c++偶現問題備錄
2024-08-29
C++
機器學習，詳解SVM軟間隔與對偶問題
2020-09-09
機器學習
SQL Server中datetimeset轉換datetime型別問題淺析
2020-12-28
SQLServer型別
非對稱加密--RSA原理淺析
2019-01-07
加密
淺析DNS劫持及應對方案
2022-11-15
DNS
敢問路在何方——Flutter 路由淺析
2021-03-22
Flutter路由
H5下拉重新整理和上拉載入實現原理淺析
2018-04-17
H5