內容
形如 \(f[i][j]=min(f[i][j],f[i][k]+f[k+1][j]+w[i][j]),k\in[i,j-1]\) 的轉移方程
如果滿足 \(w[i][j]+w[i+1][j+1]\le w[i][j+1]+w[i+1][j]\)
並且 \(f[i][j]+f[i+1][j+1]\le f[i][j+1]+f[i+1][j]\)
即 \(w\) 函式和 \(f\) 函式同時滿足四邊形不等式,也就是交叉小於包含
設 \(s[i][j]\) 為 \(f[i][j]\) 的最優決策點,則有 \(s[i][j-1]\le s[i][j]\le s[i+1][j]\)
列舉決策點的範圍就可以大大減少
可以把 \(dp\) 的時間複雜度從 \(n^3\) 優化為 \(n^2\)
應用
一般來說,如果有一個 \(n^3\) 的 \(dp\)做法滿足上面的形式並且該題 \(n^2\) 可過,都可以考慮用四邊形不等式去優化
如果不會證明可以打表或者對拍
有兩種形式的 \(dp\) 經常用到此類優化
一種是類似於石子合併的區間 \(dp\)
設 \(f[l][r]\) 為區間 \([l,r]\) 中的最小值
另一種是分組 \(dp\)
設 \(f[i][j]\) 為前 \(i\) 物品分為 \(j\) 組的最小价值
程式碼(CF321E)
#include<cstdio>
#include<algorithm>
#include<cstring>
#include<cmath>
#include<iostream>
#define rg register
inline int read(){
rg int x=0,fh=1;
rg char ch=getchar();
while(ch<'0' || ch>'9'){
if(ch=='-') fh=-1;
ch=getchar();
}
while(ch>='0' && ch<='9'){
x=(x<<1)+(x<<3)+(ch^48);
ch=getchar();
}
return x*fh;
}
const int maxn=4e3+5;
int n,m,a[maxn][maxn],sum[maxn][maxn],f[maxn][maxn],w[maxn][maxn],g[maxn][maxn];
int main(){
memset(f,0x3f,sizeof(f));
n=read(),m=read();
for(rg int i=1;i<=n;i++){
for(rg int j=1;j<=n;j++){
a[i][j]=read();
}
}
for(rg int i=1;i<=n;i++){
for(rg int j=1;j<=n;j++){
sum[i][j]=sum[i-1][j]+sum[i][j-1]-sum[i-1][j-1]+a[i][j];
}
}
for(rg int i=1;i<=n;i++){
for(rg int j=1;j<i;j++){
w[j][i]=(sum[i][i]-sum[i][j-1]-sum[j-1][i]+sum[j-1][j-1])>>1;
}
}
f[0][0]=0;
for(rg int i=0;i<=m;i++) g[n+1][i]=n;
for(rg int j=1;j<=m;j++){
for(rg int i=n;i>=1;i--){
for(rg int k=g[i][j-1];k<=g[i+1][j];k++){
if(f[i][j]>f[k][j-1]+w[k+1][i]){
f[i][j]=f[k][j-1]+w[k+1][i];
g[i][j]=k;
}
}
}
}
printf("%d\n",f[n][m]);
return 0;
}