字尾陣列(後續)
字尾陣列 Height
利用字尾陣列快速求出2個字尾的lcp長度
lcp:最長公共字首
lcp(suf(i),suf(j))
記Height[l] = 排名第(l-1)字尾和排名第l字尾的lcp長度
Height[l] = lcp(suf(SA[l-1]),suf(SA[l]))
l = 字尾suf(i)的排名
r = 字尾suf(j)的排名
結論:
lcp(suf(i),suf(j)) = min(Height[l+1]…Height[r] )
即兩個字尾的lcp = 它們排名區間中Height的最小值
維護rmq
求Height陣列
暴力求O(N2)
for i =1-N
l =rank[i]
j = sa[l-i]
k=0
while(s[i+k]==s[j+k])k++;
Height[l]=k;
suf(k)為s(k…n)構成的子串
SA[1]排序第1的字尾的開始位置
令l =rank[i],r = rank[i-1]
Height[l] = lcp(suf(SA[l-i],suf(i)))
Height[r] = lcp(suf(SA[r-1],suf(i-1)))
結論:
Height[l] >= Height[r]-1
Height[rank[i]] >= Height[rank[i-1]] - 1
利用Height[rank[i]] >= Height[rank[i-1]] - 1優化暴力
複雜度為O(N)
for i =1-N
j = sa[l-i]
k=max(0,Height[rank[i-1]-1])
while(s[i+k]==s[j+k])k++;
Height[l]=k;
之後再用st表來來維護Height的rmq資訊
總結:
倍增求長度為2k子串的字典序
排序是二元組的基數排序
求SA O(NlogN)
求Height O(N)
求lcp
st表 預處理O(NogN)+單次詢問O(1)
P3809 【模板】字尾排序
P4051 【JSOI2007】字元加密
程式碼:
#include<bits/stdc++.h>
using namespace std;
const int MAXN =1000005;
char ch[MAXN], all[MAXN];
int sa[MAXN], rk[MAXN], height[MAXN], tax[MAXN], tp[MAXN], a[MAXN], n, m;
char str[MAXN];
//rk[i] 第i個字尾的排名; sa[i] 排名為i的字尾位置; height[i] 排名為i的字尾與排名為(i-1)的字尾的LCP
//tax[i] 計數排序輔助陣列; tp[i] rk的輔助陣列(計數排序中的第二關鍵字),與sa意義一樣。
//a為原串
void RSort() {
//rk第一關鍵字,tp第二關鍵字。
for (int i = 0; i <= m; i ++) tax[i] = 0;
for (int i = 1; i <= n; i ++) tax[rk[tp[i]]] ++;
for (int i = 1; i <= m; i ++) tax[i] += tax[i-1];
for (int i = n; i >= 1; i --) sa[tax[rk[tp[i]]] --] = tp[i]; //確保滿足第一關鍵字的同時,再滿足第二關鍵字的要求
} //計數排序,把新的二元組排序。
int cmp(int *f, int x, int y, int w) { return f[x] == f[y] && f[x + w] == f[y + w]; }
//通過二元組兩個下標的比較,確定兩個子串是否相同
void Suffix() {
//sa
for (int i = 1; i <= n; i ++) rk[i] = a[i], tp[i] = i;
m = 127 ,RSort(); //一開始是以單個字元為單位,所以(m = 127)
for (int w = 1, p = 1, i; p < n; w += w, m = p) { //把子串長度翻倍,更新rk
//w 當前一個子串的長度; m 當前離散後的排名種類數
//當前的tp(第二關鍵字)可直接由上一次的sa的得到
for (p = 0, i = n - w + 1; i <= n; i ++) tp[++ p] = i; //長度越界,第二關鍵字為0
for (i = 1; i <= n; i ++) if (sa[i] > w) tp[++ p] = sa[i] - w;
//更新sa值,並用tp暫時存下上一輪的rk(用於cmp比較)
RSort(), swap(rk, tp), rk[sa[1]] = p = 1;
//用已經完成的sa來更新與它互逆的rk,並離散rk
for (i = 2; i <= n; i ++) rk[sa[i]] = cmp(tp, sa[i], sa[i - 1], w) ? p : ++ p;
}
//離散:把相等的字串的rk設為相同。
//LCP
int j, k = 0;
for(int i = 1; i <= n; height[rk[i ++]] = k)
for( k = k ? k - 1 : k, j = sa[rk[i] - 1]; a[i + k] == a[j + k]; ++ k);
//這個知道原理後就比較好理解程式
}
void Init() {
scanf("%s", str);
n = strlen(str);
for (int i = 0; i < n; i ++) a[i + 1] = str[i];
}
int main() {
Init();
Suffix();
int ans = height[2];
for (int i = 3; i <= n; i ++) ans += max(height[i] - height[i - 1], 0);
for(int i=1;i<=n;i++)
cout<<sa[i]<<" ";
puts("");
// printf("%d\n", ans);
}
相關文章
- 字尾陣列模板陣列
- 字尾陣列 SA陣列
- 字尾陣列,SA陣列
- 字尾陣列複習陣列
- 字尾陣列詳解陣列
- 【筆記】字尾陣列筆記陣列
- OI loves Algorithm——字尾陣列Go陣列
- 學習筆記----字尾陣列筆記陣列
- 字尾陣列 學習筆記陣列筆記
- 字尾陣列學習筆記陣列筆記
- BZOJ2882: 工藝(字尾陣列)陣列
- POJ 3581-Sequence(字尾陣列)陣列
- POJ 1743 Musical Theme(字尾陣列)陣列
- POJ 2217-Secretary(字尾陣列+高度陣列-最大公共子串長度)陣列
- POJ1743 Musical Theme(字尾陣列 二分)陣列
- POJ2774Long Long Message(字尾陣列模板)陣列
- P10469 字尾陣列(Hash+二分)陣列
- 【資料結構與演算法】字串匹配(字尾陣列)資料結構演算法字串匹配陣列
- Codeforces #123D: 字尾陣列+單調棧3D陣列
- SPOJ 694 求一個字串有多少子串 字尾陣列字串陣列
- ural 1297 最長迴文子串 字尾陣列陣列
- POJ 2774-Long Long Message(字尾陣列+高度陣列-最大公共子串長度)陣列
- 洛谷P5108 仰望半月的夜空(字尾陣列)陣列
- SPOJ 687. Repeats(字尾陣列求最長重複子串)陣列
- POJ 3415 Common Substrings(字尾陣列求重複字串)陣列字串
- URAL 1297. Palindrome(字尾陣列求最大回文串)陣列
- HDU5147 Sequence II(樹狀陣列+字首和+字尾和)陣列
- BZOJ 4650 [Noi2016]優秀的拆分:字尾陣列陣列
- [POJ 3415] Common Substrings (字尾陣列+單調棧優化)陣列優化
- SPOJ 694. Distinct Substrings,705. New Distinct Substrings(字尾陣列)陣列
- poj 2774 求兩字串的最長公共子串 字尾陣列字串陣列
- 演算法學習-數字連續的子陣列演算法陣列
- lc3041 修改陣列後最大化陣列中的連續元素數目陣列
- 第五章 字串專題 ---------------- 字串匹配(三)----字尾陣列演算法字串匹配陣列演算法
- 洛谷P3763 [TJOI2017]DNA(字尾陣列 RMQ)陣列MQ
- POJ 3693 Maximum repetition substring(字尾陣列求最長重複子串)陣列
- POJ 3294 Life Forms(字尾陣列求k個串的最長子串)ORM陣列
- SPOJ 220. Relevant Phrases of Annihilation(字尾陣列多次不重疊子串)陣列