SA：從入門到入土

storms11發表於2024-10-30

原文網址 : https://www.cnblogs.com/storms11/p/18515610

基本應用

讀入一個長度為 $ n $ 的由大小寫英文字母或數字組成的字串，請把這個字串的所有非空字尾按字典序（用 ASCII 數值比較）從小到大排序。

解法

1.將每個字尾取出來，直接排序 $O(n^2 \log n)$
2.用hash二分LCP比較下一位，$O(n \log^2 n)$
3.倍增求字尾陣列，$O(n \log n)$
4.高階方法求字尾陣列，$O(n)$

倍增

先比較每個字尾的第一位，再比較前兩位，前四位...
問題在於如何快速比較前兩位，前四位。
一個有趣的性質是在比較$2^k$位時，我們知道$2^{k-1}$位的大小，所以$2^k$位的大小隻與前一半$2^{k-1}$和後一半$2^{k-1}$有關，所以可以用基數排序由上一層推到這一層。

基數排序

正常基數排序，是按數位從高到低依次比較大小，比如說三位數，就先比較百位的數字，將百位為 $0$ 的放在一起，將百位為 $1$ 的放在一起...。然後，對十位進行比較，在百位為 $0$ 的裡面把十位為 $0$ 的放在一起，十位為 $1$ 的放在一起...，最後所有數都有序。
SA的基數排序，就是相當於只有兩位數來排序。

程式碼實現

程式碼比較抽象要多理解，多思考

點選檢視程式碼

#include <bits/stdc++.h>
using namespace std;
const int N=1e6+10;
int n,m,sa[N],rk[N],x[N],y[N],cnt,num;
char s[N];
void SA()
{
	for(int i=1;i<=n;i++)rk[x[i]=s[i]]++;//rk輔助陣列，x是上一層的排名
	for(int i=1;i<=m;i++)rk[i]+=rk[i-1];
	for(int i=n;i>=1;i--)sa[rk[x[i]]--]=i;//正序倒序都可以，sa是排名為i的字尾的起始下標
	for(int k=1;k<=n;k<<=1)
	{
		cnt=0;
		for(int i=n-k+1;i<=n;i++)y[++cnt]=i;//沒有後一半是最強的，最靠前的
		for(int i=1;i<=n;i++)if(sa[i]>k)y[++cnt]=sa[i]-k;//如果可以做後一半，就做
		//正序列舉，因為y的順序是後一半從小到大的順序
		for(int i=1;i<=m;i++)rk[i]=0;//清零
		for(int i=1;i<=n;i++)rk[x[i]]++;//根據前一半
		for(int i=1;i<=m;i++)rk[i]+=rk[i-1];
		for(int i=n;i>=1;i--)sa[rk[x[y[i]]]--]=y[i],y[i]=0;//後一半更大的在前一半相同時排後面
		swap(x,y);//y臨時存一下上一層x的值。
		x[sa[1]]=1,num=1;
		for(int i=2;i<=n;i++)
		{
			x[sa[i]]=(y[sa[i]]==y[sa[i-1]]&&y[sa[i]+k]==y[sa[i-1]+k])?num:++num;//確定這一層的排名
		}
		if(num==n)break;//分完了
		m=num;
	} 
    for(int i=1;i<=n;i++)cout<<sa[i]<<' ';
}
int main()
{
	ios::sync_with_stdio(0);
	cin.tie(0);cout.tie(0);
    cin>>s+1;
    n=strlen(s+1),m=150;
    SA();
	return 0;
}

進階應用

Jdbc從入門到入土
2022-05-19
JDBC
幀數，從入門到入土
2019-05-07
GIT從入門到入土（IDEA整合）
2021-08-03
GitIdea
JavaWeb從入門到入土第10天
2020-10-03
JavaWeb
Java學習路線從入門到入土
2020-09-21
Java
HTTP從入門到入土(5)——HTTP報文格式
2018-08-23
HTTP
QT從入門到入土（四）——多執行緒
2021-07-20
QT執行緒
【資料彙總】GNN從入門到入土+文獻閱讀入門
2020-11-01
GNN
JS正規表示式從入門到入土（5）—— 量詞
2018-07-04
JS
QT從入門到入土（八）——專案打包和釋出
2021-08-20
QT
QT從入門到入土（四）——多執行緒(QtConcurrent::run())
2021-08-05
QT執行緒
QT從入門到入土（三）——訊號和槽機制
2021-07-17
QT
QT從入門到入土（三）——檔案的讀寫操作
2021-07-17
QT
JS正規表示式從入門到入土（10）—— 字串物件方法
2018-07-11
JS字串物件
HydroOJ 從入門到入土（16）快速佈置固定作業（>=4.10.3）
2024-04-28
Hexo結合Stun靜態部落格搭建從入門到入土
2020-12-19
Hexo
Rust從入坑到入土-入坑-String compared to str
2021-06-14
Rust
JS正規表示式從入門到入土（8）—— REGEXP物件屬性
2018-07-09
JS物件
HydroOJ 從入門到入土（17）批次轉化其他格式題庫到 HydroOJ 格式（Python）
2024-04-29
Python
JS正規表示式從入門到入土（2）—— 元字元和字元類
2018-06-28
JS字元
JS正規表示式從入門到入土（9）—— test方法以及它的那些坑
2018-07-11
JS
HydroOJ 從入門到入土（20）已透過的題目顯示 AC 程式碼
2024-06-29
QT從入門到入土（九）——TCP/IP網路通訊（以及檔案傳輸）
2021-08-27
QTTCP
scala 從入門到入門+
2019-02-16
makefile從入門到入門
2020-10-06
kafka從入門到關門
2020-10-31
Kafka
MyBatis從入門到精通(一)：MyBatis入門
2019-06-28
MyBatis
Promise從入門到精通
2019-01-14
Promise
LESS從入門到精通
2019-03-17
Git 從入門到精通
2019-03-08
Git
babel從入門到跑路
2018-08-09
Babel
SAP從入門到精通
2018-06-29
Python從入門到精通
2024-03-09
Python
Thymeleaf從入門到精通
2020-07-24
Eclipse從入門到精通
2019-06-11
Eclipse
vim從入門到精通
2022-05-24
Shell從入門到精通
2021-01-28
Service Worker 從入門到出門
2019-07-11

SA：從入門到入土

基本應用

解法

倍增

基數排序

程式碼實現

進階應用

相關文章