POJ 2299-Ultra-QuickSort（樹狀陣列求逆序數）

kewlgrl發表於2016-05-07

Ultra-QuickSort

Time Limit: 7000MS		Memory Limit: 65536K
Total Submissions: 52967		Accepted: 19434

Description

In this problem, you have to analyze a particular sorting algorithm. The algorithm processes a sequence of n distinct integers by swapping two adjacent sequence elements until the sequence is sorted in ascending order. For the input sequence
9 1 0 5 4 ,
Ultra-QuickSort produces the output
0 1 4 5 9 .
Your task is to determine how many swap operations Ultra-QuickSort needs to perform in order to sort a given input sequence.

Input

The input contains several test cases. Every test case begins with a line that contains a single integer n < 500,000 -- the length of the input sequence. Each of the the following n lines contains a single integer 0 ≤ a[i] ≤ 999,999,999, the i-th input sequence element. Input is terminated by a sequence of length n = 0. This sequence must not be processed.

Output

For every input sequence, your program prints a single line containing an integer number op, the minimum number of swap operations necessary to sort the given input sequence.

Sample Input

Sample Output

6
0

Source

Waterloo local 2005.02.05

題目意思：

有一組數，求升序排列需要交換多少次，即對給定的每組數逆序數。
可以用選擇排序、歸併排序和樹狀陣列的思想來考慮，但是選擇排序會超時。

解題思路：

這裡我們考慮用樹狀陣列來解決。
分兩步，離散化和求逆序數。
①離散化
因為題目中給出的n < 500,000而0 ≤ a[i] ≤ 999,999,999，所以我們可以把輸入的N個數a[i]，按大小順序分別對映到1~N。
例如 9 1 0 5 4 可以離散化對映為 5 2 1 4 3.
②求逆序數
“逆序數就是數中各位在它前面有多少個數比它大，求出這些元素個數之和。”
每輸入一個數就更新一次c陣列再判斷一次當前比這個數大的數的個數。
說明：
i是當前已經插入的數字的個數；
num[i]是原序列中的數離散化後的各個數；
getsum(num[i])表示比num[i]小的數的個數，getsum(num[i])等於num[num[i]–lowbit(num[i])+1]+...+num[num[i]]；
i-getsum(num[i])表示比num[i]大的數的個數，這就是逆序數。

Note：困擾了我好幾個小時的就是為什麼“getsum(num[i])表示比num[i]小的數的個數”？
想了很久，我的理解是這樣的：
因為是依次插入，每次都做查詢，所以肯定是與當前的數有關。c陣列是對陣列的一種求和統計，每次輸入後需要更新，更新時把該數被包含在c陣列裡的資料全部加一，所以c[i]表示當前比i小的數的個數。

程式碼一：先更新再求和

#include<cstdio>
#include<cstring>
#include<iostream>
#include<algorithm>
using namespace std;
#define MAXN 500005
int c[MAXN],n,num[MAXN];
struct Node
{
    int val,no;
} data[MAXN];
bool cmp(Node a,Node b)
{
    return a.val<b.val;
}
int lowbit(int x)
{
    return x&(-x);
}
void update(int x,int v)
{
    while(x<=n)
    {
        c[x]+=v;
        x+=lowbit(x);
    }
}
int getsum(int x)
{
    int sum=0;
    while(x)
    {
        sum+=c[x];
        x-=lowbit(x);
    }
    return sum;
}
int main()
{
    int i;
    long long ans;
    while(scanf("%d",&n),n)
    {
        memset(c,0,sizeof(c));
        for(i=1; i<=n; i++)
        {
            scanf("%d",&data[i].val);
            data[i].no=i;//儲存每個數輸入時的下標
        }
        sort(data+1,data+n+1,cmp);//對輸入的序列排序
        for(i=1; i<=n; i++)
        {
            //離散化，把n個點按大小對映到1~n
            //data[i].no是數在原序列中的下標
            num[data[i].no]=i;//離散下標表示
        }
        ans=0;
        for(i=1; i<=n; i++)
        {
            //n是總數，num[i]是原序列中的數離散化後的各個數
            //getsum(num[i])表示比num[i]小的數的個數
            //getsum(num[i])等於num[num[i]–lowbit(num[i])+1]+...+num[num[i]]
            update(num[i],1);
            ans+=i-getsum(num[i]);
        }
        cout<<ans<<endl;
    }
}

程式碼二：先求和再更新

#include<cstdio>
#include<cstring>
#include<iostream>
#include<algorithm>
using namespace std;
#define MAXN 500005
int c[MAXN],n,num[MAXN];
struct Node
{
    int val,no;
} data[MAXN];
bool cmp(Node a,Node b)
{
    return a.val<b.val;
}
int lowbit(int x)
{
    return x&(-x);
}
void update(int x,int v)
{
    while(x<=n)
    {
        c[x]+=v;
        x+=lowbit(x);
    }
}
int getsum(int x)
{
    int sum=0;
    while(x)
    {
        sum+=c[x];
        x-=lowbit(x);
    }
    return sum;
}
int main()
{
    int i;
    long long ans;
    while(scanf("%d",&n),n)
    {
        memset(c,0,sizeof(c));
        for(i=0; i<n; i++)
        {
            scanf("%d",&data[i].val);
            data[i].no=i;//儲存每個數輸入時的下標
        }
        sort(data,data+n,cmp);//對輸入的序列排序
        for(i=0; i<n; i++)
        {
            //離散化，把n個點按大小對映到1~n
            //data[i].no是數在原序列中的下標
            num[data[i].no]=i+1;//離散下標表示
        }
        ans=0;
        for(i=0; i<n; i++)
        {
            //n是總數，num[i]是原序列中的數離散化後的各個數
            //getsum(n)是數在原序列中的下標
            //getsum(num[i])表示比num[i]小的數的個數
            //getsum(num[i])等於num[num[i]–lowbit(num[i])+1]+...+num[num[i]]
            ans+=(getsum(n)-getsum(num[i]));
            update(num[i],1);
        }
        cout<<ans<<endl;
    }
}

轉載：

樹狀陣列，具體的說是離散化+樹狀陣列。這也是學習樹狀陣列的第一題.

演算法的大體流程就是：

1.先對輸入的陣列離散化，使得各個元素比較接近，而不是離散的，

2.接著，運用樹狀陣列的標準操作來累計陣列的逆序數。

演算法詳細解釋：

1.解釋為什麼要有離散的這麼一個過程？

剛開始以為999.999.999這麼一個數字，對於int儲存型別來說是足夠了。

還有隻有500000個數字，何必要離散化呢？

剛開始一直想不通，後來明白了，後面在運用樹狀陣列操作的時候，

用到的樹狀陣列C[i]是建立在一個有點像位儲存的陣列的基礎之上的，

不是單純的建立在輸入陣列之上。

比如輸入一個9 1 0 5 4，那麼C[i]樹狀陣列的建立是在，

下標 0 1 2 3 4 5 6 7 8 9

陣列 1 1 0 0 1 1 0 0 0 1

現在由於999999999這個數字相對於500000這個數字來說是很大的，

所以如果用陣列位儲存的話，那麼需要999999999的空間來儲存輸入的資料。

這樣是很浪費空間的，題目也是不允許的，所以這裡想通過離散化操作，

使得離散化的結果可以更加的密集。

2. 怎麼對這個輸入的陣列進行離散操作？

離散化是一種常用的技巧，有時資料範圍太大，可以用來放縮到我們能處理的範圍；

因為其中需排序的數的範圍0---999 999 999；顯然陣列不肯能這麼大；

而N的最大範圍是500 000；故給出的數一定可以與1.。。。N建立一個一一對映；

①當然用map可以建立，效率可能低點；

②這裡用一個結構體

struct Node

{

int v,ord;

}p[510000];和一個陣列a[510000];

其中v就是原輸入的值，ord是下標；然後對結構體按v從小到大排序；

此時，v和結構體的下標就是一個一一對應關係，而且滿足原來的大小關係；

for(i=1;i<=N;i++) a[p[i].ord]=i;

然後a陣列就儲存了原來所有的大小資訊；

比如 9 1 0 5 4 ------- 離散後aa陣列就是 5 2 1 4 3；

具體的過程可以自己用筆寫寫就好了。

3. 離散之後，怎麼使用離散後的結果陣列來進行樹狀陣列操作，計算出逆序數？

如果資料不是很大，可以一個個插入到樹狀陣列中，

每插入一個數，統計比他小的數的個數，

對應的逆序為 i- getsum( aa[i] ),

其中 i 為當前已經插入的數的個數，

getsum( aa[i] ）為比 aa[i] 小的數的個數,

i- sum( aa[i] ) 即比 aa[i] 大的個數，即逆序的個數

但如果資料比較大，就必須採用離散化方法

假設輸入的陣列是9 1 0 5 4，離散後的結果aa[] = {5,2,1,4,3};

在離散結果中間結果的基礎上，那麼其計算逆序數的過程是這麼一個過程。

1，輸入5，呼叫upDate(5, 1),把第5位設定為1

1 2 3 4 5

0 0 0 0 1

計算1-5上比5小的數字存在麼？這裡用到了樹狀陣列的getSum（5） = 1操作，

現在用輸入的下標1 - getSum(5) = 0 就可以得到對於5的逆序數為0。

2. 輸入2，呼叫upDate(2, 1),把第2位設定為1

1 2 3 4 5

0 1 0 0 1

計算1-2上比2小的數字存在麼？這裡用到了樹狀陣列的getSum（2） = 1操作，

現在用輸入的下標2 - getSum(2) = 1 就可以得到對於2的逆序數為1。

3. 輸入1，呼叫upDate(1, 1),把第1位設定為1

1 2 3 4 5

1 1 0 0 1

計算1-1上比1小的數字存在麼？這裡用到了樹狀陣列的getSum（1） = 1操作，

現在用輸入的下標 3 - getSum(1) = 2 就可以得到對於1的逆序數為2。

4. 輸入4，呼叫upDate(4, 1),把第5位設定為1

1 2 3 4 5

1 1 0 1 1

計算1-4上比4小的數字存在麼？這裡用到了樹狀陣列的getSum（4） = 3操作，

現在用輸入的下標4 - getSum(4) = 1 就可以得到對於4的逆序數為1。

5. 輸入3，呼叫upDate(3, 1),把第3位設定為1

1 2 3 4 5

1 1 1 1 1

計算1-3上比3小的數字存在麼？這裡用到了樹狀陣列的getSum（3） = 3操作，

現在用輸入的下標5 - getSum(3) = 2 就可以得到對於3的逆序數為2。

6. 0+1+2+1+2 = 6 這就是最後的逆序數

分析一下時間複雜度，首先用到快速排序，時間複雜度為O(NlogN),

後面是迴圈插入每一個數字，每次插入一個數字，分別呼叫一次upData()和getSum()

外迴圈N, upData()和getSum()時間O(logN) => 時間複雜度還是O(NlogN).

最後總的還是O(NlogN).

HDU 2689 Sort it【樹狀陣列求逆序對】
2018-09-26
陣列
樹狀陣列和逆序對
2020-08-05
陣列
POJ-2352 Stars（樹狀陣列）
2019-02-23
陣列
HDU 1541 & POJ 2352 Stars (樹狀陣列)
2020-04-06
陣列
求區間不同數的個數【樹狀陣列求解】
2018-09-12
陣列
樹狀陣列
2024-11-29
陣列
LeetCode C++ 劍指 Offer 51. 陣列中的逆序對【歸併排序/樹狀陣列/線段樹】
2020-12-26
LeetCodeC++陣列排序
POJ3468 A Simple Problem with Integers---樹狀陣列(區間問題)
2020-11-04
陣列
解析樹狀陣列
2021-02-10
陣列
POJ 3468 【區間修改+區間查詢樹狀陣列 | 線段樹 | 分塊】
2018-09-27
陣列
陣列元素逆序
2024-07-30
陣列
二維樹狀陣列
2024-03-12
陣列
樹狀陣列詳解
2020-08-01
陣列
樹狀陣列基礎
2021-07-26
陣列
樹狀陣列模板題 & （樹狀陣列 1：單點修改，區間查詢）
2020-12-27
陣列
樹狀陣列快速入門
2024-04-10
陣列
【筆記/模板】樹狀陣列
2024-11-04
筆記陣列
陣列中的逆序對
2020-12-30
陣列
樹狀陣列模板+習題集
2018-09-10
陣列
樹狀陣列(我是真小白)
2024-04-04
陣列
資料結構——樹狀陣列
2024-09-17
資料結構陣列
樹狀陣列3種基本操作
2020-12-04
陣列
7-1將陣列中的數逆序存放
2024-10-25
陣列
HDU 1556 Color the ball（線段樹|樹狀陣列）
2020-04-06
陣列
bzoj3155: Preprefix sum（樹狀陣列）
2018-03-05
陣列
【luogu3368】模板樹狀陣列 2
2018-04-22
陣列
bzoj3110: [Zjoi2013]K大數查詢（主席樹+樹狀陣列）
2018-04-11
陣列
洛谷題單指南-二叉堆與樹狀陣列-P3368 【模板】樹狀陣列 2
2024-11-18
陣列
CHOJ 4201 樓蘭圖騰【樹狀陣列】
2018-09-27
陣列
AC自動機+字典序+樹狀陣列
2024-08-16
陣列
【Leetcode每日一題】327. 區間和的個數（線段樹/樹狀陣列）
2020-11-07
LeetCode每日一題陣列
JavaScript如何求陣列的質數
2021-09-11
JavaScript陣列
樹狀陣列（BIT）—— 一篇就夠了
2020-10-15
陣列
樹狀陣列(待補)（生硬公式用法證明）
2024-11-25
陣列公式
JZ-035-陣列中的逆序對
2021-12-30
陣列
AcWing 242. 一個簡單的整數問題(樹狀陣列解法)
2020-11-13
陣列
求陣列內所有偶數的和
2020-12-15
陣列
資料結構之真別多想—樹狀陣列
2020-09-12
資料結構陣列
bzoj2743: [HEOI2012]採花（樹狀陣列）
2018-04-12
陣列

POJ 2299-Ultra-QuickSort（樹狀陣列求逆序數）

Ultra-QuickSort

題目意思：

解題思路：

相關文章