面試官本拿求素數搞我,但被我優雅的“回擊“了(素數篩)

bigsai發表於2020-12-11
原創公眾號(希望能支援一下):bigsai 轉載請聯絡bigsai
文章收錄在github

前言

現在的面試官,是無數開發者的夢魘,能夠吊打面試官的屬實不多,因為大部分面試官真的有那麼那幾下子。但在面試中,我們這些小生存者不能全盤否定只能單點突破—從某個問題上讓面試官眼前一亮。這不,今天就來分享來了。

這年頭,演算法崗內卷不說,開發崗也有點內卷,對開發者要求越來越高了,而面試官也是處心積慮的 "刁難" 面試者,凡是都喜歡由淺入深,凡是都喜歡問個:你知道為什麼?你知道原理嗎?之類。並且,以前只是大廠面試官喜歡問演算法,大廠員工底子好,很多甚至有ACM經驗或者系統刷題經驗,這很容易理解,但現在一些小公司面試官也是張口閉口 xx演算法、xx資料結構你說說看,這不,真的被問到了。

求一個質數

在這麼一次的過程,面試官問我演算法題我不吃驚,我實現早把十大排序原理、複雜度分析、程式碼手寫實現出來了,也把連結串列、樹的各種操作溫習的滾瓜爛熟,不過突然就是很詫異的面試官來了一道求素數問題,我把場景還原一下:

面試官:你知道怎麼求素數嗎?

我:求素數?

面試官:是的,就是求素數。

我:這很簡單啊,判斷一個數為素數,那麼肯定就沒有兩個數(除了自身和1)相乘等於它,只需要列舉看看有沒有能夠被它整除的數就可以了,如果有那麼就不是素數,如果沒有,那麼就是素數。

面試官露出一種失望的表情,說我說的對,但沒答到點子上,讓我具體說一下。

下面開始開始我的表演:

首先,最笨的方法,判斷n是否為素數,就是列舉[2,n-1]之間有沒有直接能夠被n整除的,如果有,那麼返回false這個就不是素數,否則就是素數,程式碼如下:

boolean isprime(int value){
  for(int i=2;i<value;i++)
  {
       if(value%i==0)
       {return false;}
  }
    return true;
}

這種判斷一個素數的時間複雜度為O(n).

但是其實這種太浪費時間了,完全沒必要這樣,可以優化一下 。如果一個數不是質數,那麼必定是兩個數的乘積,而這兩個數通常一個大一個小,並且小的小於等於根號n,大的大於等於根號n,我們只需要列舉小的可能範圍,看看是否能夠被整除,就可以判斷這個數是否為素數啦。例如100=2*50=4*25=5*20=10*10 只需要找2—10這個區間即可。右側的一定有個對應的不需要管它。

boolean isprime(int value)
{
  for(int i=2;i*i<value+1;i++)
    {
       if(value%i==0)
       {return false;}
    }
    return true;
}

這裡之所以要小於value+1,就是要包含根號的情況,例如 3*3=9.要包含3.這種時間複雜度求單個數是O(sqrt(n))。面試官我給你畫張圖讓你看看其中區別:

image-20201208105627132

說到這裡面試官露出欣慰的笑容。

面試官:不錯不錯,基本點掌握了
我:老哥,其實求素數精髓不在這,這個太低效在很多時候,比如求小於n的所有素數,你看看怎麼搞?

面試官:用個陣列用第二種方法求O(n*sqrt(n))還行啊。

求多個素數

求多個素數的時候(小於n的素數),上面的方法就很繁瑣了,因為有大量重複計算,因為 計算某個數的倍數 是否為素數的時候出現大量的重複計算,如果這個數比較大那麼對空間浪費比較多。

這樣,素數篩的概念就被發明和使用。篩的原理是從前往後進行一種遞推、過濾排序以來統計素數。

埃拉託斯特尼(Eratosthenes)篩法

我們看一個數如果不是為素數,那麼這個數沒有數的乘積能為它,那麼這樣我們可以根據這個思想進行操作啊:

直接從前往後列舉,這個數位置沒被標記的肯定就是素數,如果這個數是素數那麼將這個數的倍數標記一下(下次遍歷到就不需要在計算)。如果不是素數那麼就進行下一步。這樣數值越大後面計算次數越少,在進行具體操作時候可藉助陣列進行判斷。所以埃氏篩的核心思想就是將素數的倍數確定為合數

假設剛開始全是素數,2為素數,那麼2的倍數均不是素數;然後遍歷到3,3的倍數標記一下;下個是5(因為4已經被標記過);一直到n-1為止。具體流程可以看圖:

image-20201208112829007

具體程式碼為:

boolean isprime[];
long prime[];
void getprime()
{
        prime=new long[100001];//記錄第幾個prime
      int index=0;//標記prime當前下標
        isprime=new boolean [1000001];//判斷是否被標記過
        for(int i=2;i<1000001;i++)
        {
            if(!isprime[i])
            {
                prime[index++]=i;
            }
            for(int j=i+i;j<1000000;j=j+i)//他的所有倍數都over
            {
                isprime[j]=true;                    
            }
        }
}

這種篩的演算法複雜度為O(nloglogn);別小瞧多的這個logn,資料量大一個log可能少不少個0,那時間也是十倍百倍甚至更多的差距。

尤拉篩

面試官已經開始點頭贊同了,哦哦的叫了起來,可其實還沒完。還有個線性篩—尤拉篩。觀察上述的埃氏篩,有很多重複的計算,尤其是前面的素數,比如2和3的最小公倍數為6,每3次2的計算就也會遇到是3的倍數,而尤拉篩在埃氏篩的基礎上改進,有效的避免了這個重複計算。

具體是何種思路呢?就是埃氏篩是遇到一個質數將它的倍數計算到底,而尤拉篩則是隻用它乘以已知曉的素數的乘積進行標記,如果素數能夠被整除那就停止往後標記。

在實現上同樣也是用兩個陣列,一個儲存真實有效的素數,一個用來作為標記使用。

  • 在遍歷到一個數的時候,如果這個數沒被標記,那麼這個數存在素數的陣列中,對應下標加1.
  • 不管這個數是不是素數,遍歷已知素數將它和該素數的乘積值標記,如果這個素數能夠被當前值i整除,那麼停止操作進行下一輪。

具體實現的程式碼為:

boolean isprime[];
int prime[];
void getprimeoula()// 尤拉篩
{
        prime = new int[100001];// 記錄第幾個prime
        int index = 0;
        isprime = new boolean[1000001];
        for (int i = 2; i < 1000001; i++) {
            if (!isprime[i]) {
                prime[index++] = i;
            }
            for (int j = 0; j < index && i * prime[j] <= 100000; j++){//已知素數範圍內列舉
                isprime[i * prime[j]] = true;// 標記乘積
                if (i % prime[j] == 0)
                    break;
            }
        }
}

你可能會問為啥if (i % prime[j] == 0)就要break。

如果i%prime[j]==0,那麼就說明i=prime[j]*k. k為一個整數。
那麼如果進行下一輪的話
i*prime[j+1]=(prime[j]*k)*prime[j+1]=prime[j]*(k*prime[j+1]) i=k*prime[j+1]兩個位置就產生衝突重複計算啦,所以一旦遇到能夠被整除的就停止。

image-20201208121324157

你可以看到這個過程,6只標記12而不標記18,18被9*2標記。詳細理解還需要多看看程式碼想想。過程圖就不畫啦!尤拉的思路就是離我較近的我給它標記。尤拉篩的時間複雜度為O(n),因為每個數只標記一次。

面試官露出一臉欣賞的表情,說了句不錯,下面就是聊聊家常,讓我等待下一次面試!

image-20201208121913781
原創不易,bigsai我請你幫兩件事幫忙一下:

  1. 點贊支援一下, 您的肯定是我在思否創作的源源動力。
  2. 微信搜尋「bigsai」,關注我的公眾號(新人求支援),不僅免費送你電子書,我還會第一時間在公眾號分享知識技術。加我還可拉你進力扣打卡群一起打卡LeetCode。

記得關注、我們們下次再見!

相關文章