【Java】留下沒有基礎眼淚的面試題

Java3y發表於2018-08-15

前言

只有光頭才能變強

本文力求簡單講清每個知識點,希望大家看完能有所收穫

一、如何減少執行緒上下文切換

使用多執行緒時,不是多執行緒能提升程式的執行速度,使用多執行緒是為了更好地利用CPU資源

程式在執行時,多執行緒是CPU通過給每個執行緒分配CPU時間片來實現的,時間片是CPU分配給每個執行緒執行的時間,因時間片非常短,所以CPU通過不停地切換執行緒執行

執行緒不是越多就越好的,因為執行緒上下文切換是有效能損耗的,在使用多執行緒的同時需要考慮如何減少上下文切換

一般來說有以下幾條經驗

  • 無鎖併發程式設計。多執行緒競爭時,會引起上下文切換,所以多執行緒處理資料時,可以用一些辦法來避免使用鎖,如將資料的ID按照Hash取模分段,不同的執行緒處理不同段的資料
  • CAS演算法。Java的Atomic包使用CAS演算法來更新資料,而不需要加鎖
  • 控制執行緒數量。避免建立不需要的執行緒,比如任務很少,但是建立了很多執行緒來處理,這樣會造成大量執行緒都處於等待狀態
  • 協程。在單執行緒裡實現多工的排程,並在單執行緒裡維持多個任務間的切換
    • 協程可以看成是使用者態自管理的“執行緒”不會參與CPU時間排程,沒有均衡分配到時間。非搶佔式

還可以考慮我們的應用是IO密集型的還是CPU密集型的。

  • 如果是IO密集型的話,執行緒可以多一些。
  • 如果是CPU密集型的話,執行緒不宜太多。

參考資料:

二、計算機網路

2.1MAC地址已經是唯一了,為什麼需要IP地址?

或者可以反過來問:已經有IP地址了,為什麼需要MAC地址??在zhihu上還蠻多類似的問題的:

【Java】留下沒有基礎眼淚的面試題

我來簡單總結一下為什麼有了MAC(IP)還需要IP(MAC):

  • MAC是鏈路層,IP是網路層,每一層幹每一層的事兒,之所以在網路上分鏈路層、網路層(...,就是將問題簡單化。
  • 歷史的相容問題。

已經有IP地址了,為什麼需要MAC地址??

  • 現階段理由:DHCP基於MAC地址分配IP

MAC地址已經是唯一了,為什麼需要IP地址?

  • MAC無網段概念,非類聚,不好管理

如果有更好的看法,不妨在評論區下留言哦~

參考資料:

2.2TCP狀態

TCP 每個狀態說一下,TIME-WAIT狀態說一下

TCP總共有11個狀態,狀態之間的轉換是這樣的:

【Java】留下沒有基礎眼淚的面試題

流程圖:

【Java】留下沒有基礎眼淚的面試題

下面我簡單總結一下每個狀態:

  • CLOSED:初始狀態,表示TCP連線是“關閉著的”或“未開啟的”。
  • LISTEN:表示伺服器端的某個SOCKET處於監聽狀態,可以接受客戶端的連線。
  • SYN-SENT:表示客戶端已傳送SYN報文。當客戶端SOCKET執行connect()進行連線時,它首先傳送SYN報文,然後隨即進入到SYN_SENT狀態。
  • SYN_RCVD:表示伺服器接收到了來自客戶端請求連線的SYN報文。當TCP連線處於此狀態時,再收到客戶端的ACK報文,它就會進入到ESTABLISHED狀態
  • ESTABLISHED:表示TCP連線已經成功建立
  • FIN-WAIT-1第一次主動請求關閉連線,等待對方的ACK響應。
  • CLOSE_WAIT:對方發了一個FIN報文給自己,回應一個ACK報文給對方。此時進入CLOSE_WAIT狀態。
    • 接下來呢,你需要檢查自己是否還有資料要傳送給對方,如果沒有的話,那你也就可以close()這個SOCKET併傳送FIN報文給對方,即關閉自己到對方這個方向的連線
  • FIN-WAIT-2:主動關閉端接到ACK後,就進入了FIN-WAIT-2。在這個狀態下,應用程式還有接受資料的能力,但是已經無法傳送資料。
  • LAST_ACK:當被動關閉的一方在傳送FIN報文後,等待對方的ACK報文的時候,就處於LAST_ACK 狀態
  • CLOSED:當收到對方的ACK報文後,也就可以進入到CLOSED狀態了。
  • TIME_WAIT:表示收到了對方的FIN報文,併傳送出了ACK報文。TIME_WAIT狀態下的TCP連線會等待2*MSL
  • CLOSING:罕見的狀態。表示雙方都正在關閉SOCKET連線

TIME_WAIT狀態一般用來處理以下兩個問題:

【Java】留下沒有基礎眼淚的面試題

  • 關閉TCP連線時,確保最後一個ACK正常運輸(或者可以認為是:等待以便重傳ACK)
  • 網路上可能會有殘餘的資料包,為了能夠正常處理這些殘餘的資料包。使用TIME-WAIT狀態可以確保建立新連線時,先前網路中殘餘的資料都丟失了

TIME_WAIT過多怎麼解決?

如果在高併發,多短連結情景下,TIME_WAIT就會過多。

可以通過調整核心引數解決:vi /etc/sysctl.conf 加入以下內容設定:

  • reuse是表示是否允許重新應用處於TIME-WAIT狀態的socket用於新的TCP連線;
  • recyse是加速TIME-WAIT sockets回收

我們可以知道TIME_WAIT狀態是主動關閉連線的一方出現的,我們不要輕易去使用上邊兩個引數。先看看是不是可以重用TCP連線來儘量避免這個問題(比如我們HTTP的KeepAlive)~

參考資料:

2.3TCP滑動視窗

TCP是一個可靠的傳輸協議,它要保證所有的資料包都可以到達,這需要重傳機制來支撐。

重傳機制有以下幾種:

  • 超時重傳
  • 快速重傳
  • SACK 方法

滑動視窗可以說是TCP非常重要的一個知識點。TCP的滑動視窗主要有兩個作用:

  • 提供TCP的可靠性
  • 提供TCP的流控特性

簡略滑動視窗示意圖:

【Java】留下沒有基礎眼淚的面試題

詳細滑動視窗示意圖:

【Java】留下沒有基礎眼淚的面試題

  • #1已收到ack確認的資料。
  • #2發還沒收到ack的。
  • #3在視窗中還沒有發出的(接收方還有空間)。
  • #4視窗以外的資料(接收方沒空間)

接受端控制傳送端的圖示:

【Java】留下沒有基礎眼淚的面試題

2.4擁塞控制

TCP不是一個自私的協議,當擁塞發生的時候,要做自我犧牲。就像交通阻塞一樣,每個車都應該把路讓出來,而不要再去搶路了

擁塞控制主要是四個演算法:

  • 1)慢啟動,
  • 2)擁塞避免,
  • 3)擁塞發生,
  • 4)快速恢復

擁塞控制的作用:

【Java】留下沒有基礎眼淚的面試題

擁塞的判斷:

  • 重傳定時器超時
  • 收到三個相同(重複)的 ACK

【Java】留下沒有基礎眼淚的面試題

強烈建議閱讀:

參考資料:

三、作業系統

3.1殭屍程式和孤兒程式是什麼(區別)

unix/linux環境下

【Java】留下沒有基礎眼淚的面試題

殭屍程式:

  • 父程式建立出子程式,子程式退出了,父程式沒有呼叫waitwaitId獲取子程式的資訊(狀態),子程式的描述符仍在系統中

孤兒程式:

  • 父程式退出,子程式仍在執行中。這些子程式就叫做孤兒程式,孤兒程式將被init程式(程式號為1)所收養,並由init程式對它們完成狀態收集工作

殭屍程式危害

  • 系統程式表是一項有限資源,如果系統程式表被殭屍程式耗盡的話,系統就可能無法建立新的程式
  • 一個父程式建立了很多子程式,就是不回收,會造成記憶體資源的浪費

解決殭屍程式的手段:

  • 殺掉父程式,餘下的殭屍程式會成為孤兒程式,最後被init程式管理
  • 子程式退出時向父程式傳送SIGCHILD訊號,父程式處理SIGCHILD訊號。在訊號處理函式中呼叫wait進行處理殭屍程式
  • fork兩次:原理是將子程式成為孤兒程式,從而其的父程式變為init程式,通過init程式可以處理殭屍程式

參考資料:

3.2作業系統程式間通訊的方式有哪些?

首先要知道的是:程式和執行緒的關注點是不一樣的:

  • 程式間資源是獨立的,關注的是通訊問題。
  • 執行緒間資源是共享的,關注的是安全問題。

作業系統程式間通訊的方式有哪些?

  • 管道(pipe):管道是一種半雙工的通訊方式,資料只能單向流動,而且只能在具有親緣關係的程式間使用。程式的親緣關係通常是指父子程式關係。
  • 有名管道(named pipe):有名管道也是半雙工的通訊方式,但是它允許無親緣關係程式之間的通訊。
  • 訊息佇列(message queue):訊息佇列是訊息的連結串列,存放在核心中並由訊息佇列表示符標示。訊息佇列克服了訊號傳遞資訊少,管道只能承載無格式位元組流以及緩衝區大小受限制等缺點。
  • 共享記憶體(shared memory):共享記憶體就是對映一段內被其它程式所訪問的記憶體,共享記憶體由一個程式建立,但是多個程式都可以訪問。共享記憶體是最快的IPC,它是針對其它程式通訊方式執行效率低的而專門設計的。它往往與其它通訊機制。如訊號量,配合使用,來實現程式間的同步和通訊。
  • 套接字(socket):套接字也是程式間的通訊機制,與其它通訊機制不同的是,它可以用於不同機器間的程式通訊。
  • 訊號(signal):訊號是一種比較複雜的通訊方式,用於通知接受程式程式某個時間已經發生。
  • 訊號量(semaphore):訊號量是一個計數器,可以用來控制多個程式對共享資源的訪問。
    • 它常作為一種鎖的機制,防止某程式正在訪問共享資源時,其它程式也訪問該資源。因此它主要作為不同程式或者同一程式之間不同執行緒之間同步的手段

3.3作業系統執行緒間通訊的方式有哪些?

作業系統執行緒間通訊的方式有哪些?(可以直接理解成:執行緒之間同步的方式有哪些)

  • 鎖機制:包括互斥鎖、條件變數、讀寫鎖
  • 訊號量機制(Semaphore):包括無名執行緒訊號量和命名執行緒訊號量
  • 訊號機制(Signal):類似程式間的訊號處理

執行緒間的通訊目的主要是用於執行緒同步

參考資料:

擴充套件閱讀:

3.4作業系統程式排程演算法有哪些?

作業系統程式排程演算法有哪些?

  • 先來先服務演算法(FCFS)
    • 誰先來,就誰先執行
  • 短程式/作業優先演算法(SJF)
    • 誰用的時間少、就先執行誰
  • 最高響應比優先演算法(HRN)
    • 對FCFS方式和SJF方式的一種綜合平衡
  • 最高優先數演算法
    • 系統把處理機分配給就緒佇列中優先數最高的程式
  • 基於時間片的輪轉排程演算法
    • 每個程式所享受的CPU處理時間都是一致的
  • 最短剩餘時間優先演算法
    • 短作業優先演算法的升級版,只不過它是搶佔式
  • 多級反饋排隊演算法
    • 設定多個就緒佇列,分別賦予不同的優先順序,如逐級降低,佇列1的優先順序最高

參考筆記:

四、擴充閱讀

此部分是看別人的博文已經寫得很好了,分享給大家~

4.1ConcurrentHashMap中的擴容是否需要對整個表上鎖?

ConcurrentHashMap中的擴容是否需要對整個表上鎖?

總結(摘抄)要點:

  • 通過給每個執行緒分配桶區間(預設一個執行緒分配的桶是16個),避免執行緒間的爭用。
  • 通過為每個桶節點加鎖,避免 putVal 方法導致資料不一致。
  • 同時,在擴容的時候,也會將連結串列拆成兩份,這點和 HashMap 的 resize 方法類似。

參考資料:

4.2什麼是一致性Hash演算法(原理)?

什麼是一致性Hash演算法(原理)?

總結(摘抄)要點:

  • 一致性Hash演算法將整個雜湊值空間組織成一個虛擬的圓環,好處就是提高容錯性和可擴充套件性
    • 對於節點的增減都只需重定位環空間中的一小部分資料

參考資料:

4.3MySQL date、datetime和timestamp型別的區別

MySQL date、datetime和timestamp型別的區別

總結(摘抄)要點:

  • date精確到天,datetime和timestamp精確到秒
  • datetime和timestamp的區別:
    • timestamp會跟隨設定的時區變化而變化,而datetime儲存的是絕對值不會變化
    • timestamp儲存佔用4個位元組,datetime儲存佔用8個位元組
    • 可表示的時間範圍不同,timestamp只能到表示到2038年,datetime可到9999年

參考資料:

4.4判斷一個連結串列是否有環/相交

判斷一個連結串列是否有環(實際上就是看看有無遍歷到重複的節點),解決方式(3種):

  1. for遍歷兩次
  2. 使用hashSet做快取,記錄已遍歷過的節點
  3. 使用兩個指標,一前一後遍歷,總會出現前指標==後指標的情況

參考資料:


判斷兩個無環連結串列是否相交,解決方式(2種):

  • 將第一個連結串列尾部的next指標指向第二個連結串列,兩個連結串列組成一個連結串列。
    • 判斷這一個連結串列是否有環,有環則相交,無環則不相交
  • 直接判斷兩個連結串列的尾節點是否相等,如果相等則相交,否則不相交

判斷兩個有環連結串列是否相交(注:當一個連結串列中有環,一個連結串列中沒有環時,兩個連結串列必不相交):

  • 找到第一個連結串列的環點,然後將環斷開(當然不要忘記了儲存它的下一個節點),然後再來遍歷第二個連結串列,如果發現第二個連結串列從有環變成了無環,那麼他們就是相交的嘛,否則就是不相交的了。

參考資料:

4.5keepAlive含義

  • HTTP協議的Keep-Alive意圖在於連線複用,同一個連線上序列方式傳遞請求-響應資料
  • TCP的KeepAlive機制意圖在於保活、心跳,檢測連線錯誤

參考資料:

最後

如果大家有更好的理解方式或者文章有錯誤的地方還請大家不吝在評論區留言,大家互相學習交流~~~

如果想看更多的原創技術文章,歡迎大家關注我的微信公眾號:Java3y。公眾號還有海量的視訊資源哦,關注即可免費領取。

可能感興趣的連結:

相關文章