JavaScript垃圾收集

wrfan發表於2019-04-03

JavaScript具有自動垃圾收集機制,也就是說,執行環境會負責管理程式碼執行過程中使用的記憶體。而在CC++之類的語言中,開發人員的一項基本任務就是手工跟蹤記憶體的使用情況,這是造成許多問題的一個根源。在編寫JavaScript程式時,開發人員不用再關心記憶體使用問題,所需記憶體的分配以及無用記憶體的回收完全實現了自動管理。這種垃圾收集機制的原理其實很簡單:找出那些不再繼續使用的變數,然後釋放其佔用的記憶體。為此,垃圾收集器會按照固定的時間間隔(或程式碼執行中預定的收集時間),週期性地執行這一操作。

垃圾收集器跟蹤哪個變數有用哪個變數沒用,對於不再有用的變數打上標記,以備將來收回其佔用的記憶體。用於標識無用變數的策略可能會因實現而異,但具體到瀏覽器中的實現,則通常有兩個策略。

標記清除

JavaScript中最常用的垃圾收集方式是標記清除(mark-and-sweep)。當變數進入環境(例如,在函式中宣告一個變數)時,就將這個變數標記為“進入環境”。從邏輯上講,永遠不能釋放進入環境的變數所佔用的記憶體,因為只要執行流進入相應的環境,就可能會用到它們。而當變數離開環境時,則將其標記為“離開環境”。

可以使用任何方式來標記變數。比如,可以通過翻轉某個特殊的位來記錄一個變數何時進入環境,或者使用一個“進入環境的”變數列表及一個“離開環境的”變數列表來跟蹤哪個變數發生了變化。說到底,如何標記變數其實並不重要,關鍵在於採取什麼策略。

垃圾收集器在執行的時候會給儲存在記憶體中的所有變數都加上標記(當然,可以使用任何標記方式)。然後,它會去掉環境中的變數以及被環境中的變數引用的變數的標記。而在此之後再被加上標記的變數將被視為準備刪除的變數,原因是環境中的變數已經無法訪問到這些變數了。最後,垃圾收集器完成記憶體清除工作,銷燬那些帶標記的值並回收它們所佔用的記憶體空間。

到 2008 年為止,IEFirefoxperaChromeSafariJavaScript實現使用的都是標記清除式的垃圾收集策略(或類似的策略),只不過垃圾收集的時間間隔互有不同。

引用計數

另一種不太常見的垃圾收集策略叫做引用計數。引用計數的含義是跟蹤記錄每個值被引用的次數。當宣告瞭一個變數並將一個引用型別值賦給該變數時,則這個值的引用次數就是1。如果同一個值又被賦給另一個變數,則該值的引用次數加1。相反,如果包含對這個值引用的變數又取得了另外一個值,則這個值的引用次數減1。當這個值的引用次數變成 0 時,則說明沒有辦法再訪問這個值了,因而就可以將其佔用的記憶體空間回收回來。這樣,當垃圾收集器下次再執行時,它就會釋放那些引用次數為零的值所佔用的記憶體。

Netscape Navigator 3.0是最早使用引用計數策略的瀏覽器,但很快它就遇到了一個嚴重的問題:迴圈引用。迴圈引用指的是物件A中包含一個指向物件B的指標,而物件B中也包含一個指向物件A的引用。請看下面這個例子:

function problem(){ 
  var objectA = new Object(); 
  var objectB = new Object(); 
  objectA.someOtherObject = objectB; 
  objectB.anotherObject = objectA; 
}
複製程式碼

因為迴圈引用的問題,NetscapeNavigator4.0中放棄了引用計數方式,轉而採用標記清除來實現其垃圾收集機制。可是,引用計數導致的麻煩並未就此終結。

我們知道,IE中有一部分物件並不是原生JavaScript物件。例如,其BOMDOM 中的物件就是使用C++COMComponent Object Model,元件物件模型)物件的形式實現的,而COM物件的垃圾收集機制採用的就是引用計數策略。因此,即使IEJavaScript引擎是使用標記清除策略來實現的,但 JavaScript訪問的COM物件依然是基於引用計數策略的。換句話說,只要在IE 中涉及COM物件,就會存在迴圈引用的問題。下面這個簡單的例子,展示了使用COM 物件導致的迴圈引用問題:

var element = document.getElementById("some_element"); 
var myObject = new Object(); 
myObject.element = element; 
element.someObject = myObject;
複製程式碼

這個例子在一個DOM元素(element)與一個原生JavaScript 物件(myObject)之間建立了迴圈 引用。其中,變數myObject有一個名為element的屬性指向element物件;而變數 element也有 一個屬性名叫someObject回指myObject。由於存在這個迴圈引用,即使將例子中的 DOM從頁面中 移除,它也永遠不會被回收。

為了避免類似這樣的迴圈引用問題,最好是在不使用它們的時候手工斷開原生 JavaScript物件與 DOM元素之間的連線。例如,可以使用下面的程式碼消除前面例子建立的迴圈引用:

myObject.element = null; 
element.someObject = null;
複製程式碼

將變數設定為 null 意味著切斷變數與它此前引用的值之間的連線。當垃圾收集器下次執行時,就會刪除這些值並回收它們佔用的記憶體。

為了解決上述問題,IE9BOMDOM物件都轉換成了真正的JavaScript 物件。這樣,就避免了兩種垃圾收集演算法並存導致的問題,也消除了常見的記憶體洩漏現象。

效能問題

垃圾收集器是週期性執行的,而且如果為變數分配的記憶體數量很可觀,那麼回收工作量也是相當大 的。在這種情況下,確定垃圾收集的時間間隔是一個非常重要的問題。

事實上,在有的瀏覽器中可以觸發垃圾收集過程,但我們不建議讀者這樣做。在 IE中,呼叫window.CollectGarbage()方法會立即執行垃圾收集。在Opera 7及更 高版本中,呼叫window.opera.collect()也會啟動垃圾收集例程。

管理記憶體

由於系統分配給Web瀏覽器的可用記憶體數量通常要比分配給桌面應用程式的少。這樣做的目的主要是出於安全方面的考慮,目的是防止執行JavaScript的網頁耗盡全部系統記憶體而導致系統崩潰。記憶體限制問題不僅會影響給變數分配記憶體,同時還會影響呼叫棧以及在一個執行緒中能夠同時執行的語句數量。

因此,確保佔用最少的記憶體可以讓頁面獲得更好的效能。而優化記憶體佔用的最佳方式,就是為執行中的程式碼只儲存必要的資料。一旦資料不再有用,最好通過將其值設定為 null 來釋放其引用——這個做法叫做解除引用(dereferencing)。這一做法適用於大多數全域性變數和全域性物件的屬性。區域性變數會在它們離開執行環境時自動被解除引用

解除一個值的引用並不意味著自動回收該值所佔用的記憶體。解除引用的真正作用是讓值脫離執行環境,以便垃圾收集器下次執行時將其回收。

相關文章