java jvm 引數 -Xms -Xmx -Xmn -Xss 調優總結

huangdazhu發表於2014-03-18

堆大小設定
JVM 中最大堆大小有三方面限制:相關作業系統的資料模型(32-bt還是64-bit)限制;系統的可用虛擬記憶體限制;系統的可用實體記憶體限制.32位系統 下,一般限制在1.5G~2G;64為作業系統對記憶體無限制.我在Windows Server 2003 系統,3.5G實體記憶體,JDK5.0下測試,最大可設定為1478m.
典型設定: 
java -Xmx3550m -Xms3550m -Xmn2g -Xss128k
-Xmx3550m:設定JVM最大可用記憶體為3550M.
-Xms3550m:設定JVM促使記憶體為3550m.此值可以設定與-Xmx相同,以避免每次垃圾回收完成後JVM重新分配記憶體.
-Xmn2g:設定年輕代大小為2G.整個堆大小=年輕代大小 + 年老代大小 + 持久代大小.持久代一般固定大小為64m,所以增大年輕代後,將會減小年老代大小.此值對系統效能影響較大,Sun官方推薦配置為整個堆的3/8.
-Xss128k: 設定每個執行緒的堆疊大小.JDK5.0以後每個執行緒堆疊大小為1M,以前每個執行緒堆疊大小為256K.更具應用的執行緒所需記憶體大小進行 調整.在相同實體記憶體下,減小這個值能生成更多的執行緒.但是作業系統對一個程式內的執行緒數還是有限制的,不能無限生成,經驗值在3000~5000左右.

java -Xmx3550m -Xms3550m -Xss128k -XX:NewRatio=4 -XX:SurvivorRatio=4 -XX:MaxPermSize=16m -XX:MaxTenuringThreshold=0
-XX:NewRatio=4:設定年輕代(包括Eden和兩個Survivor區)與年老代的比值(除去持久代).設定為4,則年輕代與年老代所佔比值為1:4,年輕代佔整個堆疊的1/5
-XX:SurvivorRatio=4:設定年輕代中Eden區與Survivor區的大小比值.設定為4,則兩個Survivor區與一個Eden區的比值為2:4,一個Survivor區佔整個年輕代的1/6
-XX:MaxPermSize=16m:設定持久代大小為16m.
-XX:MaxTenuringThreshold=0: 設定垃圾最大年齡.如果設定為0的話,則年輕代物件不經過Survivor區,直接進入年老代. 對於年老代比較多的應用,可以提高效率.如果將此值設定為一個較大值,則年輕代物件會在Survivor區進行多次複製,這樣可以增加物件再年輕代的存活 時間,增加在年輕代即被回收的概論.
回收器選擇
JVM給了三種選擇:序列收集器,並行收集器,併發收集器,但是序列收集器只適用於小資料量的情況,所以這裡的選擇主要針對並行收集器和併發收集器.預設 情況下,JDK5.0以前都是使用序列收集器,如果想使用其他收集器需要在啟動時加入相應引數.JDK5.0以後,JVM會根據當前系統配置進行判斷. 
吞吐量優先的並行收集器
如上文所述,並行收集器主要以到達一定的吞吐量為目標,適用於科學技術和後臺處理等.
典型配置: 
java -Xmx3800m -Xms3800m -Xmn2g -Xss128k -XX:+UseParallelGC -XX:ParallelGCThreads=20
-XX:+UseParallelGC:選擇垃圾收集器為並行收集器.此配置僅對年輕代有效.即上述配置下,年輕代使用併發收集,而年老代仍舊使用序列收集.
-XX:ParallelGCThreads=20:配置並行收集器的執行緒數,即:同時多少個執行緒一起進行垃圾回收.此值最好配置與處理器數目相等.

java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX:+UseParallelGC -XX:ParallelGCThreads=20 -XX:+UseParallelOldGC
-XX:+UseParallelOldGC:配置年老代垃圾收集方式為並行收集.JDK6.0支援對年老代並行收集.

java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX:+UseParallelGC -XX:MaxGCPauseMillis=100
-XX:MaxGCPauseMillis=100:設定每次年輕代垃圾回收的最長時間,如果無法滿足此時間,JVM會自動調整年輕代大小,以滿足此值.

java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX:+UseParallelGC -XX:MaxGCPauseMillis=100 -XX:+UseAdaptiveSizePolicy
-XX:+UseAdaptiveSizePolicy:設定此選項後,並行收集器會自動選擇年輕代區大小和相應的Survivor區比例,以達到目標系統規定的最低相應時間或者收集頻率等,此值建議使用並行收集器時,一直開啟.

響應時間優先的併發收集器
如上文所述,併發收集器主要是保證系統的響應時間,減少垃圾收集時的停頓時間.適用於應用伺服器,電信領域等.
典型配置: 
java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX:ParallelGCThreads=20 -XX:+UseConcMarkSweepGC -XX:+UseParNewGC
-XX:+UseConcMarkSweepGC:設定年老代為併發收集.測試中配置這個以後,-XX:NewRatio=4的配置失效了,原因不明.所以,此時年輕代大小最好用-Xmn設定.
-XX:+UseParNewGC:設定年輕代為並行收集.可與CMS收集同時使用.JDK5.0以上,JVM會根據系統配置自行設定,所以無需再設定此值. 
java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX:+UseConcMarkSweepGC -XX:CMSFullGCsBeforeCompaction=5 -XX:+UseCMSCompactAtFullCollection
-XX:CMSFullGCsBeforeCompaction:由於併發收集器不對記憶體空間進行壓縮,整理,所以執行一段時間以後會產生"碎片",使得執行效率降低.此值設定執行多少次GC以後對記憶體空間進行壓縮,整理.
-XX:+UseCMSCompactAtFullCollection:開啟對年老代的壓縮.可能會影響效能,但是可以消除碎片

輔助資訊
JVM提供了大量命令列引數,列印資訊,供除錯使用.主要有以下一些: 
-XX:+PrintGC
輸出形式:[GC 118250K->113543K(130112K), 0.0094143 secs] 
[Full GC 121376K->10414K(130112K), 0.0650971 secs]

-XX:+PrintGCDetails
輸出形式:[GC [DefNew: 8614K->781K(9088K), 0.0123035 secs] 118250K->113543K(130112K), 0.0124633 secs] 
[GC [DefNew: 8614K->8614K(9088K), 0.0000665 secs][Tenured: 112761K->10414K(121024K), 0.0433488 secs] 121376K->10414K(130112K), 0.0436268 secs]

-XX:+PrintGCTimeStamps -XX:+PrintGC:PrintGCTimeStamps可與上面兩個混合使用
輸出形式:11.851: [GC 98328K->93620K(130112K), 0.0082960 secs]

-XX:+PrintGCApplicationConcurrentTime:列印每次垃圾回收前,程式未中斷的執行時間.可與上面混合使用
輸出形式:Application time: 0.5291524 seconds

-XX:+PrintGCApplicationStoppedTime:列印垃圾回收期間程式暫停的時間.可與上面混合使用
輸出形式:Total time for which application threads were stopped: 0.0468229 seconds

-XX:PrintHeapAtGC:列印GC前後的詳細堆疊資訊
輸出形式:
34.702: [GC {Heap before gc invocations=7:
def new generation total 55296K, used 52568K [0x1ebd0000, 0x227d0000, 0x227d0000)
eden space 49152K, 99% used [0x1ebd0000, 0x21bce430, 0x21bd0000)
from space 6144K, 55% used [0x221d0000, 0x22527e10, 0x227d0000)
to space 6144K, 0% used [0x21bd0000, 0x21bd0000, 0x221d0000)
tenured generation total 69632K, used 2696K [0x227d0000, 0x26bd0000, 0x26bd0000)
the space 69632K, 3% used [0x227d0000, 0x22a720f8, 0x22a72200, 0x26bd0000)
compacting perm gen total 8192K, used 2898K [0x26bd0000, 0x273d0000, 0x2abd0000)
the space 8192K, 35% used [0x26bd0000, 0x26ea4ba8, 0x26ea4c00, 0x273d0000)
ro space 8192K, 66% used [0x2abd0000, 0x2b12bcc0, 0x2b12be00, 0x2b3d0000)
rw space 12288K, 46% used [0x2b3d0000, 0x2b972060, 0x2b972200, 0x2bfd0000)
34.735: [DefNew: 52568K->3433K(55296K), 0.0072126 secs] 55264K->6615K(124928K)Heap after gc invocations=8:
def new generation total 55296K, used 3433K [0x1ebd0000, 0x227d0000, 0x227d0000)
eden space 49152K, 0% used [0x1ebd0000, 0x1ebd0000, 0x21bd0000)
from space 6144K, 55% used [0x21bd0000, 0x21f2a5e8, 0x221d0000)
to space 6144K, 0% used [0x221d0000, 0x221d0000, 0x227d0000)
tenured generation total 69632K, used 3182K [0x227d0000, 0x26bd0000, 0x26bd0000)
the space 69632K, 4% used [0x227d0000, 0x22aeb958, 0x22aeba00, 0x26bd0000)
compacting perm gen total 8192K, used 2898K [0x26bd0000, 0x273d0000, 0x2abd0000)
the space 8192K, 35% used [0x26bd0000, 0x26ea4ba8, 0x26ea4c00, 0x273d0000)
ro space 8192K, 66% used [0x2abd0000, 0x2b12bcc0, 0x2b12be00, 0x2b3d0000)
rw space 12288K, 46% used [0x2b3d0000, 0x2b972060, 0x2b972200, 0x2bfd0000)
}
, 0.0757599 secs]

-Xloggc:filename:與上面幾個配合使用,把相關日誌資訊記錄到檔案以便分析.
常見配置彙總 
堆設定 
-Xms:初始堆大小 
-Xmx:最大堆大小 
-XX:NewSize=n:設定年輕代大小 
-XX:NewRatio=n:設定年輕代和年老代的比值.如:為3,表示年輕代與年老代比值為1:3,年輕代佔整個年輕代年老代和的1/4 
-XX:SurvivorRatio=n:年輕代中Eden區與兩個Survivor區的比值.注意Survivor區有兩個.如:3,表示Eden:Survivor=3:2,一個Survivor區佔整個年輕代的1/5 
-XX:MaxPermSize=n:設定持久代大小
收集器設定 
-XX:+UseSerialGC:設定序列收集器 
-XX:+UseParallelGC:設定並行收集器 
-XX:+UseParalledlOldGC:設定並行年老代收集器 
-XX:+UseConcMarkSweepGC:設定併發收集器
垃圾回收統計資訊 
-XX:+PrintGC 
-XX:+PrintGCDetails 
-XX:+PrintGCTimeStamps 
-Xloggc:filename
並行收集器設定 
-XX:ParallelGCThreads=n:設定並行收集器收集時使用的CPU數.並行收集執行緒數. 
-XX:MaxGCPauseMillis=n:設定並行收集最大暫停時間 
-XX:GCTimeRatio=n:設定垃圾回收時間佔程式執行時間的百分比.公式為1/(1+n)
併發收集器設定 
-XX:+CMSIncrementalMode:設定為增量模式.適用於單CPU情況. 
-XX:ParallelGCThreads=n:設定併發收集器年輕代收集方式為並行收集時,使用的CPU數.並行收集執行緒數.

調優總結 
年輕代大小選擇 
響應時間優先的應用:儘可能設大,直到接近系統的最低響應時間限制(根據實際情況選擇).在此種情況下,年輕代收集發生的頻率也是最小的.同時,減少到達年老代的物件. 
吞吐量優先的應用:儘可能的設定大,可能到達Gbit的程度.因為對響應時間沒有要求,垃圾收集可以並行進行,一般適合8CPU以上的應用.
年老代大小選擇 
響應時間優先的應用:年老代使用併發收集器,所以其大小需要小心設定,一般要考慮併發會話率和會話持續時間等一些引數.如果堆設定小了,可以會造成記憶體碎 片,高回收頻率以及應用暫停而使用傳統的標記清除方式;如果堆大了,則需要較長的收集時間.最最佳化的方案,一般需要參考以下資料獲得: 
併發垃圾收集資訊 
持久代併發收集次數 
傳統GC資訊 
花在年輕代和年老代回收上的時間比例
減少年輕代和年老代花費的時間,一般會提高應用的效率

吞吐量優先的應用:一般吞吐量優先的應用都有一個很大的年輕代和一個較小的年老代.原因是,這樣可以儘可能回收掉大部分短期物件,減少中期的物件,而年老代盡存放長期存活物件.
較小堆引起的碎片問題
因為年老代的併發收集器使用標記,清除演算法,所以不會對堆進行壓縮.當收集器回收時,他會把相鄰的空間進行合併,這樣可以分配給較大的物件.但是,當堆空 間較小時,執行一段時間以後,就會出現"碎片",如果併發收集器找不到足夠的空間,那麼併發收集器將會停止,然後使用傳統的標記,清除方式進行回收.如果 出現"碎片",可能需要進行如下配置: 
-XX:+UseCMSCompactAtFullCollection:使用併發收集器時,開啟對年老代的壓縮. 
-XX:CMSFullGCsBeforeCompaction=0:上面配置開啟的情況下,這裡設定多少次Full GC後,對年老代進行壓縮

在同一個工程下,有兩個類,這兩個類中只有很少的變動,而最關健的FOR卻沒有一點變動,可是當我分別執行這兩個程式的時候卻出現一個很嚴重的問題,一個程式迴圈的快,一個迴圈的慢.這到底是怎麼回事呢~???苦苦尋找了半天也沒有想到是為什麼,因為程式改變的部分根不影響我迴圈的速度,可是結果卻是有很大的差別,一個大約是在一分鐘這內就可以迴圈完,可是另一個卻需要六七分鐘,這根本就不是一個資料理級的麻.兩個完全一樣的迴圈,從程式碼上根本上是看不出有什麼問題.不得以求助同事吧,可是同事看了也感覺很詭異,兩個人在那訂著程式碼又看了一個多小時,最後同事讓我來個乾淨點的,關機重啟.我到也聽話,就順著同事的意思去了,可就在關機的這個時候他突然說是不是記憶體的問題,我也空然想到了,還真的有可能是記憶體的問題,因為快的那個在我之前執行程式之前可給過1G的記憶體啊,而後來的這個我好像是沒有設過記憶體啊,機器起來了,有了這個想法進去看看吧,結果正中要害,果真是慢的那個沒有開記憶體,程式執行時只不過是JVM預設開的記憶體.我初步分析是因為記憶體太小,而我的程式所用記憶體又正好卡在JVM所開記憶體邊上,不至於溢位.當程式執行時就得花費大部分時間去呼叫GC去,這樣就導致了為什麼相同的迴圈出現兩種不同的效率~!
順便把記憶體使用情況的方法也貼出來:
public static String getMemUsage() {
long free = java.lang.Runtime.getRuntime().freeMemory();
long total = java.lang.Runtime.getRuntime().totalMemory(); 
StringBuffer buf = new StringBuffer();
buf.append("[Mem: used ").append((total-free)>>20)
.append("M free ").append(free>>20)
.append("M total ").append(total>>20).append("M]");
return buf.toString();
}

google一下,大概就說JVM是這樣來操作記憶體:
堆(Heap)和非堆(Non-heap)記憶體
按照官方的說法:"Java 虛擬機器具有一個堆,堆是執行時資料區域,所有類例項和陣列的記憶體均從此處分配.堆是在 Java 虛擬機器啟動時建立的.""在JVM中堆之外的記憶體稱為非堆記憶體(Non-heap memory)".可以看出JVM主要管理兩種型別的記憶體:堆和非堆.簡單來說堆就是Java程式碼可及的記憶體,是留給開發人員使用的;非堆就是JVM留給自己用的,所以方法區,JVM內部處理或最佳化所需的記憶體(如JIT編譯後的程式碼快取),每個類結構(如執行時常數池,欄位和方法資料)以及方法和構造方法的程式碼都在非堆記憶體中.
堆記憶體分配
JVM初始分配的記憶體由-Xms指定,預設是實體記憶體的1/64;JVM最大分配的記憶體由-Xmx指定,預設是實體記憶體的1/4.預設空餘堆記憶體小於40%時,JVM就會增大堆直到-Xmx的最大限制;空餘堆記憶體大於70%時, JVM會減少堆直到-Xms的最小限制.因此伺服器一般設定-Xms,-Xmx相等以避免在每次GC 後調整堆的大小.
非堆記憶體分配
JVM使用-XX:PermSize設定非堆記憶體初始值,預設是實體記憶體的1/64;由XX:MaxPermSize設定最大非堆記憶體的大小,預設是實體記憶體的1/4.
JVM記憶體限制(最大值)
首先JVM記憶體首先受限於實際的最大實體記憶體,假設實體記憶體無限大的話,JVM記憶體的最大值跟作業系統有很大的關係.簡單的說就32位處理器雖然可控記憶體空間有4GB,但是具體的作業系統會給一個限制,這個限制一般是 2GB-3GB(一般來說Windows系統下為1.5G-2G,Linux系統下為2G-3G),而64bit以上的處理器就不會有限制了
JVM記憶體的調優
1. Heap設定與垃圾回收Java Heap分為3個區,Young,Old和Permanent.Young儲存剛例項化的物件.當該區被填滿時,GC會將物件移到Old 區.Permanent區則負責儲存反射物件,本文不討論該區.JVM的Heap分配可以使用-X引數設定,
-Xms
初始Heap大小
-Xmx
java heap最大值
-Xmn
young generation的heap大小
JVM有2個GC執行緒.第一個執行緒負責回收Heap的Young區.第二個執行緒在Heap不足時,遍歷Heap,將Young 區升級為Older區.Older區的大小等於-Xmx減去-Xmn,不能將-Xms的值設的過大,因為第二個執行緒被迫執行會降低JVM的效能.
為什麼一些程式頻繁發生GC?有如下原因:
l 程式內呼叫了System.gc()或Runtime.gc().
l 一些中介軟體軟體呼叫自己的GC方法,此時需要設定引數禁止這些GC.
l Java的Heap太小,一般預設的Heap值都很小.
l 頻繁例項化物件,Release物件.此時儘量儲存並重用物件,例如使用StringBuffer()和String().
如果你發現每次GC後,Heap的剩餘空間會是總空間的50%,這表示你的Heap處於健康狀態.許多Server端的Java程式每次GC後最好能有65%的剩餘空間.經驗之談:
1.Server端JVM最好將-Xms和-Xmx設為相同值.為了最佳化GC,最好讓-Xmn值約等於-Xmx的1/3[2].
2.一個GUI程式最好是每10到20秒間執行一次GC,每次在半秒之內完成[2].
注意:
1.增加Heap的大小雖然會降低GC的頻率,但也增加了每次GC的時間.並且GC執行時,所有的使用者執行緒將暫停,也就是GC期間,Java應用程式不做任何工作.
2.Heap大小並不決定程式的記憶體使用量.程式的記憶體使用量要大於-Xmx定義的值,因為Java為其他任務分配記憶體,例如每個執行緒的Stack等.
2.Stack的設定
每個執行緒都有他自己的Stack.
-Xss
每個執行緒的Stack大小
Stack的大小限制著執行緒的數量.如果Stack過大就好導致記憶體溢漏.-Xss引數決定Stack大小,例如-Xss1024K.如果Stack太小,也會導致Stack溢漏.
3.硬體環境
硬體環境也影響GC的效率,例如機器的種類,記憶體,swap空間,和CPU的數量.
如果你的程式需要頻繁建立很多transient物件,會導致JVM頻繁GC.這種情況你可以增加機器的記憶體,來減少Swap空間的使用[2].
4.4種GC
第一種:單執行緒GC,也是預設的GC.,該GC適用於單CPU機器.
第二種:Throughput GC,是多執行緒的GC,適用於多CPU,使用大量執行緒的程式.第二種GC與第一種GC相似,不同在於GC在收集

                Young區是多執行緒的,但在Old區和第一種一樣,仍然採用單執行緒.-XX:+UseParallelGC引數啟動該GC.
第三種:Concurrent Low Pause GC,類似於第一種,適用於多CPU,並要求縮短因GC造成程式停滯的時間.這種GC可以在Old區的

               回收同時,執行應用程式.-XX:+UseConcMarkSweepGC引數啟動該GC.
第四種:Incremental Low Pause GC,適用於要求縮短因GC造成程式停滯的時間.這種GC可以在Young區回收的同時,回收

               一部分Old區物件.-Xincgc引數啟動該GC.
4種GC的具體描述參見[3].
參考文章:
1. JVM Tuning.

     
2. Performance tuning Java: Tuning steps
     http://h21007.www2.hp.com/dspp/tech/tech_TechDocumentDetailPage_IDX/1,1701,1604,00.html
3. Tuning Garbage Collection with the 1.4.2 JavaTM Virtual Machine .
     

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/28869493/viewspace-1124097/,如需轉載,請註明出處,否則將追究法律責任。

相關文章