編寫高效能的Java程式碼

宜信技術學院發表於2019-05-14

一、併發

Unable to create new native thread ……

問題1:Java中建立一個執行緒消耗多少記憶體?

每個執行緒有獨自的棧記憶體,共享堆記憶體

問題2:一臺機器可以建立多少執行緒?

CPU,記憶體,作業系統,JVM,應用伺服器

我們編寫一段示例程式碼,來驗證下執行緒池與非執行緒池的區別:

//執行緒池和非執行緒池的區別
public class ThreadPool {
  
     public static int times = 100;//100,1000,10000
  
     public static ArrayBlockingQueue arrayWorkQueue = new ArrayBlockingQueue(1000);
     public static ExecutorService threadPool = new ThreadPoolExecutor(5, //corePoolSize執行緒池中核心執行緒數
             10,
             60,
             TimeUnit.SECONDS,
             arrayWorkQueue,
             new ThreadPoolExecutor.DiscardOldestPolicy()
     );
  
     public static void useThreadPool() {
         Long start = System.currentTimeMillis();
         for (int i = 0; i < times; i++) {
             threadPool.execute(new Runnable() {
                 public void run() {
                     System.out.println("說點什麼吧...");
                 }
             });
         }
         threadPool.shutdown();
         while (true) {
             if (threadPool.isTerminated()) {
                 Long end = System.currentTimeMillis();
                 System.out.println(end - start);
                 break;
             }
         }
     }
  
     public static void createNewThread() {
         Long start = System.currentTimeMillis();
         for (int i = 0; i < times; i++) {
  
             new Thread() {
                 public void run() {
                     System.out.println("說點什麼吧...");
                 }
             }.start();
         }
         Long end = System.currentTimeMillis();
         System.out.println(end - start);
     }
  
     public static void main(String args[]) {
         createNewThread();
         //useThreadPool();
     }
 }

啟動不同數量的執行緒,然後比較執行緒池和非執行緒池的執行結果:

非執行緒池 執行緒池
100次 16毫秒 5ms的
1000次 90毫秒 28ms
10000次 1329ms 164ms

結論:不要new Thread(),採用執行緒池

非執行緒池的缺點:

  • 每次建立效能消耗大

  • 無序,缺乏管理。容易無限制建立執行緒,引起OOM和當機

1.1 使用執行緒池要注意的問題

避免死鎖,請儘量使用CAS

我們編寫一個樂觀鎖的實現示例:

public class CASLock {
  
     public static int money = 2000;
  
     public static boolean add2(int oldm, int newm) {
         try {
             Thread.sleep(2000);
         } catch (InterruptedException e) {
             e.printStackTrace();
         }
         if (money == oldm) {
             money = money + newm;
             return true;
         }
         return false;
     }
  
     public synchronized static void add1(int newm) {
         try {
             Thread.sleep(3000);
         } catch (InterruptedException e) {
             e.printStackTrace();
         }
         money = money + newm;
     }
  
     public static void add(int newm) {
         try {
             Thread.sleep(3000);
         } catch (InterruptedException e) {
             e.printStackTrace();
         }
         money = money + newm;
     }
  
     public static void main(String args[]) {
         Thread one = new Thread() {
             public void run() {
                 //add(5000)
                 while (true) {
                     if (add2(money, 5000)) {
                         break;
                     }
                 }
             }
         };
         Thread two = new Thread() {
             public void run() {
                 //add(7000)
                 while (true) {
                     if (add2(money, 7000)) {
                         break;
                     }
                 }
             }
         };
         one.start();
         two.start();
         try {
             one.join();
             two.join();
         } catch (InterruptedException e) {
             e.printStackTrace();
         }
         System.out.println(money);
     }
 }

使用ThreadLocal要注意

ThreadLocalMap使用ThreadLocal的弱引用作為key,如果一個ThreadLocal沒有外部強引用來引用它,那麼系統 GC 的時候,這個ThreadLocal勢必會被回收,這樣一來,ThreadLocalMap中就會出現key為null的Entry,就沒有辦法訪問這些key為null的Entry的value,如果當前執行緒再遲遲不結束的話,這些key為null的Entry的value就會一直存在一條強引用鏈:Thread Ref -> Thread -> ThreaLocalMap -> Entry -> value永遠無法回收,造成記憶體洩漏。

我們編寫一個ThreadLocalMap正確使用的示例:

//ThreadLocal應用例項
public class ThreadLocalApp {
  
     public static final ThreadLocal threadLocal = new ThreadLocal();
  
     public static void muti2() {
         int i[] = (int[]) threadLocal.get();
         i[1] = i[0] * 2;
         threadLocal.set(i);
     }
  
     public static void muti3() {
         int i[] = (int[]) threadLocal.get();
         i[2] = i[1] * 3;
         threadLocal.set(i);
     }
  
     public static void muti5() {
         int i[] = (int[]) threadLocal.get();
         i[3] = i[2] * 5;
         threadLocal.set(i);
     }
  
     public static void main(String args[]) {
         for (int i = 0; i < 5; i++) {
             new Thread() {
                 public void run() {
                     int start = new Random().nextInt(10);
                     int end[] = {0, 0, 0, 0};
                     end[0] = start;
                     threadLocal.set(end);
                     ThreadLocalApp.muti2();
                     ThreadLocalApp.muti3();
                     ThreadLocalApp.muti5();
                     //int end = (int) threadLocal.get();
                     System.out.println(end[0] + "  " + end[1] + "  " + end[2] + "  " + end[3]);
                     threadLocal.remove();
                 }
             }.start();
         }
     }
 }

1.2 執行緒互動—執行緒不安全造成的問題

經典的HashMap死迴圈造成CPU100%問題

我們模擬一個HashMap死迴圈的示例:

//HashMap死迴圈示例
public class HashMapDeadLoop {
  
     private HashMap hash = new HashMap();
  
     public HashMapDeadLoop() {
         Thread t1 = new Thread() {
             public void run() {
                 for (int i = 0; i < 100000; i++) {
                     hash.put(new Integer(i), i);
                 }
                 System.out.println("t1 over");
             }
         };
  
         Thread t2 = new Thread() {
             public void run() {
                 for (int i = 0; i < 100000; i++) {
                     hash.put(new Integer(i), i);
                 }
                 System.out.println("t2 over");
             }
         };
         t1.start();
         t2.start();
     }
  
     public static void main(String[] args) {
         for (int i = 0; i < 1000; i++) {
             new HashMapDeadLoop();
         }
         System.out.println("end");
     }
 }

HashMap死迴圈發生後,我們可以線上程棧中觀測到如下資訊:

/HashMap死迴圈產生的執行緒棧
Thread-281" #291 prio=5 os_prio=31 tid=0x00007f9f5f8de000 nid=0x5a37 runnable [0x0000700006349000]
   java.lang.Thread.State: RUNNABLE
       at java.util.HashMap$TreeNode.split(HashMap.java:2134)
       at java.util.HashMap.resize(HashMap.java:713)
       at java.util.HashMap.putVal(HashMap.java:662)
       at java.util.HashMap.put(HashMap.java:611)
       at com.example.demo.HashMapDeadLoop$2.run(HashMapDeadLoop.java:26)

應用停滯的死鎖,Spring3.1的deadlock 問題

我們模擬一個死鎖的示例:

//死鎖的示例
public class DeadLock {
     public static Integer i1 = 2000;
     public static Integer i2 = 3000;
         public static synchronized Integer getI2() {
         try {
             Thread.sleep(3000);
         } catch (InterruptedException e) {
             e.printStackTrace();
         }
         return i2;
     }
     public static void main(String args[]) {
         Thread one = new Thread() {
             public void run() {
                 synchronized (i1) {
                     try {
                         Thread.sleep(3000);
                     } catch (InterruptedException e) {
                         e.printStackTrace();
                     }
                     synchronized (i2) {
                         System.out.println(i1 + i2);
                     }
                 }
             }
         };
         one.start();
         Thread two = new Thread() {
             public void run() {
                 synchronized (i2) {
                     try {
                         Thread.sleep(3000);
                     } catch (InterruptedException e) {
                         e.printStackTrace();
                     }
                     synchronized (i1) {
                         System.out.println(i1 + i2);
                     }
                 }
             }
         };
         two.start();
     }
 }

死鎖發生後,我們可以線上程棧中觀測到如下資訊:

//死鎖時產生堆疊
"Thread-1":
       at com.example.demo.DeadLock$2.run(DeadLock.java:47)
       - waiting to lock  (a java.lang.Integer)
       - locked  (a java.lang.Integer)
"Thread-0":
       at com.example.demo.DeadLock$1.run(DeadLock.java:31)
       - waiting to lock  (a java.lang.Integer)
       - locked  (a java.lang.Integer)
Found 1 deadlock.

1.3 基於JUC的最佳化示例

一個計數器的最佳化,我們分別用Synchronized,ReentrantLock,Atomic三種不同的方式來實現一個計數器,體會其中的效能差異

//示例程式碼
public class SynchronizedTest {
  
     public static int threadNum = 100;
     public static int loopTimes = 10000000;
  
     public static void userSyn() {
         //執行緒數
         Syn syn = new Syn();
         Thread[] threads = new Thread[threadNum];
         //記錄執行時間
         long l = System.currentTimeMillis();
         for (int i = 0; i < threadNum; i++) {
             threads[i] = new Thread(new Runnable() {
                 @Override
                 public void run() {
                     for (int j = 0; j < loopTimes; j++) {
                         //syn.increaseLock();
                         syn.increase();
                     }
                 }
             });
             threads[i].start();
         }
         //等待所有執行緒結束
         try {
             for (int i = 0; i < threadNum; i++)
                 threads[i].join();
         } catch (InterruptedException e) {
             e.printStackTrace();
         }
         System.out.println("userSyn" + "-" + syn + " : " + (System.currentTimeMillis() - l) + "ms");
     }
  
     public static void useRea() {
         //執行緒數
         Syn syn = new Syn();
         Thread[] threads = new Thread[threadNum];
         //記錄執行時間
         long l = System.currentTimeMillis();
         for (int i = 0; i < threadNum; i++) {
             threads[i] = new Thread(new Runnable() {
                 @Override
                 public void run() {
                     for (int j = 0; j < loopTimes; j++) {
                         syn.increaseLock();
                         //syn.increase();
                     }
                 }
             });
             threads[i].start();
         }
         //等待所有執行緒結束
         try {
             for (int i = 0; i < threadNum; i++)
                 threads[i].join();
         } catch (InterruptedException e) {
             e.printStackTrace();
         }
         System.out.println("userRea" + "-" + syn + " : " + (System.currentTimeMillis() - l) + "ms");
     }
    public static void useAto() {
         //執行緒數
         Thread[] threads = new Thread[threadNum];
         //記錄執行時間
         long l = System.currentTimeMillis();
         for (int i = 0; i < threadNum; i++) {
             threads[i] = new Thread(new Runnable() {
                 @Override
                 public void run() {
                     for (int j = 0; j < loopTimes; j++) {
                         Syn.ai.incrementAndGet();
                     }
                 }
             });
             threads[i].start();
         }
         //等待所有執行緒結束
         try {
             for (int i = 0; i < threadNum; i++)
                 threads[i].join();
         } catch (InterruptedException e) {
             e.printStackTrace();
         }
         System.out.println("userAto" + "-" + Syn.ai + " : " + (System.currentTimeMillis() - l) + "ms");
     }
  
     public static void main(String[] args) {
         SynchronizedTest.userSyn();
         SynchronizedTest.useRea();
         SynchronizedTest.useAto();
     }
 }
  
 class Syn {
     private int count = 0;
     public final static AtomicInteger ai = new AtomicInteger(0);
  
     private Lock lock = new ReentrantLock();
  
     public synchronized void increase() {
         count++;
     }
  
     public void increaseLock() {
         lock.lock();
         count++;
         lock.unlock();
     }
  
     @Override
     public String toString() {
         return String.valueOf(count);
     }
 }

結論,在併發量高,迴圈次數多的情況,可重入鎖的效率高於Synchronized,但最終Atomic效能最好。

二、通訊

2.1 資料庫連線池的高效問題

  • 一定要在finally中close連線
  • 一定要在finally中release連線

2.2 OIO/NIO/AIO

OIO NIO AIO
型別 阻塞 非阻塞 非阻塞
使用難度 簡單 複雜 複雜
可靠性
吞吐量

結論:我效能有嚴苛要求下,儘量應該採用NIO的方式進行通訊。

2.3 TIME_WAIT(client),CLOSE_WAIT(server)問題

反應:經常性的請求失敗

獲取連線情況 netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}'

  • TIME_WAIT:表示主動關閉,最佳化系統核心引數可。

  • CLOSE_WAIT:表示被動關閉。

  • ESTABLISHED:表示正在通訊

解決方案:二階段完成後強制關閉

2.4 序列連線,持久連線(長連線),管道化連線

結論:

管道連線的效能最優異,持久化是在序列連線的基礎上減少了開啟/關閉連線的時間。

管道化連線使用限制:

1、HTTP客戶端無法確認持久化(一般是伺服器到伺服器,非終端使用);

2、響應資訊順序必須與請求資訊順序一致;

3、必須支援冪等操作才可以使用管道化連線.

三、資料庫操作

必須要有索引(特別注意按時間查詢)

單條操作or批次操作

注:很多程式設計師在寫程式碼的時候隨意採用了單條操作的方式,但在效能要求前提下,要求採用批次操作方式。

四、JVM

4.1 CPU標高的一般處理步驟

  • top查詢出哪個程式消耗的cpu高
  • top –H –p查詢出哪個執行緒消耗的cpu高
  • 記錄消耗cpu最高的幾個執行緒
  • printf %x 進行pid的進位制轉換
  • jstack記錄程式的堆疊資訊
  • 找出消耗cpu最高的執行緒資訊  

4.2 記憶體標高(OOM)一般處理步驟

  • jstat命令檢視FGC發生的次數和消耗的時間,次數越多,耗時越長說明存在問題;
  • 連續檢視jmap –heap 檢視老生代的佔用情況,變化越大說明程式存在問題;
  • 使用連續的jmap –histo:live 命令匯出檔案,比對載入物件的差異,差異部分一般是發生問題的地方。

4.3 GC引起的單核標高

單個CPU佔用率高,首先從GC查起。

4.4 常見SY標高

  • 執行緒上下文切換頻繁
  • 執行緒太多
  • 鎖競爭激烈

4.5 Iowait標高

如果IO的CPU佔用很高,排查涉及到IO的程式,比如把OIO改造成NIO。

4.6 抖動問題

原因:位元組碼轉為機器碼需要佔用CPU時間片,大量的CPU在執行位元組碼時,導致CPU長期處於高位;

現象:“C2 CompilerThread1” daemon,“C2 CompilerThread0” daemon CPU佔用率最高;

解決辦法:保證編譯執行緒的CPU佔比。

作者:梁鑫

來源:


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69918724/viewspace-2644288/,如需轉載,請註明出處,否則將追究法律責任。

相關文章