一、併發
無法建立新的本機執行緒......
問題1:Java的中建立一個執行緒消耗多少記憶體?
每個執行緒有獨自的棧記憶體,共享堆記憶體
問題2:一臺機器可以建立多少執行緒?
CPU,記憶體,作業系統,JVM,應用伺服器
我們編寫一段示例程式碼,來驗證下執行緒池與非執行緒池的區別:
//執行緒池和非執行緒池的區別<font></font>
public class ThreadPool {<font></font>
<font></font>
public static int times = 100;//100,1000,10000<font></font>
<font></font>
public static ArrayBlockingQueue arrayWorkQueue = new ArrayBlockingQueue(1000);<font></font>
public static ExecutorService threadPool = new ThreadPoolExecutor(5, //corePoolSize執行緒池中核心執行緒數<font></font>
10,<font></font>
60,<font></font>
TimeUnit.SECONDS,<font></font>
arrayWorkQueue,<font></font>
new ThreadPoolExecutor.DiscardOldestPolicy()<font></font>
);<font></font>
<font></font>
public static void useThreadPool() {<font></font>
Long start = System.currentTimeMillis();<font></font>
for (int i = 0; i < times; i++) {<font></font>
threadPool.execute(new Runnable() {<font></font>
public void run() {<font></font>
System.out.println("說點什麼吧...");<font></font>
}<font></font>
});<font></font>
}<font></font>
threadPool.shutdown();<font></font>
while (true) {<font></font>
if (threadPool.isTerminated()) {<font></font>
Long end = System.currentTimeMillis();<font></font>
System.out.println(end - start);<font></font>
break;<font></font>
}<font></font>
}<font></font>
}<font></font>
<font></font>
public static void createNewThread() {<font></font>
Long start = System.currentTimeMillis();<font></font>
for (int i = 0; i < times; i++) {<font></font>
<font></font>
new Thread() {<font></font>
public void run() {<font></font>
System.out.println("說點什麼吧...");<font></font>
}<font></font>
}.start();<font></font>
}<font></font>
Long end = System.currentTimeMillis();<font></font>
System.out.println(end - start);<font></font>
}<font></font>
<font></font>
public static void main(String args[]) {<font></font>
createNewThread();<font></font>
//useThreadPool();<font></font>
}<font></font>
}
複製程式碼
啟動不同數量的執行緒,然後比較執行緒池和非執行緒池的執行結果:
非執行緒池 | 執行緒池 | |
---|---|---|
100次 | 16毫秒 | 5ms的 |
1000次 | 90毫秒 | 28ms |
10000次 | 1329ms | 164ms |
結論:不要新的Thread(),採用執行緒池
非執行緒池的缺點:
-
每次建立效能消耗大
-
無序,缺乏管理。容易無限制建立執行緒,引起OOM和當機
1.1 使用執行緒池要注意的問題
避免死鎖,請儘量使用CAS
我們編寫一個樂觀鎖的實現示例:
public class CASLock {<font></font>
<font></font>
public static int money = 2000;<font></font>
<font></font>
public static boolean add2(int oldm, int newm) {<font></font>
try {<font></font>
Thread.sleep(2000);<font></font>
} catch (InterruptedException e) {<font></font>
e.printStackTrace();<font></font>
}<font></font>
if (money == oldm) {<font></font>
money = money + newm;<font></font>
return true;<font></font>
}<font></font>
return false;<font></font>
}<font></font>
<font></font>
public synchronized static void add1(int newm) {<font></font>
try {<font></font>
Thread.sleep(3000);<font></font>
} catch (InterruptedException e) {<font></font>
e.printStackTrace();<font></font>
}<font></font>
money = money + newm;<font></font>
}<font></font>
<font></font>
public static void add(int newm) {<font></font>
try {<font></font>
Thread.sleep(3000);<font></font>
} catch (InterruptedException e) {<font></font>
e.printStackTrace();<font></font>
}<font></font>
money = money + newm;<font></font>
}<font></font>
<font></font>
public static void main(String args[]) {<font></font>
Thread one = new Thread() {<font></font>
public void run() {<font></font>
//add(5000)<font></font>
while (true) {<font></font>
if (add2(money, 5000)) {<font></font>
break;<font></font>
}<font></font>
}<font></font>
}<font></font>
};<font></font>
Thread two = new Thread() {<font></font>
public void run() {<font></font>
//add(7000)<font></font>
while (true) {<font></font>
if (add2(money, 7000)) {<font></font>
break;<font></font>
}<font></font>
}<font></font>
}<font></font>
};<font></font>
one.start();<font></font>
two.start();<font></font>
try {<font></font>
one.join();<font></font>
two.join();<font></font>
} catch (InterruptedException e) {<font></font>
e.printStackTrace();<font></font>
}<font></font>
System.out.println(money);<font></font>
}<font></font>
}
複製程式碼
使用ThreadLocal中要注意
ThreadLocalMap使用ThreadLocal的弱引用作為key,如果一個ThreadLocal沒有外部強引用來引用它,那麼系統GC的時候,這個ThreadLocal勢必會被回收,這樣一來,ThreadLocalMap中就會出現key為null的條目,就沒有辦法訪問這些鍵為null的條目的值,如果當前執行緒再遲遲不結束的話,這些鍵為null的條目的值就會一直存在一條強引用鏈:執行緒參考 - >執行緒 - > ThreaLocalMap - >條目 - >值永遠無法回收,造成記憶體洩漏。
我們編寫一個ThreadLocalMap正確使用的示例:
//ThreadLocal應用例項<font></font>
public class ThreadLocalApp {<font></font>
<font></font>
public static final ThreadLocal threadLocal = new ThreadLocal();<font></font>
<font></font>
public static void muti2() {<font></font>
int i[] = (int[]) threadLocal.get();<font></font>
i[1] = i[0] * 2;<font></font>
threadLocal.set(i);<font></font>
}<font></font>
<font></font>
public static void muti3() {<font></font>
int i[] = (int[]) threadLocal.get();<font></font>
i[2] = i[1] * 3;<font></font>
threadLocal.set(i);<font></font>
}<font></font>
<font></font>
public static void muti5() {<font></font>
int i[] = (int[]) threadLocal.get();<font></font>
i[3] = i[2] * 5;<font></font>
threadLocal.set(i);<font></font>
}<font></font>
<font></font>
public static void main(String args[]) {<font></font>
for (int i = 0; i < 5; i++) {<font></font>
new Thread() {<font></font>
public void run() {<font></font>
int start = new Random().nextInt(10);<font></font>
int end[] = {0, 0, 0, 0};<font></font>
end[0] = start;<font></font>
threadLocal.set(end);<font></font>
ThreadLocalApp.muti2();<font></font>
ThreadLocalApp.muti3();<font></font>
ThreadLocalApp.muti5();<font></font>
//int end = (int) threadLocal.get();<font></font>
System.out.println(end[0] + " " + end[1] + " " + end[2] + " " + end[3]);<font></font>
threadLocal.remove();<font></font>
}<font></font>
}.start();<font></font>
}<font></font>
}<font></font>
}
複製程式碼
1.2 執行緒互動 - 執行緒不安全造成的問題
經典的HashMap的死迴圈造成CPU100%問題
我們模擬一個HashMap的死迴圈的示例:
//HashMap死迴圈示例<font></font>
public class HashMapDeadLoop {<font></font>
<font></font>
private HashMap hash = new HashMap();<font></font>
<font></font>
public HashMapDeadLoop() {<font></font>
Thread t1 = new Thread() {<font></font>
public void run() {<font></font>
for (int i = 0; i < 100000; i++) {<font></font>
hash.put(new Integer(i), i);<font></font>
}<font></font>
System.out.println("t1 over");<font></font>
}<font></font>
};<font></font>
<font></font>
Thread t2 = new Thread() {<font></font>
public void run() {<font></font>
for (int i = 0; i < 100000; i++) {<font></font>
hash.put(new Integer(i), i);<font></font>
}<font></font>
System.out.println("t2 over");<font></font>
}<font></font>
};<font></font>
t1.start();<font></font>
t2.start();<font></font>
}<font></font>
<font></font>
public static void main(String[] args) {<font></font>
for (int i = 0; i < 1000; i++) {<font></font>
new HashMapDeadLoop();<font></font>
}<font></font>
System.out.println("end");<font></font>
}<font></font>
}<font></font>
https://coolshell.cn/articles/9606.html
複製程式碼
HashMap的死迴圈發生後,我們可以線上程棧中觀測到如下資訊:
/HashMap死迴圈產生的執行緒棧<font></font>
Thread-281" #291 prio=5 os_prio=31 tid=0x00007f9f5f8de000 nid=0x5a37 runnable [0x0000700006349000]<font></font>
java.lang.Thread.State: RUNNABLE<font></font>
at java.util.HashMap$TreeNode.split(HashMap.java:2134)<font></font>
at java.util.HashMap.resize(HashMap.java:713)<font></font>
at java.util.HashMap.putVal(HashMap.java:662)<font></font>
at java.util.HashMap.put(HashMap.java:611)<font></font>
at com.example.demo.HashMapDeadLoop$2.run(HashMapDeadLoop.java:26)
複製程式碼
應用停滯的死鎖,Spring3.1的死鎖問題
我們模擬一個死鎖的示例:
//死鎖的示例<font></font>
public class DeadLock {<font></font>
public static Integer i1 = 2000;<font></font>
public static Integer i2 = 3000;<font></font>
public static synchronized Integer getI2() {<font></font>
try {<font></font>
Thread.sleep(3000);<font></font>
} catch (InterruptedException e) {<font></font>
e.printStackTrace();<font></font>
}<font></font>
return i2;<font></font>
}<font></font>
public static void main(String args[]) {<font></font>
Thread one = new Thread() {<font></font>
public void run() {<font></font>
synchronized (i1) {<font></font>
try {<font></font>
Thread.sleep(3000);<font></font>
} catch (InterruptedException e) {<font></font>
e.printStackTrace();<font></font>
}<font></font>
synchronized (i2) {<font></font>
System.out.println(i1 + i2);<font></font>
}<font></font>
}<font></font>
}<font></font>
};<font></font>
one.start();<font></font>
Thread two = new Thread() {<font></font>
public void run() {<font></font>
synchronized (i2) {<font></font>
try {<font></font>
Thread.sleep(3000);<font></font>
} catch (InterruptedException e) {<font></font>
e.printStackTrace();<font></font>
}<font></font>
synchronized (i1) {<font></font>
System.out.println(i1 + i2);<font></font>
}<font></font>
}<font></font>
}<font></font>
};<font></font>
two.start();<font></font>
}<font></font>
}
複製程式碼
死鎖發生後,我們可以線上程棧中觀測到如下資訊:
//死鎖時產生堆疊<font></font>
"Thread-1":<font></font>
at com.example.demo.DeadLock$2.run(DeadLock.java:47)<font></font>
- waiting to lock (a java.lang.Integer)<font></font>
- locked (a java.lang.Integer)<font></font>
"Thread-0":<font></font>
at com.example.demo.DeadLock$1.run(DeadLock.java:31)<font></font>
- waiting to lock (a java.lang.Integer)<font></font>
- locked (a java.lang.Integer)<font></font>
Found 1 deadlock.
複製程式碼
1.3 基於潔悠神的優化示例
一個計數器的優化,我們分別用同步,ReentrantLock的,原子三種不同的方式來實現一個計數器,體會其中的效能差異
//示例程式碼<font></font>
public class SynchronizedTest {<font></font>
<font></font>
public static int threadNum = 100;<font></font>
public static int loopTimes = 10000000;<font></font>
<font></font>
public static void userSyn() {<font></font>
//執行緒數<font></font>
Syn syn = new Syn();<font></font>
Thread[] threads = new Thread[threadNum];<font></font>
//記錄執行時間<font></font>
long l = System.currentTimeMillis();<font></font>
for (int i = 0; i < threadNum; i++) {<font></font>
threads[i] = new Thread(new Runnable() {<font></font>
@Override<font></font>
public void run() {<font></font>
for (int j = 0; j < loopTimes; j++) {<font></font>
//syn.increaseLock();<font></font>
syn.increase();<font></font>
}<font></font>
}<font></font>
});<font></font>
threads[i].start();<font></font>
}<font></font>
//等待所有執行緒結束<font></font>
try {<font></font>
for (int i = 0; i < threadNum; i++)<font></font>
threads[i].join();<font></font>
} catch (InterruptedException e) {<font></font>
e.printStackTrace();<font></font>
}<font></font>
System.out.println("userSyn" + "-" + syn + " : " + (System.currentTimeMillis() - l) + "ms");<font></font>
}<font></font>
<font></font>
public static void useRea() {<font></font>
//執行緒數<font></font>
Syn syn = new Syn();<font></font>
Thread[] threads = new Thread[threadNum];<font></font>
//記錄執行時間<font></font>
long l = System.currentTimeMillis();<font></font>
for (int i = 0; i < threadNum; i++) {<font></font>
threads[i] = new Thread(new Runnable() {<font></font>
@Override<font></font>
public void run() {<font></font>
for (int j = 0; j < loopTimes; j++) {<font></font>
syn.increaseLock();<font></font>
//syn.increase();<font></font>
}<font></font>
}<font></font>
});<font></font>
threads[i].start();<font></font>
}<font></font>
//等待所有執行緒結束<font></font>
try {<font></font>
for (int i = 0; i < threadNum; i++)<font></font>
threads[i].join();<font></font>
} catch (InterruptedException e) {<font></font>
e.printStackTrace();<font></font>
}<font></font>
System.out.println("userRea" + "-" + syn + " : " + (System.currentTimeMillis() - l) + "ms");<font></font>
}<font></font>
public static void useAto() {<font></font>
//執行緒數<font></font>
Thread[] threads = new Thread[threadNum];<font></font>
//記錄執行時間<font></font>
long l = System.currentTimeMillis();<font></font>
for (int i = 0; i < threadNum; i++) {<font></font>
threads[i] = new Thread(new Runnable() {<font></font>
@Override<font></font>
public void run() {<font></font>
for (int j = 0; j < loopTimes; j++) {<font></font>
Syn.ai.incrementAndGet();<font></font>
}<font></font>
}<font></font>
});<font></font>
threads[i].start();<font></font>
}<font></font>
//等待所有執行緒結束<font></font>
try {<font></font>
for (int i = 0; i < threadNum; i++)<font></font>
threads[i].join();<font></font>
} catch (InterruptedException e) {<font></font>
e.printStackTrace();<font></font>
}<font></font>
System.out.println("userAto" + "-" + Syn.ai + " : " + (System.currentTimeMillis() - l) + "ms");<font></font>
}<font></font>
<font></font>
public static void main(String[] args) {<font></font>
SynchronizedTest.userSyn();<font></font>
SynchronizedTest.useRea();<font></font>
SynchronizedTest.useAto();<font></font>
}<font></font>
}<font></font>
<font></font>
class Syn {<font></font>
private int count = 0;<font></font>
public final static AtomicInteger ai = new AtomicInteger(0);<font></font>
<font></font>
private Lock lock = new ReentrantLock();<font></font>
<font></font>
public synchronized void increase() {<font></font>
count++;<font></font>
}<font></font>
<font></font>
public void increaseLock() {<font></font>
lock.lock();<font></font>
count++;<font></font>
lock.unlock();<font></font>
}<font></font>
<font></font>
@Override<font></font>
public String toString() {<font></font>
return String.valueOf(count);<font></font>
}<font></font>
}
複製程式碼
結論:在併發量高,迴圈次數多的情況,可重入鎖的效率高於同步,但最終原子效能最好。
二、通訊
2.1 資料庫連線池的高效問題
-
一定要在最後接近中連線
-
一定要在最後釋出中連線
2.2 OIO / NIO / AIO
OIO | NIO | AIO | |
---|---|---|---|
型別 | 阻塞 | 非阻塞 | 非阻塞 |
使用難度 | 簡單 | 複雜 | 複雜 |
可靠性 | 差 | 高 | 高 |
吞吐量 | 低 | 高 | 高 |
結論:當效能有嚴苛要求時,應該儘量採用NIO的方式進行通訊。
2.3 TIME_WAIT(客戶端),CLOSE_WAIT(伺服器)問題
反應:經常性的請求失敗
獲取連線情況netstat -n | awk'/ ^ tcp / {++ S [$ NF]} END {for(a in a)print a,S [a]}'
- TIME_WAIT:表示主動關閉,優化系統核心引數可。
- CLOSE_WAIT:表示被動關閉。
- ESTABLISHED:表示正在通訊
解決方案:二階段完成後強制關閉
2.4 序列連線,持久連線(長連線),管道化連線
結論
管道連線的效能最優異,持久化是在序列連線的基礎上減少了開啟/關閉連線的時間。
管道化連線使用限制:
- HTTP客戶端無法確認持久化(一般是伺服器到伺服器,非終端使用);
- 響應資訊順序必須與請求資訊順序一致;
- 必須支援冪等操作才可以使用管道化連線。
三、資料庫操作
-
必須要有索引(特別注意按時間查詢)
-
單條操作或批量操作
注:很多程式設計師在寫程式碼的時候隨意採用了單條操作的方式,但在效能要求前提下,要求採用批量操作方式。
四、JVM
4.1 CPU標高的一般處理步驟
-
頂部查詢出哪個程式消耗的CPU高
-
top -H -p查詢出哪個執行緒消耗的cpu高
-
記錄消耗CPU最高的幾個執行緒
-
printf%x進行pid的進位制轉換
-
jstack記錄程式的堆疊資訊
-
找出消耗CPU最高的執行緒資訊
4.2 記憶體標高(OOM)一般處理步驟
-
jstat命令檢視FGC發生的次數和消耗的時間,次數越多,耗時越長說明存在問題;
-
連續檢視jmap -heap檢視老生代的佔用情況,變化越大說明程式存在問題;
-
使用連續的jmap -histo:live命令匯出檔案,比對載入物件的差異,差異部分一般是發生問題的地方。
4.3 GC引起的單核標高
- 單個CPU佔用率高,首先從GC查起。
4.4 常見SY標高
-
執行緒上下文e月刊頻繁
-
執行緒太多
-
鎖競爭激烈
4.5 愛荷華州標高
- 如果IO的CPU佔用很高,排查涉及到IO的程式,比如把OIO改造成NIO。
4.6 抖動問題
原因:位元組碼轉為機器碼需要佔用CPU時間片,大量的CPU在執行位元組碼時,導致CPU長期處於高位;
現象:“C2 CompilerThread1”守護程式,“C2 CompilerThread0”守護程式CPU佔用率最高;
解決辦法:保證編譯執行緒的CPU佔比。
作者:樑鑫
來源:宜信技術學院