線上最佳化之案例實戰
來源:waynblog
本文是我從業多年開發生涯中針對線上業務的處理經驗總結而來,這些業務或多或少相信大家都遇到過,因此把最佳化經驗分享給大家,大家也可以看看是不是遇到過類似場景。
本文大綱如下,
後臺上傳檔案
線上後臺專案有一個訊息推送的功能,運營新建一條通知訊息時,需要一起上傳一列包含使用者 id 的檔案,來給檔案中包含的指定使用者推送系統訊息。
如上功能描述看著很簡單,但是實際上處理上傳檔案這一步是由講究的,假如說後臺上傳檔案太大,導致記憶體溢位,又或者讀取檔案太慢等其實都是一些隱性的問題。
對於技術側想要做好這個功能,保證大使用者量(比如達到百萬級別)下,上傳檔案、傳送訊息功能都正常,其實是需要仔細思考的,我這裡給出我的最佳化思路。
上傳檔案型別選擇
通常情況下大部分使用者都會使用 Excel 檔案作為後臺上傳檔案型別,但是相比 Excel 檔案,還有一種更加推薦的檔案格式,那就是 CSV 檔案。
CSV 是一種純文字格式,資料以文字形式儲存,每行資料以逗號分隔,沒有任何格式化。
因此 CSV 適用於簡單、易讀、匯入和匯出的場景,而且由於 CSV 檔案只包含純文字,因此檔案大小通常比 Excel 檔案小得多。
但是 CSV 檔案針對複雜電子表格操作的支援就沒 Excel 功能那麼強大了,不過在這個只有一列的檔案上傳業務裡夠用了。
假如說上傳檔案中包含 100 萬使用者 id,那麼這裡使用 CSV 檔案上傳就有明顯優勢,佔用記憶體更少,處理上傳檔案也更快。
訊息推送狀態儲存
由於大批次資料插入是一個耗時操作(可能幾秒也可能幾分鐘),所以需要儲存批次插入是否成功的狀態,在後臺中還需要顯現出這條訊息推送狀態是成功還是失敗,方便運營人員回溯訊息推送狀態。
批次寫入
針對這裡上傳大檔案時的批次寫入場景,這裡提幾個點大家注意一下就行,
rewriteBatchedStatements=true
MySQL 的 JDBC 連線的 url 中要加 rewriteBatchedStatements 引數,並保證 5.1.13 以上版本的驅動,才能實現高效能的批次插入。
MySQL JDBC 驅動在預設情況下會無視 executeBatch()語句,把我們期望批次執行的一組 sql 語句拆散,一條一條地發給 MySQL 資料庫,批次插入實際上是單條插入,直接造成較低的效能。只有把 rewriteBatchedStatements 引數置為 true, 驅動才會幫你批次執行 SQL。另外這個選項對 INSERT/UPDATE/DELETE 都有效。
是否啟用事物功能
批次寫入場景裡要不要啟用事物,其實很多人都有自己的看法,這裡我給出啟用於不啟用的利弊,
啟用事務:好處在於如批次插入過程中,異常情況可以保證原子性,但是效能比不開事務低,在特大資料量下會明顯低一個檔次 不啟用事務:好處就是寫入效能高,特大資料量寫入效能提升明顯,但是無法保證原子性
在本文提到的大檔案上傳批次寫入的場景下,要是追求極致效能我推薦是不啟用事務的。
假如在批次寫入過程中發生網路波動或者資料庫當機,我們其實只需要重新新建一條通知訊息,然後重新上傳包含使用者 id 的檔案即可。
因為上一條通知訊息因為批次插入步驟沒有全部完成,所以推送狀態是失敗。後續等開發人員處理一下髒資料即可。
大事務
@Transactional
是 Spring
框架提供得事務註解,相信這是許多人都知道的,但是在一些高效能場景下,是不建議使用的,推薦透過程式設計式事務來手動控制事務提交或者回滾,減少事務影響範圍,因而提升效能。
使用事務註解
如下是一段訂單超時未支付回滾業務資料得程式碼,採用 @Transactional
事務註解
@Transactional(rollbackFor = Exception.class)
public void doUnPaidTask(Long orderId) {
// 1. 查詢訂單是否存在
Order order = orderService.getById(orderId);
,,,
// 2. 更新訂單為已取消狀態
order.setOrderStatus((byte) OrderStatusEnum.ORDER_CLOSED_BY_EXPIRED.getOrderStatus());
orderService.updateById(order);
...
// 3. 訂單商品數量增加
LambdaQueryWrapper<OrderItem> queryWrapper = Wrappers.lambdaQuery();
queryWrapper.eq(OrderItem::getOrderId, orderId);
List<OrderItem> orderItems = orderItemService.list(queryWrapper);
for (OrderItem orderItem : orderItems) {
Long goodsId = orderItem.getGoodsId();
Integer goodsCount = orderItem.getGoodsCount();
if (!goodsDao.addStock(goodsId, goodsCount)) {
throw new BusinessException("秒殺商品貨品庫存增加失敗");
}
}
// 4. 返還使用者優惠券
couponService.releaseCoupon(orderId);
log.info("---------------訂單orderId:{},未支付超時取消成功", orderId);
}
可以看到上面訂單回滾的程式碼邏輯有四個步驟,如下,
查詢訂單是否存在 更新訂單為已取消狀態 訂單商品數量增加 返還使用者優惠券
這裡面有個問題,訂單回滾方法裡面其實只有 2、3、4 步驟是需要在一個事物裡執行的,第 1 步其實可以放在事物外面來執行,以此縮小事物範圍。
使用程式設計式事務
使用程式設計式事務對其最佳化後,程式碼如下,
@Resource
private PlatformTransactionManager platformTransactionManager;
@Resource
private TransactionDefinition transactionDefinition;
public void doUnPaidTask(Long orderId) {
// 啟用程式設計式事務
// 1. 在開啟事務錢查詢訂單是否存在
Order order = orderService.getById(orderId);
...
// 2. 開啟事務
TransactionStatus transaction = platformTransactionManager.getTransaction(transactionDefinition);
try {
// 3. 設定訂單為已取消狀態
order.setOrderStatus((byte) OrderStatusEnum.ORDER_CLOSED_BY_EXPIRED.getOrderStatus());
orderService.updateById(order);
...
// 4. 商品貨品數量增加
LambdaQueryWrapper<OrderItem> queryWrapper = Wrappers.lambdaQuery();
queryWrapper.eq(OrderItem::getOrderId, orderId);
List<OrderItem> orderItems = orderItemService.list(queryWrapper);
for (OrderItem orderItem : orderItems) {
Long goodsId = orderItem.getGoodsId();
Integer goodsCount = orderItem.getGoodsCount();
if (!goodsDao.addStock(goodsId, goodsCount)) {
throw new BusinessException("秒殺商品貨品庫存增加失敗");
}
}
// 5. 返還優惠券
couponService.releaseCoupon(orderId);
// 6. 所有更新操作完成後,提交事務
platformTransactionManager.commit(transaction);
log.info("---------------訂單orderId:{},未支付超時取消成功", orderId);
} catch (Exception e) {
log.info("---------------訂單orderId:{},未支付超時取消失敗", orderId, e);
// 7. 發生異常,回滾事務
platformTransactionManager.rollback(transaction);
}
}
可以看到採用程式設計式事務後,我們將查詢邏輯排除在事務之外,這樣也就減小了事物影響範圍。
在極高效能優先的場景下,我們甚至可以考慮不使用事務,使用本地訊息表 + 訊息佇列來實現最終一致性就行 。
海量日誌採集
公司線上有一個專案的客戶端,採用 tcp 協議與後端的一個日誌採集服務建立連線,用來上報客戶端日誌資料。
在業務高峰期下,會有同時成千上萬個客戶端建立連線,實時上報日誌資料。
在上面的高峰期場景下,日誌採集服務會有不小的壓力,如果程式程式碼邏輯處理稍有不當,就會造成服務卡頓、CPU 佔用過高、記憶體溢位等問題。
為了解決上面的大量連線實施上報資料的場景,日誌採集服務決定使用 Netty 框架進行開發。
這裡直接給出日誌採集程式使用 Netty 後的一些最佳化點,
採集日誌非同步化
針對客戶端連線上報日誌的採集流程非同步化處理有三個方案,給大家介紹一下,
普通版:採用阻塞佇列 ArrayBlockingQueue
得生產者消費者模式,對上報的日誌資料進行非同步批次處理,在此場景下,透過生產者將資料快取到記憶體佇列中,然後再消費者中批次獲取記憶體佇列的日誌資料儲存入庫,好處是簡單易用,壞處是有記憶體溢位風險。進階版:採用 Disruptor
佇列,也是一個基於記憶體的高效能生產者消費者佇列,消費速度對比ArrayBlockingQueue
有一個數量級以上得效能提升,附簡介說明:。終極版:也是公司日誌採集程式最後採用的方案。採用 kfaka
訊息佇列中介軟體,先持久日誌上報資料,然後慢慢消費。雖然引入第三方依賴會增加系統複雜度,但是kfaka
在大資料場景表現實在是太優秀了,這一點也是值得。
採集日誌壓縮
對上報後的日誌如果要再傳送給其他服務,是需要進行壓縮後再處理,這一步是為了避免消耗過多網路頻寬。
在 Java 裡通常是指序列化方式,Jdk 自帶得序列化方式對比 Protobuf、fst、Hession 等在序列化速度和大小的表現上都沒有優勢,甚至可以用垃圾形容。
Java 常用的序列化框架有下面這些,
JDK 自帶的序列化:效能較差,佔用空間大,無法跨語言,好處是簡單易用,通用性強。 JSON:常用的 JSON 庫有 Jackson、Gson、Fastjson 等。效能較好,佔用空間少,跨語言支援廣泛,但是無法序列化複雜物件。 Protocol Buffers:由 Google 開源,基於 IDL 語言定義格式,編譯器生成物件訪問程式碼。效能高效佔用空間小,但是需要提前定義 Schema。 Thrift:Facebook 開源,與 Protocol Buffers 類似。定製生態不如 PB 完善,但是支援多語言互動。 Avro:Hadoop 生態圈序列化框架,支援資料隔離與進化,動態讀寫,效能可靠性好,佔用空間較小。但是使用複雜,通用性較差。 Hessian:一款開源的二進位制遠端通訊協議,使用簡單方法提供了RMI功能,主要用於物件導向的訊息通訊。支援跨平臺、多語言支援、使用簡單,缺點是傳遞複雜物件效能會下降,不適合安全性高的應用。
如果相容性要求不高可以選擇 JSON,如果要求效率以及傳輸資料量越小越好則 PB/Thrift/Avro/Hessian 更合適。
資料落庫選型
像日誌這種大資料量落庫,都是新增且無修改得場景建議使用 Clickhouse 進行儲存,好處是相同資料量下對比 MySQL 佔用儲存更少,查詢速度更快,壞處就是併發查詢效能比較低,相比 MySQL 使用不算那麼成熟。
最後聊兩句
到這裡本文所介紹三個線上業務最佳化實戰就講完了,其實這種實戰案例還有很多,但是礙於篇幅本文就沒講那麼多拉,後續有機會也會繼續更新這類文章,希望大家能夠喜歡。
來自 “ ITPUB部落格 ” ,連結:https://blog.itpub.net/70027824/viewspace-2999481/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 線上業務最佳化之案例實戰
- MySQL效能最佳化淺析及線上案例MySql
- Elasticsearch 億級資料檢索效能最佳化案例實戰!Elasticsearch
- 線上多域名實戰
- WinDbg(3)實戰案例
- HBase最佳化實戰
- 騰訊遊戲效能實戰案例分享之幀率陡變遊戲
- Sharding JDBC案例實戰JDBC
- 深度剖析Reflect + 實戰案例
- JQuery8:實戰案例jQuery
- JavaScript8:實戰案例JavaScript
- redis實戰最佳化二Redis
- MinIO線上擴容實戰
- Springboot實戰——黑馬點評之秒殺最佳化Spring Boot
- 1.17 JavaScript8:實戰案例JavaScript
- Laravel —— 服務注入實戰案例Laravel
- 4-陣列-案例實戰陣列
- 基礎爬蟲案例實戰爬蟲
- 實戰SEO——實用技法與案例剖析
- 線上BUG:MySQL死鎖分析實戰MySql
- ElasticSearch7.3學習(二十八)----聚合實戰之電視案例Elasticsearch
- ffmpeg實戰-音視訊合成案例
- vue2.0+Element-ui實戰案例VueUI
- 騰訊雲大資料實戰案例大資料
- Python實戰小案例,值得收藏!Python
- 真實世界SQL最佳化案例2_訪問路徑最佳化SQL
- SQL最佳化案例-分割槽索引之無字首索引(六)SQL索引
- ORACLE 11G 效能診斷最佳化之ASH實戰分析詳解Oracle
- 小程式實戰:線上借書平臺
- react實戰-線上音樂播放器React播放器
- union all 最佳化案例
- 域名繫結動態IP實戰案例
- ElasticSearch7.3學習(二十九)----聚合實戰之使用Java api實現電視案例ElasticsearchJavaAPI
- Storm實戰之WordCountORM
- Storm實戰之TopNORM
- 一次 MySQL 線上死鎖分析實戰MySql
- 收集、分析線上日誌資料實戰——ELK
- Java線上問題排查神器Arthas實戰分析Java