redis開門之批次插入pipeLine

有点儿意思發表於2024-12-04

原文網址 : https://www.cnblogs.com/kuangsun125/p/18586651

Redis

Redis開門之批次插入Pipeline

下發資料同步到Redis中，資料少的話幾千條，多則達百萬級。其中一個場景是把下發的資料同步到Redis中，資料同步完成後，把資料寫入到檔案中，下發給客戶，客戶呼叫。某天......

產品經理：小A，我發現我們這個資料整體下發的流程耗時有點長啊...從拉取資料到處理下發將近一個小時的時間，每天處理的XX數量也不是很多，看下是哪塊耗時比較久，最佳化下

小A：嗯...我們現在的處理邏輯是所有的任務完成後才會統一進行同步Redis的操作，而且目前的程式碼並沒有批次處理資料到Redis，而是直接一條一條的處理，就很慢....

產品經理：一條一條？百萬的資料那大概處理多長時間啊？最佳化下吧...

小A：嗯，我看下怎麼處理吧

看了之前同步Redis程式碼的邏輯（之前不是小A寫的），非同步處理、執行緒池、分批次、應有盡有但就是很慢。給出小A 最佳化前的大概框架。

try {
            redisTemplate.executePipelined(new SessionCallback<Object>() {
                @Override
                public <K, V> Object execute(RedisOperations<K, V> redisOperations) throws DataAccessException {
                    for (JSONObject redisSynchro : json) {
                        // 同步資料到redis
                        redisTemplate.opsForList().rightPush("XXX")
                        // 設定過期時間
                        redisTemplate.expire()
                    }
                    return null;
                }
            });
        } catch (Exception e) {
            log.info("同步redis發生意外異常 :" + e.getMessage());
        } finally {
            countDownLatch.countDown();
        }

小A查了下Redis批次處理資料的方法網上給出的部落格就是pipeline操作啊，程式碼裡用的就是executePipelined 執行管道操作。嗯... 不對再查查。executePipelined的執行原理是什麼？

管道（Pipeline） 是 Redis 提供的一種最佳化手段，允許客戶端將多個命令一次性傳送到 Redis 伺服器，而不是每次傳送一個命令並等待響應。這樣可以減少網路延遲，提高操作效率。
executePipelined() 方法的本意是將多個 Redis 操作封裝為一個管道批次執行，返回所有操作的結果。
客戶端批次傳送命令 → 伺服器批次執行命令 → 客戶端一次性接收所有結果。

為什麼第一次的執行沒有透過管道執行呢？

封裝層次過高： executePipelined 中使用了 redisTemplate 的操作方法，而不是直接透過 RedisConnection 來執行 Redis 的底層命令。

分散的命令： 每個 rightPush和 expire 方法都各自獨立呼叫，即使這些操作在同一個 executePipelined 方法中，也無法透過 Redis 的原生管道機制最佳化。

所以如果要想使用Redis的管道操作，應該避免使用高層次封裝的redisTemplat。於是乎，小A改變了上面的執行方式

redisTemplate.executePipelined((RedisCallback<Object>) connection -> {
    StringRedisSerializer serializer = new StringRedisSerializer();
    for (ResultInfo result : tmps) {
        // 組裝資料 key/value
        // 檢查元素是否已存在
        if (檢查條件) {
            // 如果不存在，則插入
            connection.rPush(serializer.serialize(key), serializer.serialize(value));
        }
        // 設定過期時間
        connection.expire(serializer.serialize(key), 30 * 24 * 3600L);   
    }
    return null;
});

使用了 StringRedisSerializer 對鍵和值進行序列化。序列化方式直接處理 Redis 底層連線的操作，通常適用於高效能的場景。

經過實測13W級資料插入耗時3秒,9W資料耗時1秒。

Redis pipeline 在連續一萬次插入操作測試中的使用
2018-11-05
Redis
mybatis批次插入
2024-04-19
MyBatis
Yii 批次插入
2022-08-24
mybatis 批次插入資料
2024-12-02
MyBatis
redis cluster如何支援pipeline
2021-06-23
Redis
oracle和mybatis整合，批次插入
2024-11-05
OracleMyBatis
SQL INSERT批次插入方式
2024-07-03
SQL
瑞士軍刀redis-pipeline
2018-11-09
Redis
openresty前端開發入門四之Redis篇
2018-08-23
REST前端Redis
Mybatis如何動態生成插入的列及批次插入值
2024-08-15
MyBatis
redis中multi與pipeline介紹分析
2018-07-09
Redis
redis為什麼要提供pipeline功能
2021-06-21
Redis
Redis(單機&叢集)Pipeline工具類
2020-11-29
Redis
排序演算法入門之「插入排序」
2020-10-20
排序演算法
mybatis-plus批次插入你用對了嗎
2024-04-11
MyBatis
spark 批次寫入redis控制
2024-12-05
SparkRedis
Golang 實現 Redis(6): 實現 pipeline 模式的 redis 客戶端
2020-11-24
GolangRedis模式客戶端
Redis中PipeLine使用(二)---批量get與批量set
2018-12-17
Redis
netty原始碼分析之pipeline(二)
2019-03-03
Netty原始碼
netty原始碼分析之pipeline(一)
2019-02-28
Netty原始碼
Scrapy之pipeline&擴充套件
2020-04-04
套件
netty系列之:Event、Handler和Pipeline
2021-08-07
Netty
laravel 批次插入並在遇到重複鍵時更新
2024-08-15
Laravel
資料庫批次插入這麼講究的麼？
2022-01-04
資料庫
HashMap之元素插入
2018-09-14
HashMap
TreeMap之元素插入
2018-09-05
（Redis）：Redis入門
2020-10-03
Redis
自增長主鍵回顯實現，批次資料插入
2024-03-06
mybatis+oracle 批次插入多條資料的處理方法
2024-10-09
MyBatisOracle
Redis 不同插入方法的效能對比
2023-09-20
Redis
mybatis oracle資料庫批次插入資料，忽略主鍵重複
2024-03-14
MyBatisOracle資料庫
Entity Framework Core 7中高效地進行批次資料插入
2022-12-01
Framework
Jenkins系列之pipeline語法介紹與案例
2022-02-20
Jenkins
MYSQL之插入極限分析
2021-09-09
MySql
【原始碼解讀(二)】EFCORE原始碼解讀之查詢都做了什麼以及如何自定義批次插入
2023-11-10
原始碼
Redis 入門
2019-12-23
Redis
redis入門
2024-09-09
Redis
win10系統如何批次壓縮excel 2010插入的圖片
2020-03-24
Win10Excel

redis開門之批次插入pipeLine

相關文章