Oracle:重複資料去重,只取最新的一條資料

DAYTOY-105發表於2024-09-27

前言

最近開發的時候遇到一個任務,需要對重複的資料進行篩選,只取插入時間最早的一條資料。這裡介紹一下解決這類去重問題的幾種思路

先看樣例資料

解決思路一

先group by找到每個人最新的資料插入時間(insert_time),再透過insert_time作為條件表關聯的條件篩選出每個人最新的資料
1. 先group by找到每個人最新的資料插入時間(insert_time)
SELECT
    T.u_name,
    MAX( T.insert_time ) AS t_inserttime 
FROM
    user_test T 
GROUP BY
    T.u_name

2. 透過insert_time作為條件表關聯的條件篩選出每個人最新的資料
SELECT
    T1.id,
    T1.u_name,
    T1.u_sex,
    T1.u_phone,
    T1.insert_time,
    T1.update_by 
FROM
    `user_test` T1,
    ( SELECT T2.u_name, MAX( T2.insert_time ) AS t_inserttime FROM user_test T2 GROUP BY T2.u_name ) T3 
WHERE
    T1.u_name = T3.u_name 
    AND T1.insert_time = T3.t_inserttime

結果如下:

解法思路2

透過row_number()over()函式解決 (適用於Oracle)

row_number() over()函式的主要功能是分組排序,實現類似group by + order by的效果

SELECT
    FI.* 
FROM
    ( SELECT T.*, ROW_NUMBER ( ) OVER ( PARTITION BY T.u_name ORDER BY T.insert_time DESC ) RW FROM user_test T ) FI 
WHERE
    FI.RW =1

這裡partition by實現了根據使用者名稱進行分組,order by對結果集根據插入時間進行排序,row_number()函式將每一組的行數單獨標註了出來。最後我們取rw=1的資料,也就取到了每個重複使用者資料的最新一條資料。

樣板資料參考:

DROP TABLE IF EXISTS `user_test`;
CREATE TABLE `user_test`  (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `u_name` varchar(50) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL,
  `u_sex` varchar(20) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL,
  `u_phone` varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL,
  `insert_time` datetime NULL DEFAULT NULL,
  `update_by` varchar(50) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL,
  PRIMARY KEY (`id`) USING BTREE
) ENGINE = InnoDB AUTO_INCREMENT = 6 CHARACTER SET = utf8 COLLATE = utf8_general_ci ROW_FORMAT = Compact;

-- ----------------------------
-- Records of user_test
-- ----------------------------
INSERT INTO `user_test` VALUES (1, '小明', '', '13288888888', '2020-10-28 09:44:16', 'admin');
INSERT INTO `user_test` VALUES (2, '小明', '', '13288888888', '2020-10-28 09:45:01', 'admin');
INSERT INTO `user_test` VALUES (3, '小明', '', '13288888888', '2020-10-28 09:45:35', 'admin');
INSERT INTO `user_test` VALUES (4, '小蘭', '', '16896969696', '2020-10-28 09:45:45', 'admin');
INSERT INTO `user_test` VALUES (5, '小蘭', '', '16896969696', '2020-10-28 09:46:14', 'admin');

SET FOREIGN_KEY_CHECKS = 1;

原文連結:https://www.cnblogs.com/moutory/p/17752806.html

相關文章