色综合图-色综合图片-色综合图片二区150p-色综合图区-玖玖国产精品视频-玖玖香蕉视频

您的位置:首頁技術文章
文章詳情頁

SQL中去除重復數據的幾種方法匯總(窗口函數對數據去重)

瀏覽:114日期:2023-05-02 10:03:14
目錄
  • 方法1:distinct
  • 方法2:group by
  • 方法3:窗口函數

使用SQL對數據進行提取和分析時,我們經常會遇到數據重復的場景,需要我們對數據進行去重后分析。

以某電商公司的銷售報表為例,常見的去重方法我們用到distinct 或者group by 語句, 今天介紹一種新的方法,利用窗口函數對數據去重。

【字段解釋】

訪客id:進入店鋪瀏覽寶貝的客戶

瀏覽時間:訪客進入店鋪瀏覽頁面的日期

瀏覽時常:訪客進入店鋪瀏覽頁面的時長

現在需要知道店鋪里每個訪客和對應的瀏覽日期(每個訪客同一天瀏覽多次算做一次記錄)

【解題思路】

方法1:distinct

SQL書寫如下:

select distinct 訪客id ,瀏覽時間      from 淘寶日銷售數據表;

查詢結果:

這里用distinct語句多字段進行去重的時候,需要特別注意2點:

1)distinct語法規定對單字段、多字段去重,必須放在第一個查詢字段前。

2)如果對表中多列字段進行去重,去重的過程就是將多字段作為整體去重,比如上面的例子,我們將訪客id和瀏覽時間為整體去去重,而不是對訪客id單獨去重后再對姓名單獨去重,所以會出現相同的訪客id對應不同的瀏覽時間。

方法2:group by

SQL書寫如下:

select 訪客id ,瀏覽時間     from 淘寶日銷售數據表group by 訪客id ,瀏覽時間;

查詢結果:

group by對訪客id 和瀏覽時間進行分組,分組匯總后改變了表的行數,一行只有一個類別,這里使用group by后會將訪客id 和瀏覽時間作為一個類別保留,重復的就會不顯示。

方法3:窗口函數

使用窗口函數進行去重時,比distinct和group by稍微復雜些,窗口函數不會減少原表中的行數,而是對字段進行分組后排序。詳細的窗口函數講解

窗口函數的基本語法如下:

<窗口函數> over (partition by <用于分組的列名>order by <用于排序的列名>)

根據題目要求得出每個訪客和對應的瀏覽日期,我們對訪客id ,瀏覽時間進行分組,對瀏覽時長(秒)進行排序。

SQL書寫如下:

select 訪客id ,瀏覽時間 ,row_number()over(partition by 訪客id ,瀏覽時間order by 瀏覽時長(秒)) as 排名     from 淘寶日銷售數據表;

查詢結果:

窗口函數查詢按照每個客戶和瀏覽日期分組,如果同一天有幾次瀏覽,會根據點贊數排序,篩選排名為1,即可得出每個訪客和對應的瀏覽日期。

SQL書寫如下:

select 訪客id ,瀏覽時間 ,row_number()over(partition by 訪客id ,瀏覽時間order by 瀏覽時長(秒)) as 排名     from 淘寶日銷售數據表;

查詢結果:

去除重復項的三種操作,你get了嗎?歡迎評論區補充你的去重辦法~

到此這篇關于SQL中去除重復數據的幾種方法,我一次性都告你?的文章就介紹到這了,更多相關sql去除重復數據內容請搜索以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持!

標簽: MsSQL
主站蜘蛛池模板: 日本精品中文字幕有码 | 久久亚洲国产精品五月天 | a级毛片免费观看视频 | 日韩一级生活片 | 欧美成人免费高清视频 | 亚洲国产一区在线二区三区 | 寡妇一级毛片 | 99精品国产成人一区二区在线 | 国产aⅴ一区二区三区 | 特级毛片全部免费播放a一级 | 99re6热视频精品免费观看 | 欧洲美女与男人做爰 | 成人毛片在线视频 | 精品久久久中文字幕二区 | 手机看片国产精品 | 国产亚洲欧美久久精品 | 国产成人黄网址在线视频 | 成人亚洲天堂 | 国产成人精品高清在线观看99 | 大学生一级一片第一次欧美 | 另类视频在线观看 | 国产a视频| 亚洲成人tv | 草草国产成人免费视频 | 91欧美在线| 美国全免费特一级毛片 | 亚洲99久久久久综合 | 在线观看亚洲免费视频 | 日韩在线看片中文字幕不卡 | 亚洲成年人在线观看 | 综合视频在线 | 免费看欧美成人性色生活片 | 在线视频观看一区 | 99久久成人 | 黄色网址亚洲 | 真正免费一级毛片在线播放 | 天天看a | 国产成人精品综合在线 | 日本亚州在线播放精品 | 欧美高清一区二区三区欧美 | 亚洲最大情网站在线观看 |