聯合索引該如何選擇合適的列?
                發布時間:2023-05-05 13:14:27 文章來源:江南一點雨
                前面一篇文章,松哥和大家聊了MySQL中的索引合并,雖然MySQL提供了索引合并機制來提升SQL執行的效率,然而

                前面一篇文章,松哥和大家聊了 MySQL 中的索引合并,雖然 MySQL 提供了索引合并機制來提升 SQL 執行的效率,然而在具體實踐中,如果能避免發生索引合并是最好的,畢竟這是沒辦法的辦法,是一個下下策。發生索引合并大概率是因為我們索引在設計的時候就有問題,設計好聯合索引,我們就能在一定程度上避免發生索引合并問題。


                (資料圖片僅供參考)

                1. 聯合索引1.1 什么是聯合索引

                聯合索引就是數據表中的多個字段,共同組成一個索引。由于 InnoDB 中索引的數據結構是一個 B+Tree,當是一個聯合索引的時候,排序的時候會首先按照聯合索引的第一個字段排序,如果第一個字段的值相同,則按照第二個字段排序,如果第二個字段的值也相同,則按照第三個字段排序,以此類推。

                舉一個簡單的例子,假設我有如下數據:

                id

                username

                age

                address

                gender

                1

                ab

                99

                深圳

                2

                ac

                98

                廣州

                3

                af

                88

                北京

                4

                bc

                80

                上海

                5

                bg

                85

                重慶

                6

                bw

                95

                天津

                7

                bw

                99

                海口

                8

                cc

                92

                武漢

                9

                ck

                90

                深圳

                10

                cx

                93

                深圳

                現在我給 username 和 age 字段建立聯合索引,那么 B+Tree 在排序的時候,會首先按照 username 排序,當 username 相同的時候,再按照 age 進行排序。畫出來的 B+Tree 如下圖:

                如上圖,bw 相同的時候,按照 age 進行排序。

                如果我們想要在 MySQL 中,讓聯合索引發揮最大作用,就要充分考慮到聯合索引中各字段的順序。

                1.2 聯合索引順序要考慮哪些因素?

                在設計聯合索引的時候,我們最容易想到的原則是查詢條件影響了聯合索引中各個字段的順序,要根據查詢條件來設計聯合索引中各個字段的順序。

                實際上,除了上面提到的查詢條件之外,聯合索引的順序還會影響到查詢的排序和分組等,所以,設計聯合索引的順序可以算是一個真真正正的技術活。

                2. 案例分析

                松哥這里還是使用官方的案例吧,小伙伴們在公眾號后臺回復mysql官方案例可以獲取到這個數據庫腳本的下載地址。

                在 MySQL 的官方案例中,有一個支付表 payment,如下圖:

                小伙伴們從圖中可以看到,這個表中有一個 customer_id 和一個 staff_id,現在假設我想要按照這兩個來進行搜索,例如執行如下 SQL:

                select * from payment where customer_id=1 and staff_id=2;

                查詢條件有兩個,我想建立一個聯合索引,那么究竟是把 customer_id 放在前面還是把 staff_id 放在前面呢?

                一個比較常用的法則是看字段的選擇性,選擇性高的字段應該是放在前面。有的小伙伴可能還不清楚什么是字段的選擇性,可以參考松哥之前的文章:前綴索引,在性能和空間中尋找平衡。

                那么怎么獲取各個字段的選擇性呢?這個很好計算,一個 SQL 搞定,如下:

                select count(distinct customer_id)/count(1) as c,count(distinct staff_id)/count(1) as s from payment;

                執行結果如下:

                可以看到,customer_id 的選擇性為 0.0373,而 staff_id 的選擇性為 0.0001,那么在建立聯合索引的時候,將 customer_id 放在第一列顯然更合適一些,因為它的選擇性更高(意味著字段里邊重復的值相對來說會少一些),根據 customer_id 更容易鎖定一行,查詢效率要更高一些。

                不過需要注意,上面的法則并非放之四海而皆準,還是要具體問題具體分析。在一些特別極端的情況下,索引選擇性非常之低,那個時候就沒有必要建立聯合索引了。特殊情況甚至需要我們從業務邏輯上去解決。

                松哥舉一個例子來說明這個問題。

                在我第一版的 vhr 中,當時有一個系統通知的功能,就是管理員可以給所有的用戶群發消息。用戶之間也可以互發消息,如果發送消息的時候,用戶不在線,就需要先把消息存到數據庫中,等用戶上線了再推給用戶,那么就需要一張表來保存消息。這個表中有一個字段就是消息發送者,由于網站經常需要發送通知,就導致這個字段的值分布非常不均,大約有 50% 的值都是 admin,剩下的 50% 則是其他普通用戶,那么查詢的時候,據此字段建立的聯合索引,如果查詢條件不是 admin,則過濾效果不錯,如果查詢條件是 admin,則過濾效果就非常差。對于這樣的問題,我們就需要從業務上去解決,例如禁止根據 admin 去查詢等等。總之,建立聯合索引時,我們前面所所說的字段選擇性最高的原則,并不是放之四海而皆準的,小伙伴們還是要具體情況具體分析。

                3. 注意事項

                由于聯合索引也是存儲在 B+Tree 中,如 1.1 小節圖示,username 在整棵 B+Tree 中是有序的,但是從整體上來看,age 是無序的,所以對于聯合索引在搜索的時候,需要滿足最做匹配原則才是有效的,否則會失效。舉例來說,如果查詢條件里只有 age,則索引就會失效,因為順著索引的 B+Tree 去查詢滿足條件的記錄,得一個一個找,還不如直接遍歷主鍵索引。

                標簽:

                資訊播報

                樂活HOT

                • 《熊出沒·伴我“熊芯”》票房破10億 打破內地影史春節檔動畫片紀錄
                  《熊出沒·伴我“熊芯”》票房破

                  據各方數據,1月31日上午10時許,深圳出品的動畫電影《熊出沒·伴我熊芯》票房突破10億元,在首日票房、檔期票房、連續破億天數等多方面打

                • 今年春節深圳游客出境游訂單量大幅增加 曼谷等地成為最受歡迎目的地
                  今年春節深圳游客出境游訂單量大

                  1月27日,攜程發布的《2023年春節旅游總結報告》顯示,今年春節,深圳游客的出境游訂單量同比去年增長近5倍。相較國內熱門景點的人山人海,

                • 2023年春節黃金周深圳共接待游客469.25萬人次 旅游收入31.58億元
                  2023年春節黃金周深圳共接待游客

                  1月27日,記者從深圳市文化廣電旅游體育局獲悉,2023年春節黃金周期間(1月21日至27日),深圳共接待游客469 25萬人次,旅游收入31 58億元,

                • 深圳機場連續多日客流量超過10萬人次 衛星廳迎來首個大客流春運
                  深圳機場連續多日客流量超過10萬

                  據深圳市春運辦統計,1月15日和16日連續兩天,深圳對外發送旅客人數都在48萬左右,春運進入客流高峰期。1月15日,深圳春運對外旅客發送量達

                • 深圳交響樂團將將舉辦兩場音樂會 以世界經典管弦樂和歌劇詠嘆調為主
                  深圳交響樂團將將舉辦兩場音樂會

                  新年音樂會是觀眾喜聞樂見的年度重要文化品牌活動,多年來已成為深圳市民跨歲迎新的例牌項目。12月30日、31日晚,深圳交響樂團將在深圳音樂

                • 深圳大力推進實施人才強市戰略 深圳市人才總量已達到663萬人
                  深圳大力推進實施人才強市戰略

                  作為來深科研人員中的一員,中山大學附屬第八醫院的助理研究員郭雅婕對深圳在人才服務方面的舉措贊不絕口:我作為基礎研究人員,很希望自己

                • 2023年故宮年票正式開售 有消費者目前仍對購買年票持觀望態度
                  2023年故宮年票正式開售 有消費

                  12月1日晚8點,2023年故宮年票正式開售。相比于去年,今年購票順暢了許多。據了解,2022年故宮年票發售時,因短時間內購買年票人數過多,曾

                • 御寒類商品消費需求有所上升 羽絨服的整體銷售額同比增長達100%
                  御寒類商品消費需求有所上升 羽

                  昨日,冷空氣到達,廣州氣溫逐步下降。據商超方面預測,隨著氣溫的逐漸下降,市民對于御寒類商品消費需求有所上升,不少廣州商超準備了有關

                • 深圳全市共排查窨井蓋約350萬個 發現存在問題的窨井蓋約3.2萬個
                  深圳全市共排查窨井蓋約350萬個

                  小井蓋、大民生。今年以來,深圳開展全市窨井蓋專項治理工作成效顯著。截至11月20日,全市共排查窨井蓋約350萬個,發現存在問題的窨井蓋約3

                • 汕汕鐵路汕頭站公布最新動態 首期工程預計將于2024年11月完成
                  汕汕鐵路汕頭站公布最新動態 首

                  備受關注的汕汕(汕頭至汕尾)鐵路汕頭站及站區工程近日傳出最新動態:項目已順利完成工程招標工作,由中鐵建設集團有限公司中標承建。目前,

                娛樂LOVE

                精彩推送

                亚洲国产美女视频| 亚洲AV永久无码精品一百度影院 | 亚洲沟沟美女亚洲沟沟| 久久久久亚洲精品无码网址 | 亚洲色欲www综合网| 亚洲天堂男人天堂| 亚洲男人天堂2017| 亚洲国产成人久久精品影视| 亚洲熟妇中文字幕五十中出| 国产黄色一级毛片亚洲黄片大全| 中文字幕精品无码亚洲字| 久久久久亚洲精品中文字幕| 亚洲中文字幕在线观看| 亚洲日韩av无码| 亚洲av无码无在线观看红杏| 亚洲福利在线视频| 亚洲第一二三四区| 中文字幕在线观看亚洲视频| 亚洲一本到无码av中文字幕| 亚洲av午夜国产精品无码中文字| 色欲aⅴ亚洲情无码AV蜜桃 | 无码乱人伦一区二区亚洲一| 久久狠狠高潮亚洲精品| 亚洲综合无码一区二区三区| 亚洲伦理一二三四| 亚洲日本一线产区和二线产区对比| 亚洲精品中文字幕无码A片老| www亚洲精品久久久乳| 亚洲高清国产拍精品青青草原| 国产成人毛片亚洲精品| 久久久青草青青亚洲国产免观| 亚洲AV无码日韩AV无码导航| 亚洲精品一卡2卡3卡三卡四卡| 亚洲一区二区三区亚瑟| 亚洲s码欧洲m码吹潮| 亚洲日本韩国在线| 亚洲AV无码一区东京热久久| 亚洲国产精品成人综合久久久| 亚洲熟伦熟女专区hd高清| 亚洲高清免费视频| 黑人精品videos亚洲人|