­

《MySQL面試小抄》索引考點二面總結

《MySQL面試小抄》索引考點二面總結

我是肥哥,一名不專業的面試官!

我是囧囧,一名積極找工作的小菜鳥!

囧囧表示:小白面試最怕的就是面試官問的知識點太籠統,自己無法快速定位到關鍵問題點!!!


 

本期主要面試考點

面試官考點之談談索引維護過程?頁分裂?頁合併?
面試官考點之簡述一下查詢時B+樹索引搜索過程?
面試官考點之什麼是回表?
面試官考點之什麼是索引覆蓋?使用場景?
面試官考點之什麼情況下會索引失效?
面試官考點之哪些情況下,可能會面臨索引失效的問題?
面試官考點之or走索引和索引失效分別是什麼場景?
面試官考點之哪些情況下需要創建索引?
面試官考點之聯合索引之最左前綴原則?
面試官考點之索引下推場景?

 


 

索引二面1

 

索引二面2

 


 

面試官考點之談談索引維護過程?頁分裂?頁合併?

B+樹為了維護索引有序性,在插入刪除的時候需要做必要的維護,必要時候可能涉及到頁分裂,頁合併過程!

首先假設每個葉子節點(數據頁或磁碟塊)只能存儲3條索引和數據記錄,如圖

ID索引樹

情況1、新增行記錄,ID=3,此時【數據頁1】未滿,只需要在data2後新增ID=3的行記錄,B+樹整體結構不需要進行調整

索引頁分裂

情況2、新增行記錄,ID=8,此時【數據頁2】已滿,這時候需要申請一個新的數據頁,然後挪動部分數據過去。這個過程稱為頁分裂

頁分裂過程消耗性能,同時空間利用率也降低了

有分裂就有合併,當相鄰兩個頁由於刪除了數據,利用率很低之後,會將數據頁做合併。合併的過程,可以認為是分裂過程的逆過程

當相鄰兩個頁由於刪除了數據,利用率很低之後,會將數據頁做合併。合併的過程,可以認為是分裂過程的逆過程。

【數據頁2】刪除了ID=7,ID=8的行記錄,此時【數據頁2】【數據頁3】利用率很低,將進行頁合併。

面試官考點之簡述一下查詢時B+樹索引搜索過程?

準備一張用戶表,其中id為主鍵,age為普通索引

CREATE TABLE `user` (
`id` int(11) PRIMARY KEY,
`name` varchar(255) DEFAULT NULL,
`age` int(11) DEFAULT NULL
KEY `idx_age` (`age`) USING BTREE
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

select * from user where age=22 簡述一下B+樹索引搜索過程?

假設要查詢的記錄

 id=5,name="張三",age=22

MySQL為每個索引分別維護了一棵B+Tree索引樹,

主鍵索引非葉子節點維護了索引鍵,葉子節點存儲行數據;

非主鍵索引也稱為二級索引,非葉子節點存儲主鍵;

B+樹索引搜索過程

搜索條件 age=22,可走idx_age索引,首先載入idx_age索引樹,找到age=22的記錄,取得id=5

回表搜索,載入主鍵索引樹,找到id=22的記錄,取得整行數據

面試官考點之什麼是回表?

idx_age二級索引樹找到主鍵id後,回到id主鍵索引搜索的過程,就稱為回表。

並非所有非主鍵索引搜索,都需要進行回表搜索,也就是下面要說的索引覆蓋。

面試官考點之什麼是索引覆蓋?使用場景?

在上面提到的例子中,由於查詢結果所需要的數據只在主鍵索引上有,所以不得不回表。

如果在查詢的數據列裡面,直接從索引列就能取到想要的結果,就不需要再回表去查,也稱之為索引覆蓋!

索引覆蓋的優點

  1. 可以避免對Innodb主鍵索引的二次查詢

  2. 可以避免MyISAM表進行系統調用

  3. 可以優化快取,減少磁碟IO操作

 

修改一下上述栗子,滿足索引覆蓋條件?

select id, age from user where age=22

查詢的資訊,id,age都可以直接在idx_age 索引樹中獲取,不需要回表搜索。

由於覆蓋索引可以減少樹的搜索次數,顯著提升查詢性能,所以使用覆蓋索引是一個常用 的性能優化手段。

 

索引是一把雙刃劍,提供快速排序搜索的同時,索引欄位的維護也是要付出相應的代價的。

因此,在建立冗餘索引來支援覆蓋索引時就需要權衡考慮了

面試官考點之索引失效?

創建的索引,到底有沒有生效,或者說SQL語句有沒有使用索引查詢?

一個最常見的查詢場景,建立idx_name索引

select * from t_user where user_name like '%mayun100%';

這條查詢是否走索引?

like不走索引

select * from t_user where user_name like 'mayun100%';

這條查詢是否走索引?

like走索引

面試官考點之有哪些情況下,可能會面臨索引失效的問題?

  1. like通配符,左側開放情況下,全表掃描

  2. or條件篩選,可能會導致索引失效

  3. where中對索引列使用mysql的內置函數,一定失效

  4. where中對索引列進行運算(如,+、-、*、/),一定失效

  5. 類型不一致,隱式的類型轉換,導致的索引失效

  6. where語句中索引列使用了負向查詢,可能會導致索引失效 負向查詢包括:NOT、!=、<>、!<、!>、NOT IN、NOT LIKE等。其中!< !> 為SQLServer語法。

  7. 索引欄位可以為null,使用is null或is not null時,可能會導致索引失效

  8. 隱式字元編碼轉換導致的索引失效

  9. 聯合索引中,where中索引列違背最左匹配原則,一定會導致索引失效

  10. MySQL優化器的最終選擇,不走索引

面試官考點之or走索引和索引失效分別是什麼場景?

or走索引和索引失效分別是什麼場景?

or查詢

OR 連接的是同一個欄位,相同走索引

explain select * from t_user where user_name = 'mayun10' or user_name = 'mayun1000'

or查詢走索引情況

OR 連接的是兩個不同的欄位,不走索引

or查詢索引失效情況

給address列增加索引

alter table t_user add index idx_address(address);
explain select * from t_user where user_name = 'mayun10' or address = '浙江杭州12';

OR 連接的是兩個不同欄位,如果兩個欄位皆有索引,走索引

or查詢走索引情況-兩邊欄位有索引

 

(插播,下一期:《MySQL面試小抄》幾種索引失效場景驗證)

盡請關註:囧么肥事

面試小抄系列。

面試官考點之哪些情況下需要創建索引?

1.主鍵自動建立唯一索引

2.頻繁查詢的欄位

3.JOIN 關聯查詢,作為外鍵關係的列建立索引

4.單鍵/組合索引的選擇問題,高並發下傾向創建組合索引,創建時遵循最左前綴匹配原則

5.ORDER BY 查詢中排序的欄位,排序欄位通過索引訪問大幅提高排序速度

6.GROUP BY 需要分組欄位或查詢中統計欄位

面試官考點之聯合索引之最左前綴原則

MySQL建立多列索引(聯合索引)有最左前綴的原則,即最左優先

 

當MySQL建立的是聯合索引,假設以(a,b,c) 列作為聯合索引,那麼MySQL建樹規則是什麼?

我們知道MySQL會為每一個索引維護一顆B+Tree,非葉子節點存儲索引key,葉子節點存儲行數據data。

聯合索引(a,b,c) 相當於建立了 (a), (a,b), (a,b,c) 三個索引,MySQL組裝索引樹時,是按照從左到右的順序來建立B+Tree的聯合索引樹的。

匹配索引情況一

假設(a,b,c)索引要搜索的值為(‘張三’, 21, 100) ,檢索數據時,匹配的順序就是a,b,c。

 

B+Tree會優先比較a來確定下一步的所搜方向,如果a相同再依次比較b和c,最後得到檢索的數據;

匹配索引情況二

假設(a,c)索引要搜索的值為(‘張三’, 100) ,檢索數據時,匹配的順序就是a,b,c。

 

B+Tree使用a來指定搜索方向,但下一個欄位b缺失,所以只能把a等於張三的數據都找到,然後再匹配c是100的數據。

匹配索引情況三

假設(b,c)索引要搜索的值為(‘張三’, 21) ,檢索數據時,無匹配順序

 

B+Tree不知道下一步該查哪個節點,因為建立搜索樹的時候a是第一個比較因子,必須要先根據a來搜索才能知道下一步去哪裡查詢。此時索引失效!

 

索引項是按照索引定義裡面出現的欄位順序排序的,最左前綴可以是聯合索引的最左N個欄位,也可以是字元串索引的最左M個字元。

 

面試官考點之索引下推場景?

索引下推,即減少二級索引回表搜索次數!!!

通俗說,減少查詢主鍵索引樹次數,減少磁碟IO

建立聯合索引 idx_age_weight

select * from user where age = 11 and weight = 98

5.6之前搜索過程是

在idx_age_weight 索引樹中匹配出所有的 age = 11 索引,拿到主鍵id,回表去一條條再比對weight欄位

 

如下圖,需要進行3次回表搜索操作

 

5.6之前回表操作

 

5.6後的搜索過程是 在idx_age_weight 索引樹中匹配出所有的 age = 11 索引,順便對weight欄位進行判斷,過濾掉weight = 100的記錄,然後再進行回表搜索。

 

如下圖,只需要進行2次回表搜索操作

 

5.6後索引下推

 

隨緣更新,大神請繞路!

 

更多精彩內容,歡迎關注微信公眾號:囧么肥事 (或搜索:jiongmefeishi)