面經手冊 · 第5篇《看圖說話,講解2-3平衡樹「紅黑樹的前身」》

在這裡插入圖片描述

作者:小傅哥
博客://bugstack.cn

沉澱、分享、成長,讓自己和他人都能有所收穫!😄

一、前言

講道理5年開發,沒用過數據結構,你只是在做CRUD!

很多時候大部分程序員👨‍💻‍頭疼於,查詢慢、效率低、一堆的關聯SQL,主要原因是在程序設計上沒有做出很好的數據結構。當然也還有一部分是由於老業務代碼,或者沒有用到一些大數據服務等。

數據結構、算法、設計模式,是每一個程序員成長過程中的內功心法修鍊,而你的新技能用的再絢、多線程使的再6、加鎖玩的再牛🐂,也只能說明你這個人身體好,但身體好是不能抗住子彈的。只有身體+心法都好,都能縱橫捭闔

這一章節是結合HashMap的延展,在Jdk1.8中HashMap是使用桶數組+鏈表和紅黑樹實現,所以順着上一章節的核心原理和API功能講解後,本來這一章節想直接進入到紅黑樹,但如果想把紅黑樹學明白,就需要了解他的來龍去脈,也就是它的前身2-3樹🌲。

二、面試題

謝飛機,考你幾個簡單的知識點🦀

  1. 飛機,看你簡歷寫了解數據結構,可以簡單介紹下2-3樹嗎?
  2. 這種樹節點有什麼特點,與你了解其他的樹結構對比下?
  3. 你看這個圖,向裏面插入和刪除節點,要怎麼操作?

🤥飛機,回去等消息吧!

三、什麼是2-3樹

日常的學習和一部分夥伴的面試中,竟然會聽👂到的是;從HashMap中文紅黑樹、從數據庫索引為B+Tree,但問2-3樹的情況就不是很多了。

1. 為什麼使用樹結構

從最根本的原因來看,使用樹結構就是為了提升整體的效率;插入、刪除、查找(索引),尤其是索引操作。因為相比於鏈表,一個平衡樹的索引時間複雜度是O(logn),而數組的索引時間複雜度是O(n)。

從以下的圖上可以對比,兩者的索引耗時情況;

公眾號:bugstack蟲洞棧 & 鏈表與二叉搜索樹(Binary Search Tree)時間複雜度對比

  • 從上圖可以看到,使用樹結構有效的降低時間複雜度,提升數據索引效率。
  • 另外這個標準的樹結構,是二叉搜索樹(Binary Search Tree)。除此之外樹形結構還有;AVL樹、紅黑樹、2-3樹等

2. 二叉搜索樹退化鏈表

在樹的數據結構中,最先有點是二叉查找樹,也就是英文縮寫BST樹。在使用數據插入的過程中,理想情況下它是一個平衡的二叉樹,但實際上可能會出現二叉樹都一邊倒,讓二叉樹像列表一樣的數據結構。從而樹形結構的時間複雜度也從O(logn)升級到O(n),如下圖;

公眾號:bugstack蟲洞棧 & 二叉搜索樹退化鏈表

  • 二叉搜索樹的數據插入過程是,插入節點與當前樹節點做比對,小於在左,大於在右。
  • 隨着數據的插入順序不同,就會出現完全不同的數據結構。可能是一棵平衡二叉樹,也極有可能退化成鏈表的樹。
  • 當樹結構退化成鏈表以後,整個樹索引的性能也跟着退化成鏈表。

綜上呢,如果我們希望在插入數據後又保持樹的特點,O(logn)的索引性能,那麼就需要在插入時進行節點的調整

3. 2-3樹解決平衡問題

2-3樹是什麼結構,它怎麼解決平衡問題的。帶着問題我們繼續🤔。

2-3樹是一種非常巧妙的結構,在保持樹結構的基礎上,它允許在一個節點中可以有兩個元素,等元素數量等於3個時候再進行調整。通過這種方式呢,來保證整個二叉搜索樹的平衡性。

這樣說可能還沒有感覺,來看下圖;

公眾號:bugstack蟲洞棧 & 2-3樹解決平穩問題

  • 左側是二叉搜索樹,右側是2-3平衡樹,分別插入節點4、5,觀察樹形結構變化。
  • 二叉搜索樹開始出現偏移,節點一遍倒。
  • 2-3樹通過一個節點中存放2到3個元素,來調整樹形結構,保持平衡。所謂的保持平衡就是從根節點,到每一個最底部的自己點,鏈路長度一致。

2-3樹已經可以解決平衡問題那麼,數據是怎麼存放和調整的呢,接下來我們開始分析。

四、2-3樹使用

1. 樹結構定義和特點性質

2-3樹,讀法;二三樹,特性如下;

序號 描述 示意圖
1 2-,1個數據節點2個樹杈
2 3-,2個數據節點3個樹杈
3 三叉與兩叉的不同點在於,除了兩邊的節點,中間件還有一個節點。這個節點是介於2、4之間的值。
4 當隨着插入數據,會出現臨時的一個節點中,有三個元素。這時會被調整成一個二叉樹。

綜上我們可以總結出,2-3樹的一些性質;

  1. 2-3樹所有子葉節點都在同一層
  2. 1個節點可以有1到2個數據,如果有三個需要調整樹結構
  3. 1個節點1個數據時,則有兩個子節點
  4. 1個節點2個數據時,則有三個子節點,且中間子節點是介於兩個節點間的值

2. 數據插入

接下來我們就模擬在二叉搜索樹中退化成鏈表的數據,插入到2-3樹的變化過程,數據包括;1、2、3、4、5、6、7,插入過程圖如下;

公眾號:bugstack蟲洞棧 & 數據插入過程圖

以上,就是整個數據在插入過程中,2-3樹的演化過程,接下來我們具體講解每一步的變化;

  • α,向節點1插入數據2,此時為了保持平衡,不會新產生分支,只會在一個節點中存放兩個節點。
  • β,繼續插入數據3,此時這個節點有三數據,1、2、3,是一個臨時區域。
  • γ,把三個數據的節點,中間節點拉起來,調整成樹形結構。
  • δ,繼續插入數據4,為了保持樹平衡,會插在節點3的右側。
  • ε,繼續插入數據5,插入後3、4、5共用1個節點,當一個節點上有三個數據時候,則需要進行調整。
  • ζ,中間節點4向上⏫調整,調整後,1節點在左、3節點在中間、5節點在右。
  • η ,繼續插入數據6,在保持樹平衡的情況下,與節點5公用。
  • θ ,繼續插入數據7,插入後,節點7會與當前的節點 5 6 共用。此時是一個臨時存放,需要調整。初步調整後,抽出6節點,向上存放,變為2 4 6共用一個節點,這是一個臨時狀態,還需要繼續調整。
  • ι,因為根節點有三個數據2、4、6,則繼續需要把中間節點上移,1、35、7 則分別成二叉落到節點2節點6上。

🇬🇷希臘字母:α(阿爾法)、 β(貝塔)、γ(伽馬)、δ(德爾塔)、ε(伊普西隆)、ζ(截塔)、η(艾塔)、θ(西塔)、ι(約塔)

3. 數據刪除

有了上面數據插入的學習,在看數據刪除其實就是一個逆向的過程,在刪除的主要包括這樣兩種情況;

  1. 刪除了3-節點,也就是包含兩個數據元素的節點,直接刪除即可,不會破壞樹平衡。
  2. 刪除了2-節點,此時會破壞樹平衡,需要將樹高縮短或者元素合併,恢復樹平衡。

承接上面👆的例子,我們把數據再從7、6、5、4、3、2、1順序刪除,觀察2-3樹的結構變化,如下;

公眾號:bugstack蟲洞棧 & 數據刪除過程圖

  • α,刪除節點7,因為節點7隻有一個數據元素,刪除節點5、6合併,但此時破壞了2-3樹的平衡性,需要縮短樹高進行調整。
  • β,因為刪除節點後,整個樹結構不平衡,所以需要縮短樹高,調整元素。節點2、4合併,節點1、3分別插入左側和中間。
  • γ,刪除節點6,這個節點是3-節點(可以分出3個叉的意思),刪除後不會破壞樹平衡,保持不變。
  • δ,刪除節點5,此時會破壞樹平衡,需要把跟節點4下放,與3合併。
  • ε,刪除節點4,這個節點依舊是3-節點,所以不需要改變樹結構。
  • ζ,刪除節點3,此時只有1、2節點,需要合併。
  • η ,刪除節點2,此時節點依舊是3-節點,所以不需要改變樹結構。

再看一個稍微複雜點2-3樹刪除:

公眾號:bugstack蟲洞棧 & 複雜樹刪除過程

上面👆這張圖,就一個稍微複雜點的2-3平衡樹,樹的刪除過程主要包括;

  1. 刪除4,其實需要將節點3、5合併,指向節點2,保持樹平衡。
  2. 刪除7,節點8、9合併。
  3. 刪除14,節點15上移,恢復成3-叉樹。

🤔如果有時候不好理解刪除,可以試想下,這個要刪除的節點,在插入的時候是一個什麼效果。

4. 數據索引

相比於插入和刪除,索引的過程還是比較簡單的,不需要調整數據結果。基本原則就是;

  1. 小於當前節點值,左側尋找
  2. 大於當前節點值,右側尋找
  3. 一直到找到索引值,停止。

🔍第一層尋找:

🔍第二層尋找:

🔍第三次尋找:

五、總結

  • 綜上講解了2-3樹🌲的核心內容,通過本章節的學習,可以了解2-3樹是一種怎樣的數據結構、如何插入數據、刪除數據以及數據的索引,同時要知道這是一種平衡樹的結構,包括2-叉和3-叉節點以及數結構隨着數據的添加刪除調整。
  • 2-3樹是紅黑樹的演變前身,通過這一章節的學習就很容易學習紅黑樹的相關知識,在紅黑樹中添加數據進行的渲染、旋轉等來保持樹平衡。紅黑樹接近平衡
  • 數據結構方面的知識學習起來,可能會比較🤯燒腦,因為需要思考出那種模型結構和變化的過程,所以會感覺困難。但這個燒腦的過程也是對學習非常有幫助的,可以迅速建設知識凸起,當突破不理解到理解,可以有非常多的收穫。

六、系列推薦