大型面試現場:一條update sql執行都經歷什麼?
導讀
Hi,大家好!我是白日夢!本文是MySQL專題的第 24 篇。
今天我要跟你分享的MySQL話題是:「從一條update sql執行都經歷什麼開始,發散開一系列的問題,看看你能抗到第幾問吧」
換一種寫作風格,自導自演面試現場!感覺這樣還是比較有趣的,歡迎大家訂閱我的MySQL專題,公眾號首發!持續更新中~
歡迎關注白日夢,公眾號首發!持續連載中
Hi同學,聽說你上一面表現的還可以,這一面要不咱繼續?
嗯,好啊!
好,你說一下一條update sql的執行,都經歷了哪些階段吧
我可以畫一張簡圖,然後我們一起看一下這張腦圖吧
你可以花幾秒看下這個圖哦
嗯,你繼續!
一般在我們的後端系統中,和數據庫打交道都邏輯都放在DAO層,DAO層的持久化框架中封裝了:數據驅動(Driver),SQL語句一般也都是由DAO層的持久化框架發送給數據庫的。
嗯,那你說的DAO層就是上圖中的客戶端了吧
但是我看你的簡圖,貌似是把數據庫劃分成兩部分,Server層和InnoDB層。你說說看!
是的,通常大家會把數據庫分層兩部分,上層的Server層和下層的存儲引擎層。
總的來看:Server層主要是負責和客戶端建立網絡連接,接受客戶端傳遞過來的SQL、預處理、由執行器發送給儲存引擎執行。
而存儲引擎會和操作系統的文件系統打交道。
我在圖中畫的存儲引擎層是InnoDB,MySQL不止這一種執行引擎,對於MySQL來說存儲引擎是可插拔的。
常見的還有什麼MyISAM、NDB、Memory等等。
嗯,你說的沒錯!那如果我讓你寫一個MySQL的Server層。
你有什麼思路嗎?說說看!
我…..
有思路,下面我用大白話簡單描述一下:
你知道的!MySQL被吹的再神,本質上不過是個軟件而已,而且Server層的功能相對來說比較簡單,主要就是接受客戶端的連接,拿到網絡包中的SQL語句,然後處理……
並且它是單進程多線程的軟件,通常會佔用3306端口啟動,那我完全可以一比一寫出一個MySQL Server層嘛!
比如我可以用熟悉的編程語言,TCP編程,寫個TCP – Server端,監聽3306端口啟動。然後從接收到的數據包中取出數據,按照MySQL協議解析數據,得到SQL語句。再處理SQL語句就是了!
嗯!(我猜這傢伙肯定對某個數據庫中間件特別熟悉)
你整體的思路是沒問題的!
回到正題,繼續說update sql如何被處理。
好,我們的應用程序把SQL發送給Server層後,SQL會陸續被分析器、優化器、執行器處理。
另外在圖中你能看到:查詢緩存。這個查詢緩存由Server層維護,它設計的初衷就是在內存中暫存原來查詢的結果。以便下次查詢時可以快速得到結果^_^
但是它有個缺點就是當有對該表的更新操作時,該表的查詢緩存會被廢棄。所以MySQL8中將查詢緩存砍掉了。
嗯,繼續。
嗯嗯,那我繼續往下說。
分析器的作用:對SQL進行語法、詞法上的分析。
優化器的作用:生成執行計劃、選擇索引。
執行器的作用:操作執行引擎,獲取SQL的執行結果。
嗯,剛才你還說你可以寫個MySQL的Server層,那我現在就讓你實現這個分析器!
task is cheap,show me the code!
,可以下看面的Case。
好,這個話題過
。
你繼續往下說。
我們的update sql經過server層的分析檢測之後,最終由執行器交由存儲引擎執行。
因為InnoDB是支持事務的,而我們現在是update類型的SQL,所以會被放在一個單獨的事務中去執行。
為了提供事務回滾的能力,於是有了上圖中的第5步,InnoDB存儲引擎會先寫undo log。
寫完undo log之後,整體的執行流程會來到圖中的第6步。
在BufferPool緩存池中對內存中的數據進行update。
Buffer Pool緩存池?那我得問下
這個Buffer Pool緩存池是啥?
另外我看你上圖中的Server層也有一個查詢緩存呀,它和BufferPool緩存池啥區別?
嗯,是這樣的。 首先我們都知道,MySQL是支持持久化的,數據最終都落在磁盤上。
但是如果所有的update sql 都直接、大量、頻繁的進行IO磁盤操作,會導致MySQL整體的性能極具下降。
現在MySQL實現方式是:它在內存中對數據進行CRUD,所以在圖中可以看到,BufferPool中的數據是從磁盤上讀進去的。
在內存中CRUD就能獲得最大的性能。後續再通過一定的機制將數據刷新回磁盤中。
小夥子可以!繼續說!
當update sql修改完內存中的數據後,接下來就是提交事務了。提交事務的方式一般都是兩階段提交。
也就是:
1、先寫redo log(prepare)
2、寫binlog
3、寫redo log (commit)
這些日誌後續也都會有一定的機制控制把它們持久化到磁盤中。
那你說一下redo log、bin log分別給了MySQL什麼能力吧
記錄binlog可以使MySQL就擁有:搭建集群、數據備份、數據恢復、審計的能力啊
寫redolog後MySQL就擁有了崩潰恢復的能力。
嗯,那你是怎麼理解這個binlog的數據恢復和redolog的崩潰恢復的呢?
binlog 有redolog 崩潰恢復的能力嘛?
嗯~,我是這樣理解的:binlog由MySQL的上層也就是Server層記錄。
可以看下這張圖:截自部分binlog
可以看到binlog中記錄的是sql語句,記錄這你對哪張表的id=xx的行做了什麼樣的修改。
像數據表啊、行啊這都是一些只存在於邏輯上概念。
而redolog中記錄的是物理層面的概念。比如redo log中會記錄你對xxx表空間的XXX數據頁xxx偏移量的地方做了XXX更新。
所以說,binlog的數據恢復和redo log的崩潰恢復其實是發生在兩個層面的,完全是兩碼事的!
就像是上圖那樣,binlog的中不是記錄著SQL嗎?所以可以把藉助binlog的實現的數據恢復理解成回放binlog中的SQL。
而redolog的崩潰恢復指的是當MySQL出現異常Crash重啟後,將內存中數據恢復成崩潰前的臟數據
嗯!了解,整體上看你的回答的還可以!
我沒有問題了,你還有什麼想問我的嗎?
沒有問題了,感謝大佬百忙抽空來給我面試!
哈哈,客氣!你應該會進入下一面的。好好準備,期待你下一面優秀的表現
推薦閱讀
- MySQL的修仙之路,圖文談談如何學MySQL、如何進階!(已發佈)
- 面前突擊!33道數據庫高頻面試題,你值得擁有!(已發佈)
- 大家常說的基數是什麼?(已發佈)
- 講講什麼是慢查!如何監控?如何排查?(已發佈)
- 對NotNull字段插入Null值有啥現象?(已發佈)
- 能談談 date、datetime、time、timestamp、year的區別嗎?(已發佈)
- 了解數據庫的查詢緩存和BufferPool嗎?談談看!(已發佈)
- 你知道數據庫緩衝池中的LRU-List嗎?(已發佈)
- 談談數據庫緩衝池中的Free-List?(已發佈)
- 談談數據庫緩衝池中的Flush-List?(已發佈)
- 了解臟頁刷回磁盤的時機嗎?(已發佈)
- 用十一張圖講清楚,當你CRUD時BufferPool中發生了什麼!以及BufferPool的優化!(已發佈)
- 聽說過表空間沒?什麼是表空間?什麼是數據表?(已發佈)
- 談談MySQL的:數據區、數據段、數據頁、數據頁究竟長什麼樣?了解數據頁分裂嗎?談談看!(已發佈)
- 談談MySQL的行記錄是什麼?長啥樣?(已發佈)
- 了解MySQL的行溢出機制嗎?(已發佈)
- 說說fsync這個系統調用吧! (已發佈)
- 簡述undo log、truncate、以及undo log如何幫你回滾事物! (已發佈)
- 我勸!這位年輕人不講MVCC,耗子尾汁! (已發佈)
- MySQL的崩潰恢復到底是怎麼回事? (已發佈)
- MySQL的binlog有啥用?誰寫的?在哪裡?怎麼配置 (已發佈)
- MySQL的bin log的寫入機制 (已發佈)
- 刪庫後!除了跑路還能幹什麼?(已發佈)
- 自導自演的面試現場,趣學數據庫的10種文件(已發佈)
最後,歡迎關注白日夢的公號哦~
換一種寫作風格,自導自演面試現場!感覺這樣還是比較有趣的,歡迎大家訂閱我的MySQL專題,公眾號首發!持續更新中~