全網第一份 | Flink學習面試靈魂40問,看看你能答上來幾個?
- 2019 年 10 月 4 日
- 筆記
來源:王知無
作者:王知無
By 暴走大數據
場景描述:這是一份Flink學習面試指北。看看你能通過這?
關鍵詞:Flink 學習 面試
《大數據技術與架構》和《暴走大數據》讀者擁有本文的優先閱讀權。
轉載請聯繫作者本人。
答案將在下期給出。
概念和基礎篇
- 簡單介紹一下Flink
- Flink相比傳統的Spark Streaming有什麼區別?和Spark中的structured streaming 相比呢?Flink相比ss和storm有什麼優勢?
- Flink的組件棧是怎麼樣的?
- Flink的基礎編程模型了解嗎?
- 說說Flink架構中的角色和作用?
- 說說Flink中常用的運算元?用過哪些?
- Flink中的分區策略有哪幾種?
- Flink的並行度有了解嗎?Flink中設置並行度需要注意什麼?
- Flink支援哪幾種重啟策略?分別如何配置?
- Flink的分散式快取有什麼作用?如何使用?
- Flink中的廣播變數,使用廣播變數需要注意什麼事項?
- Flink中對窗口的支援包括哪幾種?說說他們的使用場景
- Flink 中的 State Backends是什麼?有什麼作用?分成哪幾類?說說他們各自的優缺點?
- Flink中的時間種類有哪些?各自介紹一下?
- WaterMark是什麼?是用來解決什麼問題?如何生成水印?水印的原理是什麼?
- Flink的table和SQL熟悉嗎?Table API和SQL中TableEnvironment這個類有什麼作用?
- Flink如何實現SQL解析的呢?
進階篇
- Flink是如何做到批處理與流處理統一的?
- Flink中的數據傳輸模式是怎麼樣的?
- Flink的容錯機制知道嗎?
- Flink中的分散式快照機制是怎麼樣的?
- Flink是如何實現Exactly-once的?
- Flink的Kafka-connector是如何做到向下兼容的呢?
- Flink中的記憶體管理是如何做的?
- Flink中的序列化是如何做的?
- Flink中的RPC框架選型是怎麼樣的?
- Flink在使用Window時出現數據傾斜,你有什麼解決辦法?
- Flink SQL在使用Groupby時出現熱點數據,如何處理?
- 現在我有Flink任務,delay極高,請問你有什麼調優策略?
- Flink是如何處理反壓的?和Spark有什麼區別?Storm呢?
- Operator Chains(運算元鏈)這個概念你了解嗎?Flink是如何優化的?什麼情況下Operator才會chain在一起?
源碼篇
- 講講一個Flink job提交的整個流程嗎?
- 講講一個Flink job調度和執行的流程嗎?
- Flink所謂"三層圖"結構是哪幾個"圖"?它們之間是什麼關係?他們之間是如何轉化的?
- JobManger和TaskManager分別在集群中扮演了什麼角色,說說它們都做了些什麼?
- 簡單說說Flink數據的抽象和數據的交換過程
- Flink的分散式快照機制是如何實現的?
- Flink的反壓是如何實現的?
- 說說FlinkSQL是如何轉化的?了解邏輯計劃和和物理計劃嗎?FlinkSQL的維表JOIN是如何做的?了解Async IO嗎?解決了什麼問題?