全網第一份 | Flink學習面試靈魂40問,看看你能答上來幾個?

  • 2019 年 10 月 4 日
  • 筆記

來源:王知無

作者:王知無

By 暴走大數據

場景描述:這是一份Flink學習面試指北。看看你能通過這?

關鍵詞:Flink 學習 面試

《大數據技術與架構》和《暴走大數據》讀者擁有本文的優先閱讀權。

轉載請聯繫作者本人。

答案將在下期給出。

概念和基礎篇

  • 簡單介紹一下Flink
  • Flink相比傳統的Spark Streaming有什麼區別?和Spark中的structured streaming 相比呢?Flink相比ss和storm有什麼優勢?
  • Flink的組件棧是怎麼樣的?
  • Flink的基礎編程模型了解嗎?
  • 說說Flink架構中的角色和作用?
  • 說說Flink中常用的運算元?用過哪些?
  • Flink中的分區策略有哪幾種?
  • Flink的並行度有了解嗎?Flink中設置並行度需要注意什麼?
  • Flink支援哪幾種重啟策略?分別如何配置?
  • Flink的分散式快取有什麼作用?如何使用?
  • Flink中的廣播變數,使用廣播變數需要注意什麼事項?
  • Flink中對窗口的支援包括哪幾種?說說他們的使用場景
  • Flink 中的 State Backends是什麼?有什麼作用?分成哪幾類?說說他們各自的優缺點?
  • Flink中的時間種類有哪些?各自介紹一下?
  • WaterMark是什麼?是用來解決什麼問題?如何生成水印?水印的原理是什麼?
  • Flink的table和SQL熟悉嗎?Table API和SQL中TableEnvironment這個類有什麼作用?
  • Flink如何實現SQL解析的呢?

進階篇

  • Flink是如何做到批處理與流處理統一的?
  • Flink中的數據傳輸模式是怎麼樣的?
  • Flink的容錯機制知道嗎?
  • Flink中的分散式快照機制是怎麼樣的?
  • Flink是如何實現Exactly-once的?
  • Flink的Kafka-connector是如何做到向下兼容的呢?
  • Flink中的記憶體管理是如何做的?
  • Flink中的序列化是如何做的?
  • Flink中的RPC框架選型是怎麼樣的?
  • Flink在使用Window時出現數據傾斜,你有什麼解決辦法?
  • Flink SQL在使用Groupby時出現熱點數據,如何處理?
  • 現在我有Flink任務,delay極高,請問你有什麼調優策略?
  • Flink是如何處理反壓的?和Spark有什麼區別?Storm呢?
  • Operator Chains(運算元鏈)這個概念你了解嗎?Flink是如何優化的?什麼情況下Operator才會chain在一起?

源碼篇

  • 講講一個Flink job提交的整個流程嗎?
  • 講講一個Flink job調度和執行的流程嗎?
  • Flink所謂"三層圖"結構是哪幾個"圖"?它們之間是什麼關係?他們之間是如何轉化的?
  • JobManger和TaskManager分別在集群中扮演了什麼角色,說說它們都做了些什麼?
  • 簡單說說Flink數據的抽象和數據的交換過程
  • Flink的分散式快照機制是如何實現的?
  • Flink的反壓是如何實現的?
  • 說說FlinkSQL是如何轉化的?了解邏輯計劃和和物理計劃嗎?FlinkSQL的維表JOIN是如何做的?了解Async IO嗎?解決了什麼問題?