全网第一份 | Flink学习面试灵魂40问,看看你能答上来几个?
- 2019 年 10 月 4 日
- 筆記
来源:王知无
作者:王知无
By 暴走大数据
场景描述:这是一份Flink学习面试指北。看看你能通过这?
关键词:Flink 学习 面试
《大数据技术与架构》和《暴走大数据》读者拥有本文的优先阅读权。
转载请联系作者本人。
答案将在下期给出。
概念和基础篇
- 简单介绍一下Flink
- Flink相比传统的Spark Streaming有什么区别?和Spark中的structured streaming 相比呢?Flink相比ss和storm有什么优势?
- Flink的组件栈是怎么样的?
- Flink的基础编程模型了解吗?
- 说说Flink架构中的角色和作用?
- 说说Flink中常用的算子?用过哪些?
- Flink中的分区策略有哪几种?
- Flink的并行度有了解吗?Flink中设置并行度需要注意什么?
- Flink支持哪几种重启策略?分别如何配置?
- Flink的分布式缓存有什么作用?如何使用?
- Flink中的广播变量,使用广播变量需要注意什么事项?
- Flink中对窗口的支持包括哪几种?说说他们的使用场景
- Flink 中的 State Backends是什么?有什么作用?分成哪几类?说说他们各自的优缺点?
- Flink中的时间种类有哪些?各自介绍一下?
- WaterMark是什么?是用来解决什么问题?如何生成水印?水印的原理是什么?
- Flink的table和SQL熟悉吗?Table API和SQL中TableEnvironment这个类有什么作用?
- Flink如何实现SQL解析的呢?
进阶篇
- Flink是如何做到批处理与流处理统一的?
- Flink中的数据传输模式是怎么样的?
- Flink的容错机制知道吗?
- Flink中的分布式快照机制是怎么样的?
- Flink是如何实现Exactly-once的?
- Flink的Kafka-connector是如何做到向下兼容的呢?
- Flink中的内存管理是如何做的?
- Flink中的序列化是如何做的?
- Flink中的RPC框架选型是怎么样的?
- Flink在使用Window时出现数据倾斜,你有什么解决办法?
- Flink SQL在使用Groupby时出现热点数据,如何处理?
- 现在我有Flink任务,delay极高,请问你有什么调优策略?
- Flink是如何处理反压的?和Spark有什么区别?Storm呢?
- Operator Chains(算子链)这个概念你了解吗?Flink是如何优化的?什么情况下Operator才会chain在一起?
源码篇
- 讲讲一个Flink job提交的整个流程吗?
- 讲讲一个Flink job调度和执行的流程吗?
- Flink所谓"三层图"结构是哪几个"图"?它们之间是什么关系?他们之间是如何转化的?
- JobManger和TaskManager分别在集群中扮演了什么角色,说说它们都做了些什么?
- 简单说说Flink数据的抽象和数据的交换过程
- Flink的分布式快照机制是如何实现的?
- Flink的反压是如何实现的?
- 说说FlinkSQL是如何转化的?了解逻辑计划和和物理计划吗?FlinkSQL的维表JOIN是如何做的?了解Async IO吗?解决了什么问题?