一站式Flink&Spark平台解決方案——StreamX

大家好,我是獨孤風。今天為大家推薦的是一個完全開源的項目StreamX。該項目的發起者Ben也是我的好朋友。

****什麼是StreamX,StreamX 是Flink & Spark極速開發腳手架,流批一體一站式大數據平台。 自2021年3月開源以來,貢獻者已累計發展到10多位。

隨着Flink&Spark生態的不斷完善,越來越多的企業選擇這兩款組件,或者其中之一作為離線&實時的大數據開發工具,但是在使用他們進行大數據的開發中我們會遇到一些問題,比如:

  1. 任務運行監控怎麼處理?
  2. 使用Cluster模式還是Nodeport暴露端口訪問Web UI?
  3. 提交任務能否簡化打包鏡像的流程?
  4. 如何減少開發壓力?

而StreamX就是專為解決這些問題而出現的,其提供了如下的一些功能:

  • 開發腳手架
  • Kubernetes部署模式支持
  • YARN-Application部署模式支持
  • 多版本Flink支持(1.12.x, 1.13.x, 1.14.x )
  • 一系列開箱即用的Connectors
  • 支持項目編譯功能(CICD/maven編譯)
  • 快捷的日常操作(任務啟動、停止、savepoint)
  • 支持Notebook(在線任務開發)
  • 在線參數配置
  • 項目配置和依賴版本化管理
  • 在線管理依賴(maven pom)和自定義jar
  • 自定義 udf、連接器等支持
  • Flink SQL WebIDE

有的同學可能會使用Zeppelin比較多,兩者是有一定區別的,側重點不同。未來也會寫文做一下兩者的對比。

StreamX近期也發佈了最新的版本StreamX 1.2.0

在最新的版本中支持了以下功能:

  • 與 Hadoop 解耦, 平台在啟動時不在強制依賴 Hadoop 環境
  • 較完整的支持了 Kubernetes 部署模式(Native Application/Native Session)
  • Kubernetes 部署模式下, 任務的狀態追蹤監控
  • 支持自動 build/push 鏡像
  • Flink 最新1.14.0 支持, 目前已經支持 Flink 1.12.x / 1.13.x / 1.14.0
  • 新增打包機模塊,任務打包 fat-jar 更方便

在2021年11月18日,StreamX 也成功的入選了開源中國的2021年度最有價值開源項目。

未來的StreamX也進行着與doris,dolphinscheduler等整合的計劃,也會繼續增強StreamX在Flink流上的開發部署能力與運行監控能力,努力把StreamX打造成一個功能完善的流數據 DevOps。

StreamX是一個完全由國人發起的開源項目。也歡迎大家聯繫我們,加入到開源項目中來,為中國開源崛起獻上一份自己的力量,未來共同向著成為Apache頂級項目而努力。

Streamx 官網:

//streamxhub.com

Streamx Github:

//github.com/streamxhub/streamx

Streamx Gitee:

//gitee.com/streamxhub/streamx

on K8s 部署:

//www.streamxhub.com/zh/doc/flink-k8s/1-deployment