數據庫ToB市場的幾點觀察
- 2019 年 11 月 25 日
- 筆記

近期連續參加了多場數據庫技術會議,針對數據庫ToB市場的最新變化,自己的一點觀察。以下觀點僅針對偏重傳統企業,互聯網企業差異性較大。
1. 傳統企業數據庫問題
1). 新環境的變化
在談傳統企業數據庫轉型之前,先來看看相較於過去,傳統企業的數據庫特點的一些變化。這些也正是促進傳統企業積極轉型的主要因素。
- 數據規模大 ✦ 隨着企業愈發重視數據使用,越來越多的內外部數據被利用起來。 ✦ 伴隨着企業數據化轉型,內部的大量數據被整合挖掘出來。 ✦ 隨着企業的業務發展(特別是C端),大量數據被收集利用起來。 ✦ 隨着物聯網、大數據類應用的逐步成熟,數據規模也不斷增大。 ✦ 中台」模式的興起,也對數據的存儲、計算在規模上提出了更高的要求。
- 並發數高 ✦ 和傳統業務對比,新型業務(特別是C端),訪問用戶數往往很大。 ✦ 隨着微服務的架構的興起,很多傳統企業也面臨微服務化改造,其對數據庫端的影響往往就是並發訪問數據的增加。
- 數據特徵多樣 企業內部的」有價值」數據,不再僅僅限於結構化數據,大量半結構化(如日誌)、非結構化(音視頻)等逐步被挖掘利用起來。因此,」多模」類需求也逐步被提出。
- 使用方式融合 與過去傳統的TP+AP,非常清晰的數據分層使用不同,現在對數據的使用方式更加靈活,融合方案成為未來的一種趨勢。因此可看到HTAP、流式處理等,紛紛登場。
- 自主可控要求 伴隨着內外部環境的變化,近些年來國家已多次從政策層面明確提出了對基礎設施的自主可控要求。特別是針對金融、通訊等,涉及國計民生的行業領域,更是提出了強制性規定。這些也正倒逼企業,不得不將基礎平台的轉型問題提上議事日程。
2). 傳統企業的出路
- 全自主(互聯網路線) 作為技術的「先行者」,互聯網企業往往站在技術的前沿。上面這些新環境的變化,互聯網企業早些年也都已遇到過。很多互聯網公司(特別是頭部企業),經過多年的積累,往往已經可以很好地解決了上述的問題,並沉澱了一整套成熟的技術及人員。但與互聯網不同,很多傳統企業無論是在技術積累、人才貯備,還是風險防範等均有不足。對於某些巨頭公司,尚可通過短期內加大技術投入,快速補齊短板;但對更多傳統企業來講,還不具備這個能力。
- 無自主(「雲」路線) 隨着雲技術的成熟,上雲似乎是某些企業技術轉型的一條「捷徑」。受限於中國的國情特點,雲技術的私有化部署在中國仍然有較大市場。當然,雲路線存在廠商綁定及技術改造等問題,更多是需要在思想層面先行轉型。由此,混合雲、多雲管理,成為當前的一些熱點。
- 混合(商業+自主) 部分沿用商業方案,部分自主完成;這類混合方案是大部分企業比較務實的一種選擇。一方面,部分沿用商業方案,可降低轉型風險,保證業務穩定;具體操作上,可選擇逐步使用多廠商、國產廠商等代替依賴單一廠商、國外廠商的情況。另一方面,部分自主,即可降低對商業的依賴,又可以培養企業自主技術能力。
- 個例(大數據路線) 對於某些數據使用場景,是可以通過大數據技術進行解決的。但對傳統企業來講,大數據技術似乎也離之甚遠。一方面,大數據技術本身對於企業的自主技術能力要求較高;另一方面大數據技術缺乏統一標準,技術分化嚴重,企業不得不背負較高的技術壓力。此外,大量企業的傳統業務系統,也需要向大數據棧遷移,而這一生態系統尚不成熟。很多企業自有開發人員或者ISV,還是熟悉SQL+DB的模式。
2. 企業對數據庫的訴求
傳統企業對數據庫要求有其特點,簡單整理下(有前後優先順序)
1). 外在需求
- 服務 傳統企業使用大型商業數據庫多年,已經習慣於這種」交鑰匙」工程。非常看重其完備的服務能力,使得企業可以安心於業務。即使每年付出昂貴的服務費,但企業仍然可以接受。這點也是目前很多國內廠商的短板,要在短時間內建立其等同於國外數十年積累的企業服務能力,不是一朝一夕的功夫。這是需要國內廠商靜下心來,鍛煉內功的。
- 生態 國外大型商業數據庫,不僅其自身功能很強大,其周邊生態也頗為完善。這不僅包括上下游的配套軟件、工具,還包括成熟的架構、設計、開發、運維、測試全棧技術以及積累多年基數很大的技術人才基礎。國內廠商要想短期建立其完整生態,也是比較困難的;目前通用的策略是「兼容」。盡量降低用戶,使用新型數據庫的門檻。
- 自主可控 作為國家的政策要求,對於某些行業自主可控是必須要考慮的。這一點,無疑對國產廠商有很大的優勢。但需要注意的是,對於開源軟件的使用,企業也要注意評估風險。一方面是可能存在的法律風險(畢竟開源協議比較繁雜);另一方面是技術風險,對開源代碼的理解掌握也是需要企業很大投入的。
- 性價比 作為商業行為,價格因素也是企業重點考慮的。這裡需要關注兩點:一是價格本身不僅包括一次性採購,還要計算長期服務的問題;二是對於雲服務,可能短期較少,但需要關注其長期費用。
2). 內在需求
- 可靠性 數據安全,是數據庫技術的底線。保證數據準確、不丟失,是很多企業第一位去考慮的。特別是對於分佈式等新興技術,要更加慎重,仔細評估。
- 可用性 持續可服務,SLA指標在一個較高的水平,也是企業的考察重點。特別是對於核心業務而言,因此可常見的兩地三中心、三地五中心等架構,非常常見。
- 功能 在功能上,應做到盡量完備。特別是對於已經習慣於大型商業數據庫的用戶。視圖、存儲過程、支持複雜SQL等很多備受互聯網摒棄的功能,對傳統企業仍然是必選項。要全部按照互聯網模式改造,其代價往往是無法承擔的。此外,對於一些新型功能,如多模、混合負載等,也是功能上的加分項。
- 擴展性 數據庫產品,應具備較為完善的計算、存儲的擴展能力,來應對企業可能遇到的業務發展或轉型。如果在擴展性上有顯式的瓶頸,也應提前告知用戶。在整個擴展過程中,應做到盡量順滑、風險可控。
- 易用性 盡量降低用戶的使用門檻,一個竅門是向大廠靠近,符合大多數人的傳統習慣。這一點是很多國產廠商,需要重點加強的。
3. 開源方案的利與弊
受到眾多互聯網公司的影響,很多傳統企業對於開源方案也是躍躍欲試。但在選擇之前,也要看到,開源方案並不是免費的「蛋糕」。讓我們來看看,開源方案的利與弊。
1). 「利」的方面
- 價格 這往往是企業,最先看到的一點。開源軟件,可節省大量的商業採購費用。當然,我們這裡要算一筆綜合的經濟賬:
價格=採購成本+維護成本+人員成本+時間成本+機會成本
- 簡單、靈活 相較於商業產品,開源產品往往比較簡單、配置靈活、不依賴於特有硬件等。在滿足企業的技術要求下,這些確實是開源的優勢。
- 可定製 開源的一大特點,就是源碼公開,企業可以根據自身特點進行有針對性的改造。對於企業的某些特殊要求,確實只能通過定製化才能完成。
- 人才+技術 隨着近些年來對開源軟件的使用,開源的人才已相對較多,企業可以較為容易地招聘到人才。且企業大規模使用開源,也可逐步提升企業自主技術水平,有利於企業的長期發展。
2). 「弊」的方面
- 服務 服務,特別是規模化後的服務。開源方案,一般重點着力於核心功能,其周邊功能往往比較薄弱,這對於後期服務很不利。通常企業是依靠自身的人員完成服務。這通常需要一定的投入,且整體服務質量較成熟的商業產品仍有較大差距。這一問題,可通過「開源軟件+商業服務」的模式,或者通過雲服務來提升整體服務水平。
- 產品責任 這就是所謂的「兜底」問題。國內的企業,往往已經習慣於有外部廠商幫助其兜底,盡量規避自身風險。使用開源,難以找到指定的責任方,兜底更無從談起。雖然可依靠某些第三方服務商,但其對開源的掌控能力需要評估。
- 運維複雜度 成熟商業產品,通常經過完備的設計開發、豐富的周邊生態、系統的文檔化及多年的錘鍊積累,其運維複雜度較低,可快速搭建起完善的運維體系。但對於開源而言,需要從頭來做,自己獨立完成整個過程。
- 技術演進路線 開源技術的發展,通常沒有固定的主導方。企業很難把控,開源軟件未來的發展方向。某些企業急需的特性或bug fix,也很難得到及時的響應。企業整體是缺乏把控力的。
- 性能 開源軟件,在一般簡單場景下,其性能不差,甚至好於很多商業產品。但從整體綜合性能來看,特別是在複雜場景下,其性能往往表現不佳。因此,針對開源方案,往往強調前期架構設計很重要,發揮其強點、規避弱點。但這對於傳統企業尤為困難,企業有很多沉重的歷史包袱,很難短時間內完全重構。即使決定重構,也需要逐步摸索,小步迭代。
- 用戶體驗 開源軟件的第一訴求,是功能的實現,其針對用戶體驗往往考慮不多。使用慣商業產品的用戶,需要一個「由奢入儉」的適應過程。
- 企業級特點 企業用戶,對數據庫的使用是有其專有特點。例如:安全審核、數據加密等等。這類功能對於企業很重要,但對其他類用戶相對意義不大。很多開源軟件,不會在這些上大做功夫。