全球共有多少MySQL實例在運行?這裡有一份數據

摘要

Shadowserver Foundation在5月31日發布了一份全網的MySQL掃描報告,共發現了暴露在公網的360萬個MySQL實例。因為這份報告基數夠大,而且資訊也非常完整,從資料庫專業的角度來看,裡面是有很多非常有意思,且可以量化的數據和結論的。之前網上的一些分析都是基於安全形度來分析,這裡我們一起再看看這份報告裡面隱含的一些資料庫資訊吧。

另外,這裡的「暴露在公網」,是指其埠在公網可以被訪問且響應握手資訊,並不是可以被登錄,並沒有什麼安全隱患。原報告的文章鏈接可以在文章結尾處查看。

原文地址:全球共有多少MySQL實例在運行?這裡有一份數據該內容同步發佈於微信公眾號:「雲資料庫技術」,歡迎訂閱,第一時間獲取資訊。

 

概述

該數據由Shadowserver的SCANNING PROJECT收集,總計掃描到537.8萬個打開的3306埠,其中IPv4協議的395.7萬個,IPv6協議142.1萬個。這些埠中回饋了握手資訊的共360萬個,其中IPv4協議的228萬個,IPv6協議134.4萬。

返回握手資訊的360萬實例,因為握手資訊包含了版本等資訊,加上Shadowserver的地域等資訊,就構成了一份較為完整的MySQL實例版本和實例分布數據。

Shadowserver並沒有公布完整的數據詳細資訊,但依舊公布了多個維度的數據供分析。

 

8.0 GA已經四年,但5.7依舊是主流

以IPv4 Top 10的版本來看,當前5.7版本佔比最大,其次為5.6和8.0版本。另外,MariaDB佔比14%,更具體的:

  • MySQL 8.0 GA日期為2018年04月,佔比為8%
  • MySQL 5.7 GA日期為2015年10月,佔比為46.7%
  • MySQL 5.6 GA日期為2013年02月,佔比為30%
  • MariaDB版本佔比為14%,包括了MariaDB 5.5佔比8.1%,其10.1版本佔比6%

可以看到,MySQL 5.7依舊為當前最主流的版本,根據MySQL官方的規劃,該版本可能在明年的10月就會停止對其的擴展支援,可能就不再更新版本。與此同時,MySQL官方還可能會在今年推出新的大版本(可能是9.0或者8.1之類的),加上5.7的維護周期接近尾聲,會較為大量的用戶升級到新版本。

 

全球共有800萬MySQL實例在運行?

根據一些公開數據和部分經驗數據,這裡對全球MySQL運行實例個數做一個預測。

在這份報告中,共探測到約538萬開放的3306埠,其中約360萬返回了握手資訊。那麼,全球一共有多少MySQL在運行呢? 這裡基於以下資訊做一個猜測:

  • 根據帕累托法則,即2/8原則,約僅有20%的因素影響80%的結果
  • 諸如Google、Amazon、微軟、阿里巴巴、騰訊、字節跳動等大型企業保有大量實例,且不可以被掃描
  • 還會有大量實例運行在AWS、Azure、阿里雲、GCP等雲環境的VPC之中,如果沒有開啟公網IP,通常也無法被掃描到,這部分根據一些經驗數據,預計為200萬個
  • 根據IDC數據,全球伺服器2021年出貨量為1350萬台

那麼,掃描到538萬再加上200萬,則有約738萬個”閑散”實例。根據2/8原則,諸如Google、Amazon、阿里巴巴等這些大型企業(非雲部分)中依舊可能保有著20%的實例(738萬為80%部分),也就是約為184.5萬個實例。那麼預計:全球整體MySQL實例數量可能在922萬這樣的數量級。另外,我們再從全球伺服器出貨量角度做一個驗證。根據IDC數據,2021年全球伺服器出貨量約為1350萬台,這裡假設(該假設基於一些歷史的經驗)10台伺服器對應一個資料庫實例,那麼2021年伺服器出貨量就對應了135萬個實例,按照伺服器平均5年折舊計算,總保有則約為675萬個實例,這裡與922萬有一定的偏差。折中取這兩個數據的平均值,所以這裡預測:全球MySQL實例數在800萬左右當然,這只是一個超大顆粒度的、不可驗證的預測,如果有更好的預測模型或者數據支援,歡迎回復公眾號討論。

 

MariaDB在某些細分市場份額很大

從這份數據來看,MariaDB是拿下了非常大的市場的。從IPv4 top 10版本統計資訊來看,MariaDB佔比為14.3%;如果,單從IPv6的統計數據來看,MariaDB佔比為86.2%,實例數量超110萬。

這裡在IPv6環境中,部署量最大的版本為:5.5.5-10.5.12-mariadb-cll-lve,這是一個cPanel在Lightweight Virtual Environment的發行版本,而對應的MariaDB 10.5.12版本為2021年8月發布。從這個點看到,MariaDB是獲得了更多的開源社區的信任,作為其發行版的默認資料庫版本。甚至在一些細分的場景中,MariaDB甚至可以說可能成為了主流。

但,另一方面,根據在中國的實際感受來看,MariaDB的市場現狀並沒有以上數據展示的那麼樂觀,原因如下:

  • 一是MySQL品牌依舊非常強大,雖然安裝的MariaDB,但是實際使用的客戶端依舊可能是mysql命令行,所以,用戶依舊當做MySQL來使用。

  • 另外,目前,大型企業全面使用MariaDB支撐核心業務的公司還比較少,大部分依舊是使用MySQL,並基於MySQL去進行優化,而不是MariaDB。

當然,從這個數據角度來看,MariaDB的這個部署量依舊會給其帶來很多優勢:

  • 提升用戶認知基礎,雖然命令行依舊使用mysql,但是登錄後依舊會看到MariaDB版本號資訊和功能

  • 產品會在各種環境中被使用,對其整體的穩定性會有較大的保障

  • 相比MySQL,MariaDB已經獲得更多Linux發行版的信任,這可能是進一步獲得擴大市場的最重要的機會點之一

 

49%的實例啟用了TLS/SSL加密

從所有IPv4環境的實例數據來看,有49%啟用了TLS/SSL加密。因為MySQL 5.7之後的版本,都已經默認開啟了傳輸加密,這與前面的MySQL 5.7佔比數據是基本吻合的,大部分用戶在使用5.7或8.0的時候,都會使用其默認自帶的加密能力。所以,你的實例開啟了傳輸加密嗎?延伸閱讀:

中國的MySQL實例在全球佔比15.8%

在這份報告中,從IPv4的數據中看到,中國MySQL實例數佔比為15.8%(大陸地區約為13%,香港地區約為2.8%),僅次於美國的32.5%。其次是波蘭、德國、法國、新加坡等地。另外,根據IDC的報告中國伺服器出貨量佔全球比率約為25.3%(2021年,從銷售額角度),所以,中國資料庫的實際部署量可能更大。

 

IPv6在全球普及率都不高,中國更低

從整體數據來看,有握手回饋的掃描中,IPv4的3306共掃描到2,279,908個,IPv6共1,343,993個,在全球角度上,運行在IPv6上的MySQL已經達到了37%。但是,這個數據在中國,僅有0.1%。雖然,資料庫部署並不適合作為IPv6和IPv4的對比,但作為一個參考,可以看到在全球範圍IPv6已經比較高了,但是在中國普及率還非常低。

從這份數據來看,IPv6較高的國家有:美國、荷蘭、新加坡、德國、英國等。

 

這份數據的一些限制

  • 因為報告是通過埠掃描獲得的資訊,所以各個大公司自己內部的伺服器都是不在其中的。所以,實際MySQL裝機量應該遠大於這個量。另外,大公司企業資料庫情況可能與報告有一定的偏差。例如,通常大公司環境中資料庫版本會比較統一,而不會簡單的使用最新版本。

  • 報告中的數據可以看到MariaDB的部署量比想像的要大。猜測的原因可能是,很多Linux發行版本中自帶的倉庫使用的是MariaDB資料庫,這讓MariaDB的裝機量比想像的更大。

  • 另外,報告沒有公布所有的數據,例如版本數據,只有Top 10的版本,佔整體IPv4的比率約為26%,還不是一個完整的數據,可能與整體數據會有一些偏差

     

補充說明
  • MariaDB的握手階段提供的版本資訊與實例中的資訊有一些不同,所以會呈現出比較多的是」5.5.5-10.5.12-mariadb-cll-lve」這樣的版本號,其中10.5.12才是MariaDB正確的版本號;」cll」應該是代表有cPanel編譯提供的發行版(參考);」lve」則可能是」Lightweight Virtual Environment」的縮寫。

  • Shadowserver Foundation是什麼?「Shadowserver是全球領先的惡意活動調查、互聯網安全報告的公益組織,Shadowserver維護著世界上最大的安全資訊存儲庫之一,它存儲了數以萬億計的歷史惡意網路連接,同時Shadowserver每天掃描整個互聯網超過50種協議暴露情況,用於查找可能用於攻擊利用的配置錯誤或存在惡意行為的系統,Shadowserver擁有超過20個監測節點。」

  • Shadowserver還掃描了MongoDB、Redis、SQL Server的情況。MongoDB約為10萬個(101338,參考)、Redis約為2.5萬(參考)、SQL Server約為8.5萬(參考)。如果說,MySQL在很多Linux環境中可能默認安裝,但是這幾個資料庫一般是不會被默認安裝的。

  • 報告中IPv6協議下的MySQL實例數據與實際感受差距非常大,例如在IPv6版本下,MariaDB佔比約為85%(超100萬實例)。在IPv6實例最多的國家是美國、荷蘭、新加坡等來看,這與伺服器出貨量相關數據匹配度非常低。所以,有幾種可能:一個是MariaDB在某個細分的場景下有非常大的優勢,在早期對IPv6支援更好,所以在某些對IPv6有強制要求的地區和國家有更好的市場。

  • 再次聲明這裡的「暴露」在公網,並不是說這些實例不安全,因為這裡的探測不能,也沒有連接上資料庫,而是在連接之前的握手數據交換階段。

 

原始報告鏈接

  • //www.shadowserver.org/news/over-3-6m-exposed-mysql-servers-on-ipv4-and-ipv6/