ShardingSphere數據分片

2022 年 7 月 25 日
筆記

碼農在囧途

堅持是一件比較難的事，堅持並不是自欺欺人的一種自我麻痹和安慰，也不是做給被人的，我覺得，堅持的本質並沒有帶著過多的功利主義，如果滿是功利主義，那麼這個堅持並不會長久，也不會有好的收穫，堅持應該帶著熱愛，帶著思想，把它當成習慣，但是並不是內卷，而是一種發自內心的喜歡和平實！希望我們都有自己的堅持，堅持寫一篇文章，堅持愛一個人，堅持讀一本書，堅持走向遠方！

前言

上一篇我們說了ShardingSphere的讀寫分離，使用讀寫分離能夠減輕單庫的讀寫操作，從而提升資料庫的吞吐量，但是當資料庫中表的數據量到達一定數量時，我們可能就會需要進行分片了，
分片又分為垂直分片和水平分片，下面我們對二者進行簡單的分析。

垂直分片

我們的一個資料庫中通常是有很多數據表的，不過可能由於我們的分類不到位，就會出現澇的澇死旱的旱死的局面，比如某些數據表的讀寫操作十分頻繁，而我的這個庫中大量的集中了這種
讀寫操作頻繁的表，那麼整體的吞吐量就會降低，而某個庫中又集中了讀寫不頻繁的表，吞吐量十分的高(但是好像沒什麼卵用)，所以我們應該合理的分配，以保證整理的吞吐量達到最大值，
下圖將數據表各分到了一個資料庫中。

不過垂直分片不能從根本上解決讀寫瓶頸，因為不管你再怎麼分，所有的數據始終都集中在一張表裡面，就算資料庫的性能再好，也解決不了這個問題。所以我們需要進行
更加細粒度的劃分，下面我們來講解水平分片。

水平分片

水平分片又可以叫做橫向拆分，就是將一張大表拆分為若干張小表，比如我一張表中有1億條數據，那麼我拆分為10張表，每張表中存1000萬條數據，那麼效率就會變高，
還有些數據需要進行分類和歸檔，那麼我們也需要進行分表，之前我們系統中一個表用來存儲文檔資訊，有十多年因為數據量十分龐大，在業務中需要對文檔進行排序等操作，本來查詢就比較
耗時了，再加上需要進行邏輯上的處理，所以就更加耗時，於是就進行了分表，將每一年的數據存進一個表，這樣就提高了查詢效率，並且更加容易對數據進行追蹤和管理，如下就是水平
分片的圖例。

ShardingSphere數據分片實戰

使用ShardingSphere數據分片，我們只需通過簡單的配置就能實現，ShardingSphere幫我們屏蔽了底層邏輯，我們也可通過ShardingSphere預留的
介面和SPI進行擴展我們的需求，比如可以實現我們自己的分片演算法，主鍵生成策略等等。

下面演示將文檔按照年份進行分表，將文檔數據分表至2013年至2022年來存，一般我們的配置文件都是配置在nacos上面，所以能夠靈活的進行配置，
當到了2023年，我們可以添加一個2023年的表，改下nacos的配置，當然，一般會先預留出數據表，nacos上面也留出空間，我們的是預留到2032年，
留出了10年。

yml文件

我們重點關注下面的一些配置，actual-data-nodes代表進行分片的表，使用表達式，document.document_$->{2013..2022}代表document資料庫
下面的document_前綴的表進行分片，如document_2022，document_2021，{2013..2022}代表2013到2022這個區間，sharding-column是分片列，
是我們數據表中的某個欄位，就是根據它來進行分片，sharding-algorithms是分片演算法，我們可以通過SPI來實現自己的分片演算法，介面是StandardShardingAlgorithm，
如下我們使用的是INLINE基於行表達式的分片演算法，algorithm-expression是分片表達式，ShardingSphere底層會進行解析表達式，然後分片到對應的數據表上面，
我們的表達式是document_$->{year}，也就是根據年進行分片，當然，我們可以根據自己的需求去寫表達式，比如根據主鍵取模進行分片等，需要根據我們的實際場景去做，
key-generate-strategy是主鍵生成策略，ShardingSphere支援自定義主鍵生成策略，我們只需要通過SPI就可以實現，介面是KeyGenerateAlgorithm，已經
實現了UUID和snowflake雪花演算法等主鍵生成策略。

spring:
  shardingsphere:
    mode:
      type: Standalone
      repository:
        type: File
      overwrite: true
    datasource:
      names: document
      document:
        jdbc-url: jdbc:mysql://localhost:3306/document?serverTimezone=UTC&useSSL=false&useUnicode=true&characterEncoding=UTF-8
        type: com.zaxxer.hikari.HikariDataSource
        driver-class-name: com.mysql.jdbc.Driver
        username: root
        password: qwer123@
    rules:
      sharding:
        tables:
          document:
            actual-data-nodes: document.document_$->{2013..2022}
            table-strategy:
              standard:
                sharding-column: year #分片列
                sharding-algorithm-name: document-inline # 分片演算法名稱
            key-generate-strategy:
              column: id # 主鍵列
              key-generator-name: timestamp #主鍵生成演算法
        sharding-algorithms: #分片演算法
          document-inline:
            type: INLINE
            props:
              algorithm-expression: document_$->{year}
        key-generators:
          timestamp:
            type: SNOWFLAKE

測試數據數據分片

虛幻插入十次，每次都插入2013年到2022年的數據。

void addDocSliceYear(){
    for (int i = 0; i < 10; i++) {
        for (int year = 2013; year <= 2022; year++) {
            Document document = new Document()
                .setDocumentName("document year【" + year + "】")
                .setDocumentDetail("year【" + year + "】")
                .setYear(year);
            documentService.save(document);
        }
    }
}

我們可以看出，數據分片成功，我們看一下分片的數據怎麼查詢的（此處只是單表查詢），我們看一下ShardingSphere-SQL輸出的sql語句

SELECT  id,document_name,document_detail,year  FROM document_2013 
UNION ALL SELECT  id,document_name,document_detail,year  FROM document_2014 
UNION ALL SELECT  id,document_name,document_detail,year  FROM document_2015 
UNION ALL SELECT  id,document_name,document_detail,year  FROM document_2016 
UNION ALL SELECT  id,document_name,document_detail,year  FROM document_2017 
UNION ALL SELECT  id,document_name,document_detail,year  FROM document_2018 
UNION ALL SELECT  id,document_name,document_detail,year  FROM document_2019 
UNION ALL SELECT  id,document_name,document_detail,year  FROM document_2020 
UNION ALL SELECT  id,document_name,document_detail,year  FROM document_2021 
UNION ALL SELECT  id,document_name,document_detail,year  FROM document_2022

從控制台列印的SQL語句中看出，ShardingSphere分片查詢使用的是UNION ALL，UNION ALL實現把前後兩個SELECT集合的數據聯合起來，組成一個結果集查詢輸出，
聯合查詢需要每個表中的的欄位相同，欄位類型相同，數量相同，這也是分片的基本要求。

上面我們只演示了單表的數據分片查詢，如果是多表查詢，我們需要配置binding-tables綁定表，這樣能夠減少查詢的笛卡爾積，從而提升查詢效率，我們就不做
詳細的介紹，可去官網自己查看。

分片演算法

ShardingSphere的分片演算法有多種，我們也可以自己實現一套分片演算法，通過SPI，分片演算法的頂層介面是ShardingAlgorithm，目前實現了多種演算法。

BoundaryBasedRangeShardingAlgorithm: 基於分片邊界的範圍分片演算法

VolumeBasedRangeShardingAlgorithm: 基於分片容量的範圍分片演算法

ComplexInlineShardingAlgorithm: 基於行表達式的複合分片演算法

AutoIntervalShardingAlgorithm: 基於可變時間範圍的分片演算法

ClassBasedShardingAlgorithm: 基於自定義類的分片演算法

HintInlineShardingAlgorithm: 基於行表達式的 Hint 分片演算法

IntervalShardingAlgorithm: 基於固定時間範圍的分片演算法

HashModShardingAlgorithm: 基於哈希取模的分片演算法

InlineShardingAlgorithm: 基於行表達式的分片演算法

ModShardingAlgorithm: 基於取模的分片演算法

CosIdModShardingAlgorithm: 基於 CosId 的取模分片演算法

CosIdIntervalShardingAlgorithm: 基於 CosId 的固定時間範圍的分片演算法

CosIdSnowflakeIntervalShardingAlgorithm: 基於 CosId 的雪花ID固定時間範圍的分片演算法

分散式主鍵生成演算法

ShardingSphere也可以自定義實現主鍵生成策略，通過SPI，頂層介面為KeyGenerateAlgorithm，目前實現的演算法有。

SnowflakeKeyGenerateAlgorithm 基於雪花演算法的分散式主鍵生成演算法

UUIDKeyGenerateAlgorithm: 基於 UUID 的分散式主鍵生成演算法

CosIdKeyGenerateAlgorithm: 基於 CosId 的分散式主鍵生成演算法

CosIdSnowflakeKeyGenerateAlgorithm: 基於 CosId 的雪花演算法分散式主鍵生成演算法

NanoIdKeyGenerateAlgorithm: 基於 NanoId 的分散式主鍵生成演算法

總結

ShardingSphere能夠方便的實現數據分片，但是數據分片本身就是一件迫不得已的事情，它會是我們的業務變得更加的複雜，在設計的時候需要經過嚴格的考量後再進行數據分片，防止出現一些不必要的麻煩。

關於ShardingSphere的數據分片，我們就說到這裡，感謝你的觀看，我們下期再見。

ShardingSphere數據分片

碼農在囧途

前言

垂直分片

水平分片

ShardingSphere數據分片實戰

yml文件

測試數據數據分片

分片演算法

分散式主鍵生成演算法

總結

VirMach 便宜 VPS

QNews

ShardingSphere數據分片

碼農在囧途

前言

垂直分片

水平分片

ShardingSphere數據分片實戰

yml文件

測試數據數據分片

分片演算法

分散式主鍵生成演算法

總結

分享此文：

Related Posts

如何處理error message Invalid parametertype used at function XXXX

LeetCode 33，在不滿足二分的數組內使用二分的方法

vue2升級vue3：Vue Demij打通vue2與vue3壁壘，構建通用組件

國家雲正式上線：中國電信牽頭 多家央企參與組建

VirMach 便宜 VPS

QNews

熱門文章

熱門搜尋

國家雲正式上線：中國電信牽頭多家央企參與組建