C# 模式匹配完全指南

2022 年 3 月 4 日
筆記
.NET, .NET Core, c#

前言

自從 2017 年 C# 7.0 版本開始引入聲明模式和常數模式匹配開始，到 2022 年的 C# 11 為止，最後一個板塊列表模式和切片模式匹配也已經補齊，當初計劃的模式匹配內容已經基本全部完成。

C# 在模式匹配方面下一步計劃則是支持活動模式（active pattern），這一部分將在本文最後進行介紹，而在介紹未來的模式匹配計劃之前，本文主題是對截止 C# 11 模式匹配的~~（不）~~完全指南，希望能對各位開發者們提升代碼編寫效率、可讀性和質量有所幫助。

模式匹配

要使用模式匹配，首先要了解什麼是模式。在使用正則表達式匹配字符串時，正則表達式自己就是一個模式，而對字符串使用這段正則表達式進行匹配的過程就是模式匹配。而在代碼中也是同樣的，我們對對象採用某種模式進行匹配的過程就是模式匹配。

C# 11 支持的模式有很多，包含：

聲明模式（declaration pattern）
類型模式（type pattern）
常數模式（constant pattern）
關係模式（relational pattern）
邏輯模式（logical pattern）
屬性模式（property pattern）
位置模式（positional pattern）
var 模式（var pattern）
丟棄模式（discard pattern）
列表模式（list pattern）
切片模式（slice pattern）

而其中，不少模式都支持遞歸，也就意味着可以模式嵌套模式，以此來實現更加強大的匹配功能。

模式匹配可以通過 switch 表達式來使用，也可以在普通的 switch 語句中作為 case 使用，還可以在 if 條件中通過 is 來使用。本文主要在 switch 表達式中使用模式匹配。

那麼接下來就對這些模式進行介紹。

實例：表達式計算器

為了更直觀地介紹模式匹配，我們接下來利用模式匹配來編寫一個表達式計算器。

為了編寫表達式計算器，首先我們需要對表達式進行抽象：

public abstract partial class Expr<T> where T : IBinaryNumber<T>
{
    public abstract T Eval(params (string Name, T Value)[] args);
}

我們用上面這個 Expr<T> 來表示一個表達式，其中 T 是操作數的類型，然後進一步將表達式分為常數表達式 ConstantExpr、參數表達式 ParameterExpr、一元表達式 UnaryExpr、二元表達式 BinaryExpr 和三元表達式 TernaryExpr。最後提供一個 Eval 方法，用來計算表達式的值，該方法可以傳入一個 args 來提供表達式計算所需要的參數。

有了一、二元表達式自然也需要運算符，例如加減乘除等，我們也同時定義 Operator 來表示運算符：

public abstract record Operator
{
    public record UnaryOperator(Operators Operator) : Operator;
    public record BinaryOperator(BinaryOperators Operator) : Operator;
}

然後設置允許的運算符，其中前三個是一元運算符，後面的是二元運算符：

public enum Operators
{
    [Description("~")] Inv, [Description("-")] Min, [Description("!")] LogicalNot,
    [Description("+")] Add, [Description("-")] Sub, [Description("*")] Mul, [Description("/")] Div,
    [Description("&")] And, [Description("|")] Or, [Description("^")] Xor,
    [Description("==")] Eq, [Description("!=")] Ne,
    [Description(">")] Gt, [Description("<")] Lt, [Description(">=")] Ge, [Description("<=")] Le,
    [Description("&&")] LogicalAnd, [Description("||")] LogicalOr,
}

你可以能會好奇對 T 的運算能如何實現邏輯與或非，關於這一點，我們直接使用 0 來代表 false，非 0 代表 true。

接下來就是分別實現各類表達式的時間！

常數表達式

常數表達式很簡單，它保存一個常數值，因此只需要在構造方法中將用戶提供的值存儲下來。它的 Eval 實現也只需要簡單返回存儲的值即可：

public abstract partial class Expr<T> where T : IBinaryNumber<T>
{
    public class ConstantExpr : Expr<T>
    {
        public ConstantExpr(T value) => Value = value;

        public T Value { get; }
        public void Deconstruct(out T value) => value = Value;

        public override T Eval(params (string Name, T Value)[] args) => Value;
    }
}

參數表達式

參數表達式用來定義表達式計算過程中的參數，允許用戶在對表達式執行 Eval 計算結果的時候傳參，因此只需要存儲參數名。它的 Eval 實現需要根據參數名在 args 中找出對應的參數值：

public abstract partial class Expr<T> where T : IBinaryNumber<T>
{
    public class ParameterExpr : Expr<T>
    {
        public ParameterExpr(string name) => Name = name;

        public string Name { get; }
        public void Deconstruct(out string name) => name = Name;

        // 對 args 進行模式匹配
        public override T Eval(params (string Name, T Value)[] args) => args switch
        {
            // 如果 args 有至少一個元素，那我們把第一個元素拿出來存為 (name, value)，
            // 然後判斷 name 是否和本參數表達式中存儲的參數名 Name 相同。
            // 如果相同則返回 value，否則用 args 除去第一個元素剩下的參數繼續匹配。
            [var (name, value), .. var tail] => name == Name ? value : Eval(tail),
            // 如果 args 是空列表，則說明在 args 中沒有找到名字和 Name 相同的參數，拋出異常
            [] => throw new InvalidOperationException($"Expected an argument named {Name}.")
        };
    }
}

模式匹配會從上往下依次進行匹配，直到匹配成功為止。

上面的代碼中你可能會好奇 [var (name, value), .. var tail] 是個什麼模式，這個模式整體看是列表模式，並且列表模式內組合使用聲明模式、位置模式和切片模式。例如：

[]：匹配一個空列表。
[1, _, 3]：匹配一個長度是 3，並且首尾元素分別是 1、3 的列表。其中 _ 是丟棄模式，表示任意元素。
[_, .., 3]：匹配一個末元素是 3，並且 3 不是首元素的列表。其中 .. 是切片模式，表示任意切片。
[1, ..var tail]：匹配一個首元素是 1 的列表，並且將除了首元素之外元素的切片賦值給 tail。其中 var tail 是 var 模式，用於將匹配結果賦值給變量。
[var head, ..var tail]：匹配一個列表，將它第一個元素賦值給 head，剩下元素的切片賦值給 tail，這個切片里可以沒有元素。
[var (name, value), ..var tail]：匹配一個列表，將它第一個元素賦值給 (name, value)，剩下元素的切片賦值給 tail，這個切片里可以沒有元素。其中 (name, value) 是位置模式，用於將第一個元素的解構結果根據位置分別賦值給 name 和 value，也可以寫成 (var name, var value)。

一元表達式

一元表達式用來處理只有一個操作數的計算，例如非、取反等。

public abstract partial class Expr<T> where T : IBinaryNumber<T>
{
    public class UnaryExpr : Expr<T>
    {
        public UnaryExpr(UnaryOperator op, Expr<T> expr) => (Op, Expr) = (op, expr);

        public UnaryOperator Op { get; }
        public Expr<T> Expr { get; }
        public void Deconstruct(out UnaryOperator op, out Expr<T> expr) => (op, expr) = (Op, Expr);

        // 對 Op 進行模式匹配
        public override T Eval(params (string Name, T Value)[] args) => Op switch
        {
            // 如果 Op 是 UnaryOperator，則將其解構結果賦值給 op，然後對 op 進行匹配，op 是一個枚舉，而 .NET 中的枚舉值都是整數
            UnaryOperator(var op) => op switch
            {
                // 如果 op 是 Operators.Inv
                Operators.Inv => ~Expr.Eval(args),
                // 如果 op 是 Operators.Min
                Operators.Min => -Expr.Eval(args),
                // 如果 op 是 Operators.LogicalNot
                Operators.LogicalNot => Expr.Eval(args) == T.Zero ? T.One : T.Zero,
                // 如果 op 的值大於 LogicalNot 或者小於 0，表示不是一元運算符
                > Operators.LogicalNot or < 0 => throw new InvalidOperationException($"Expected an unary operator, but got {op}.")
            },
            // 如果 Op 不是 UnaryOperator
            _ => throw new InvalidOperationException("Expected an unary operator.")
        };
    }
}

上面的代碼中，首先利用了 C# 元組可作為左值的特性，分別使用一行代碼就做完了構造方法和解構方法的賦值：(Op, Expr) = (op, expr) 和 (op, expr) = (Op, Expr)。如果你好奇能否利用這個特性交換多個變量，答案是可以！

在 Eval 中，首先將類型模式、位置模式和聲明模式組合成 UnaryOperator(var op)，表示匹配 UnaryOperator 類型、並且能解構出一個元素的東西，如果匹配則將解構出來的那個元素賦值給 op。

然後我們接着對解構出來的 op 進行匹配，這裡用到了常數模式，例如 Operators.Inv 用來匹配 op 是否是 Operators.Inv。常數模式可以使用各種常數對對象進行匹配。

這裡的 > Operators.LogicalNot 和 < 0 則是關係模式，分別用於匹配大於 Operators.LogicalNot 的值和小於 0 的指。然後利用邏輯模式 or 將兩個模式組合起來表示或的關係。邏輯模式除了 or 之外還有 and 和 not。

由於我們在上面窮舉了枚舉中所有的一元運算符，因此也可以將 > Operators.LogicalNot or < 0 換成丟棄模式 _ 或者 var 模式 var foo，兩者都用來匹配任意的東西，只不過前者匹配到後直接丟棄，而後者聲明了個變量 foo 將匹配到的值放到裏面：

op switch
{
    // ...
    _ => throw new InvalidOperationException($"Expected an unary operator, but got {op}.")
}

或

op switch
{
    // ...
    var foo => throw new InvalidOperationException($"Expected an unary operator, but got {foo}.")
}

二元表達式

二元表達式用來表示操作數有兩個的表達式。有了一元表達式的編寫經驗，二元表達式如法炮製即可。

public abstract partial class Expr<T> where T : IBinaryNumber<T>
{
    public class BinaryExpr : Expr<T>
    {
        public BinaryExpr(BinaryOperator op, Expr<T> left, Expr<T> right) => (Op, Left, Right) = (op, left, right);

        public BinaryOperator Op { get; }
        public Expr<T> Left { get; }
        public Expr<T> Right { get; }
        public void Deconstruct(out BinaryOperator op, out Expr<T> left, out Expr<T> right) => (op, left, right) = (Op, Left, Right);

        public override T Eval(params (string Name, T Value)[] args) => Op switch
        {
            BinaryOperator(var op) => op switch
            {
                Operators.Add => Left.Eval(args) + Right.Eval(args),
                Operators.Sub => Left.Eval(args) - Right.Eval(args),
                Operators.Mul => Left.Eval(args) * Right.Eval(args),
                Operators.Div => Left.Eval(args) / Right.Eval(args),
                Operators.And => Left.Eval(args) & Right.Eval(args),
                Operators.Or => Left.Eval(args) | Right.Eval(args),
                Operators.Xor => Left.Eval(args) ^ Right.Eval(args),
                Operators.Eq => Left.Eval(args) == Right.Eval(args) ? T.One : T.Zero,
                Operators.Ne => Left.Eval(args) != Right.Eval(args) ? T.One : T.Zero,
                Operators.Gt => Left.Eval(args) > Right.Eval(args) ? T.One : T.Zero,
                Operators.Lt => Left.Eval(args) < Right.Eval(args) ? T.One : T.Zero,
                Operators.Ge => Left.Eval(args) >= Right.Eval(args) ? T.One : T.Zero,
                Operators.Le => Left.Eval(args) <= Right.Eval(args) ? T.One : T.Zero,
                Operators.LogicalAnd => Left.Eval(args) == T.Zero || Right.Eval(args) == T.Zero ? T.Zero : T.One,
                Operators.LogicalOr => Left.Eval(args) == T.Zero && Right.Eval(args) == T.Zero ? T.Zero : T.One,
                < Operators.Add or > Operators.LogicalOr => throw new InvalidOperationException($"Unexpected a binary operator, but got {op}.")
            },
            _ => throw new InvalidOperationException("Unexpected a binary operator.")
        };
    }
}

同理，也可以將 < Operators.Add or > Operators.LogicalOr 換成丟棄模式或者 var 模式。

三元表達式

三元表達式包含三個操作數：條件表達式 Cond、為真的表達式 Left、為假的表達式 Right。該表達式中會根據 Cond 是否為真來選擇取 Left 還是 Right，實現起來較為簡單：

public abstract partial class Expr<T> where T : IBinaryNumber<T>
{
    public class TernaryExpr : Expr<T>
    {
        public TernaryExpr(Expr<T> cond, Expr<T> left, Expr<T> right) => (Cond, Left, Right) = (cond, left, right);

        public Expr<T> Cond { get; }
        public Expr<T> Left { get; }
        public Expr<T> Right { get; }
        public void Deconstruct(out Expr<T> cond, out Expr<T> left, out Expr<T> right) => (cond, left, right) = (Cond, Left, Right);

        public override T Eval(params (string Name, T Value)[] args) => Cond.Eval(args) == T.Zero ? Right.Eval(args) : Left.Eval(args);
    }
}

表達式判等

至此為止，我們已經完成了所有的表達式構造、解構和計算的實現。接下來我們為每一個表達式實現判等邏輯，即判斷兩個表達式（字面上）是否相同。

例如 a == b ? 2 : 4 和 a == b ? 2 : 5 不相同，a == b ? 2 : 4 和 c == d ? 2 : 4 不相同，而 a == b ? 2 : 4 和 a == b ? 2 : 4 相同。

為了實現該功能，我們重寫每一個表達式的 Equals 和 GetHashCode 方法。

常數表達式

常數表達式判等只需要判斷常數值是否相等即可：

public override bool Equals(object? obj) => obj is ConstantExpr(var value) && value == Value;
public override int GetHashCode() => Value.GetHashCode();

參數表達式

參數表達式判等只需要判斷參數名是否相等即可：

public override bool Equals(object? obj) => obj is ParameterExpr(var name) && name == Name;
public override int GetHashCode() => Name.GetHashCode();

一元表達式

一元表達式判等，需要判斷被比較的表達式是否是一元表達式，如果也是的話則判斷運算符和操作數是否相等：

public override bool Equals(object? obj) => obj is UnaryExpr({ Operator: var op }, var expr) && (op, expr).Equals((Op.Operator, Expr));
public override int GetHashCode() => (Op, Expr).GetHashCode();

上面的代碼中用到了屬性模式 { Operator: var op }，用來匹配屬性的值，這裡直接組合了聲明模式將屬性 Operator 的值賦值給了 expr。另外，C# 中的元組可以組合起來進行判等操作，因此不需要寫 op.Equals(Op.Operator) && expr.Equals(Expr)，而是可以直接寫 (op, expr).Equals((Op.Operator, Expr))。

二元表達式

和一元表達式差不多，區別在於這次多了一個操作數：

public override string ToString() => $"({Left}) {Op.Operator.GetName()} ({Right})";
public override bool Equals(object? obj) => obj is BinaryExpr({ Operator: var op }, var left, var right) && (op, left, right).Equals((Op.Operator, Left, Right));

三元表達式

和二元表達式差不多，只不過運算符 Op 變成了操作數 Cond：

public override bool Equals(object? obj) => obj is TernaryExpr(var cond, var left, var right) && cond.Equals(Cond) && left.Equals(Left) && right.Equals(Right);
public override int GetHashCode() => (Cond, Left, Right).GetHashCode();

到此為止，我們為所有的表達式都實現了判等。

一些工具方法

我們重載一些 Expr<T> 的運算符方便我們使用：

public static Expr<T> operator ~(Expr<T> operand) => new UnaryExpr(new(Operators.Inv), operand);
public static Expr<T> operator !(Expr<T> operand) => new UnaryExpr(new(Operators.LogicalNot), operand);
public static Expr<T> operator -(Expr<T> operand) => new UnaryExpr(new(Operators.Min), operand);
public static Expr<T> operator +(Expr<T> left, Expr<T> right) => new BinaryExpr(new(Operators.Add), left, right);
public static Expr<T> operator -(Expr<T> left, Expr<T> right) => new BinaryExpr(new(Operators.Sub), left, right);
public static Expr<T> operator *(Expr<T> left, Expr<T> right) => new BinaryExpr(new(Operators.Mul), left, right);
public static Expr<T> operator /(Expr<T> left, Expr<T> right) => new BinaryExpr(new(Operators.Div), left, right);
public static Expr<T> operator &(Expr<T> left, Expr<T> right) => new BinaryExpr(new(Operators.And), left, right);
public static Expr<T> operator |(Expr<T> left, Expr<T> right) => new BinaryExpr(new(Operators.Or), left, right);
public static Expr<T> operator ^(Expr<T> left, Expr<T> right) => new BinaryExpr(new(Operators.Xor), left, right);
public static Expr<T> operator >(Expr<T> left, Expr<T> right) => new BinaryExpr(new(Operators.Gt), left, right);
public static Expr<T> operator <(Expr<T> left, Expr<T> right) => new BinaryExpr(new(Operators.Lt), left, right);
public static Expr<T> operator >=(Expr<T> left, Expr<T> right) => new BinaryExpr(new(Operators.Ge), left, right);
public static Expr<T> operator <=(Expr<T> left, Expr<T> right) => new BinaryExpr(new(Operators.Le), left, right);
public static Expr<T> operator ==(Expr<T> left, Expr<T> right) => new BinaryExpr(new(Operators.Eq), left, right);
public static Expr<T> operator !=(Expr<T> left, Expr<T> right) => new BinaryExpr(new(Operators.Ne), left, right);
public static implicit operator Expr<T>(T value) => new ConstantExpr(value);
public static implicit operator Expr<T>(string name) => new ParameterExpr(name);
public static implicit operator Expr<T>(bool value) => new ConstantExpr(value ? T.One : T.Zero);

public override bool Equals(object? obj) => base.Equals(obj);
public override int GetHashCode() => base.GetHashCode();

由於重載了 == 和 !=，編譯器為了保險起見提示我們重寫 Equals 和 GetHashCode，這裡實際上並不需要重寫，因此直接調用 base 上的方法保持默認行為即可。

然後編寫兩個擴展方法用來方便構造三元表達式，和從 Description 中獲取運算符的名字：

public static class Extensions
{
    public static Expr<T> Switch<T>(this Expr<T> cond, Expr<T> left, Expr<T> right) where T : IBinaryNumber<T> => new Expr<T>.TernaryExpr(cond, left, right);
    public static string? GetName<T>(this T op) where T : Enum => typeof(T).GetMember(op.ToString()).FirstOrDefault()?.GetCustomAttribute<DescriptionAttribute>()?.Description;
}

由於有參數表達式參與時需要我們提前提供參數值才能調用 Eval 進行計算，因此我們寫一個交互式的 Eval 來在計算過程中遇到參數表達式時提示用戶輸入值，起名叫做 InteractiveEval：

public T InteractiveEval()
{
    var names = Array.Empty<string>();
    return Eval(GetArgs(this, ref names, ref names));
}
private static T GetArg(string name, ref string[] names)
{
    Console.Write($"Parameter {name}: ");
    string? str;
    do { str = Console.ReadLine(); }
    while (str is null);
    names = names.Append(name).ToArray();
    return T.Parse(str, NumberStyles.Number, null);
}
private static (string Name, T Value)[] GetArgs(Expr<T> expr, ref string[] assigned, ref string[] filter) => expr switch
{
    TernaryExpr(var cond, var left, var right) => GetArgs(cond, ref assigned, ref assigned).Concat(GetArgs(left, ref assigned,ref assigned)).Concat(GetArgs(right, ref assigned, ref assigned)).ToArray(),
    BinaryExpr(_, var left, var right) => GetArgs(left, ref assigned, ref assigned).Concat(GetArgs(right, ref assigned, refassigned)).ToArray(),
    UnaryExpr(_, var uexpr) => GetArgs(uexpr, ref assigned, ref assigned),
    ParameterExpr(var name) => filter switch
    {
        [var head, ..] when head == name => Array.Empty<(string Name, T Value)>(),
        [_, .. var tail] => GetArgs(expr, ref assigned, ref tail),
        [] => new[] { (name, GetArg(name, ref assigned)) }
    },
    _ => Array.Empty<(string Name, T Value)>()
};

這裡在 GetArgs 方法中，模式 [var head, ..] 後面跟了一個 when head == name，這裡的 when 用來給模式匹配指定額外的條件，僅當條件滿足時才匹配成功，因此 [var head, ..] when head == name 的含義是，匹配至少含有一個元素的列表，並且將頭元素賦值給 head，且僅當 head == name 時匹配才算成功。

最後我們再重寫 ToString 方法方便輸出表達式，就全部大功告成了。

測試

接下來讓我測試測試我們編寫的表達式計算器：

Expr<int> a = 4;
Expr<int> b = -3;
Expr<int> x = "x";
Expr<int> c = !((a + b) * (a - b) > x);
Expr<int> y = "y";
Expr<int> z = "z";
Expr<int> expr = (c.Switch(y, z) - a > x).Switch(z + a, y / b);
Console.WriteLine(expr);
Console.WriteLine(expr.InteractiveEval());

運行後得到輸出：

((((! ((((4) + (-3)) * ((4) - (-3))) > (x))) ? (y) : (z)) - (4)) > (x)) ? ((z) + (4)) : ((y) / (-3))

然後我們給 x、y 和 z 分別設置成 42、27 和 35，即可得到運算結果：

Parameter x: 42
Parameter y: 27
Parameter z: 35
-9

再測測表達式判等邏輯：

Expr<int> expr1, expr2, expr3;
{
    Expr<int> a = 4;
    Expr<int> b = -3;
    Expr<int> x = "x";
    Expr<int> c = !((a + b) * (a - b) > x);
    Expr<int> y = "y";
    Expr<int> z = "z";
    expr1 = (c.Switch(y, z) - a > x).Switch(z + a, y / b);
}

{
    Expr<int> a = 4;
    Expr<int> b = -3;
    Expr<int> x = "x";
    Expr<int> c = !((a + b) * (a - b) > x);
    Expr<int> y = "y";
    Expr<int> z = "z";
    expr2 = (c.Switch(y, z) - a > x).Switch(z + a, y / b);
}

{
    Expr<int> a = 4;
    Expr<int> b = -3;
    Expr<int> x = "x";
    Expr<int> c = !((a + b) * (a - b) > x);
    Expr<int> y = "y";
    Expr<int> w = "w";
    expr3 = (c.Switch(y, w) - a > x).Switch(w + a, y / b);
}

Console.WriteLine(expr1.Equals(expr2));
Console.WriteLine(expr1.Equals(expr3));

得到輸出：

True
False

活動模式

在未來，C# 將會引入活動模式，該模式允許用戶自定義模式匹配的方法，例如：

static bool Even<T>(this T value) where T : IBinaryInteger<T> => value % 2 == 0;

上述代碼定義了一個 T 的擴展方法 Even，用來匹配 value 是否為偶數，於是我們便可以這麼使用：

var x = 3;
var y = x switch
{
    Even() => "even",
    _ => "odd"
};

此外，該模式還可以和解構模式結合，允許用戶自定義解構行為，例如：

static bool Int(this string value, out int result) => int.TryParse(value, out result);

然後使用的時候：

var x = "3";
var y = x switch
{
    Int(var result) => result,
    _ => 0
};

即可對 x 這個字符串進行匹配，如果 x 可以被解析為 int，就取解析結果 result，否則取 0。

後記

模式匹配極大的方便了我們編寫出簡潔且可讀性高的高質量代碼，並且會自動幫我們做窮舉檢查，防止我們漏掉情況。此外，使用模式匹配時，編譯器也會幫我們優化代碼，減少完成匹配所需要的比較次數，最終減少分支並提升運行效率。

本文中的例子為了覆蓋到全部的模式，不一定採用了最優的寫法，這一點各位讀者們也請注意。

本文中的表達式計算器全部代碼可以前往我的 GitHub 倉庫獲取：//github.com/hez2010/PatternMatchingExpr

Tags: .NET .NET Core c#