手寫編程語言-實現運算符重載

前言

先帶來日常的 GScript 更新:新增了可變參數的特性,語法如下:

int add(string s, int ...num){
	println(s);
	int sum = 0;
	for(int i=0;i<len(num);i++){
		int v = num[i];
		sum = sum+v;
	}
	return sum;
}
int x = add("abc", 1,2,3,4);
println(x);
assertEqual(x, 10);

得益於可變參數,所以新增了格式化字符串的內置函數:

//formats according to a format specifier and writes to standard output.
printf(string format, any ...a){}

//formats according to a format specifier and returns the resulting string.
string sprintf(string format, any ...a){}

下面重點看看 GScript 所支持的運算符重載是如何實現的。

使用

運算符重載其實也是多態的一種表現形式,我們可以重寫運算符的重載函數,從而改變他們的計算規則。

println(100+2*2);

以這段代碼的運算符為例,輸出的結果自然是:104.

但如果我們是對兩個對象進行計算呢,舉個例子:

class Person{
	int age;
	Person(int a){
		age = a;
	}
}
Person p1 = Person(10);
Person p2 = Person(20);
Person p3 = p1+p2;

這樣的寫法在 Java/Go 中都會報編譯錯誤,這是因為他們兩者都不支持運算符重載;

Python/C# 是支持的,相比之下我覺得 C# 的實現方式更符合 GScript 語法,所以參考 C# 實現了以下的語法規則。

Person operator + (Person p1, Person p2){
	Person pp = Person(p1.age+p2.age);
	return pp;
}
Person p3 = p1+p2;
println("p3.age="+p3.age);
assertEqual(p3.age, 30);

有幾個硬性條件:

  • 函數名必須是 operator
  • 名稱後跟上運算符即可。

目前支持的運算符有:+-*/ == != < <= > >=

實現

以前在使用 Python 運算符重載時就有想過它是如何實現的?但沒有深究,這次藉著自己實現相關功能從而需要深入理解。

其中重點就為兩步:

  1. 編譯期間:記錄所有的重載函數和運算符的關係。
  2. 運行期:根據當前的運算找到聲明的函數,直接運行即可。

第一步的重點是掃描所有的重載函數,將重載函數與運算符存放起來,需要關注的是函數的返回值與運算符類型。

// OpOverload 重載符
type OpOverload struct {
	function  *Func
	tokenType int
}

// 運算符重載自定義函數
opOverloads []*symbol.OpOverload

在編譯器中使用一個切片存放。

而在運行期中當兩個入參類型相同時,則需要查找重載函數。

// GetOpFunction 獲取運算符重載函數
// 通過返回值以及運算符號(+-*/) 匹配重載函數
func (a *AnnotatedTree) GetOpFunction(returnType symbol.Type, tokenType int) *symbol.Func {
	for _, overload := range a.opOverloads {
		isType := overload.GetFunc().GetReturnType().IsType(returnType)
		if isType && overload.GetTokenType() == tokenType {
			return overload.GetFunc()
		}
	}
	return nil
}

查找方式就是通過編譯期存放的數據進行匹配,拿到重載函數後自動調用便實現了重載。

感興趣的朋友可以查看相關代碼:

總結

運算符重載其實並不是一個常用的功能;因為會改變運算符的語義,比如明明是加法卻在重載函數中寫為減法。

這會使得代碼閱讀起來困難,但在某些情況下我們又非常希望語言本身能支持運算符重載。

比如在 Go 中常用的一個第三方精度庫decimal.Decimal,進行運算時只能使用 d1.Add(d2) 這樣的函數,當運算複雜時:

a5 = (a1.Add(a2).Add(a3)).Mul(a4);
a5 = (a1+a2+a3)*a4;

就不如下面這種直觀,所以有利有弊吧,多一個選項總不是壞事。

GScript 源碼:
//github.com/crossoverJie/gscript