Caddy 源碼全解析

  • 2019 年 10 月 3 日
  • 筆記

caddy源碼全解析

Caddy 源碼全解析

Preface

Caddy 是 Go 語言構建的輕量配置化伺服器。同時程式碼結構由於 Go 語言的輕便簡潔,比較易讀,推薦學弟學妹學習 Go 的時候也去查看追一下它的源碼。不用怕相信這篇文章能給你很大的信心。

可能會有點多,建議多看幾遍。

Overview-CaddyMain

當然,建議看這篇文章的時候,查看上手一下 Caddy 的實際配置操作應用,對理解源碼會有好處,如果沒有操作過也沒有關係。

Package

這是 caddy 包的結構

首先我們從一切的開始講起,即平時我們程式運行的 main.go 函數。
這是 上圖 caddy 文件夾下的目錄結構。

在 caddy 文件夾中的 main 函數啟動 caddy 伺服器。實際運行的是 run.go 中的文件,這是方便測試使用
main.go的程式碼

通過改變 run 變數的值來方便測試,可以學習一下。

啟動流程

啟動 caddy 的流程畫了張圖


見到不認識的不用擔心,查看上文的目錄結構可以找到他們大概的位置,下文會詳細講解。

可以在此圖中看到幾個重要的點 caddyfileLoader這是載入 caddyfile 配置來啟動伺服器的。
如果配置使用過 caddy ,配置的 caddyfile 就是在這裡被 Loader 讀取後實例化伺服器的。如果沒有使用過,大致說一下流程,使用 caddy 非常簡單,只需配置上文所說的 caddyfile 文件,按行配置選項,然後使用 caddy 運行讀取該配置文件即可。簡單示例就是以下的文本。

Instance 是運行操作的實例,可以看到幾個主要的操作都是在他身上

Server 可以看到擁有 TCP UDP 兩個 Server 的介面。

我們首先關心的是 Start() 啟動伺服器。

啟動伺服器

發送 StartupEvent, 參照下文中 Event 理解

// Executes Startup events  caddy.EmitEvent(caddy.StartupEvent, nil)

讀取配置文件:

caddyfileinput, err := caddy.LoadCaddyfile(serverType)

啟動:

instance, err := caddy.Start(caddyfileinput)

發送 InstanceStartupEvent

caddy.EmitEvent(caddy.InstanceStartupEvent, instance

caddy.Start()

閱讀完程式碼,畫一張圖幫助理解

是不是很簡單,來一點更詳細的交互

這裡除了 Instance 之外還有兩個新名詞
 Controller:它是用來幫助 Directives 設置它自身的,通過讀取 Token,這裡的 Directives 實際上對應的就是上文所說的 caddyfile 中的配置文件選項。這一點請參照下文中 Loader 下的 excuteDirective 理解。
 Token :是 caddy 自己的 詞法分析器 解析 caddyfile 配置文件出的選項的標記。這一點請參照下文中 Loader 中的 Parser 理解

如果不理解,首先記住 caddy 是配置化的伺服器,
通過 caddyfile 配置 ->
那麼肯定要讀取它啦 ->
然後要解析它配置的到底是那些東西 ->
之後呢,就要讓配置的目標做到 caddyfile 中聲明的更改。
記住這個流程繼續看幾遍就能理解了。

Server

在 caddy.go 中定義著 Server 的介面,同時實現了優雅的退出。我們首先看圖了解組織結構

簡單看一下 Stopper 的介面

// Stopper is a type that can stop serving. The stop  // does not necessarily have to be graceful.  type Stopper interface {      // Stop stops the server. It blocks until the      // server is completely stopped.      Stop() error  }

GracefulServer 包含 Stopper 的介面實現了優雅退出,這是攔截了 系統 signal 的訊號之後執行的結果,意在意外中斷的時候保存好需要保存的東西。

它同時包含著 WrapListener 函數。可以看出,他用來做中間件。

// WrapListener wraps a listener with the      // listener middlewares configured for this      // server, if any.      WrapListener(net.Listener) net.Listener

ServerType

最後看到不同 serverType 生成不同的 server

另外可以看到 這裡最重要的 Instance 下面我們進一步查看 Instance 的程式碼

Instance

instance 是 Server 用來執行操作的實體。首先來看他的結構。它的程式碼在 主文件夾中的 caddy.go

首先我們看一下 它的結構了解下它可能有的功能

struct

type Instance struct {      serverType string      caddyfileInput Input      wg *sync.WaitGroup      context Context      servers []ServerListener      OnFirstStartup  []func() error // starting, not as part of a restart      OnStartup       []func() error // starting, even as part of a restart      OnRestart       []func() error // before restart commences      OnRestartFailed []func() error // if restart failed      OnShutdown      []func() error // stopping, even as part of a restart      OnFinalShutdown []func() error // stopping, not as part of a restart      Storage   map[interface{}]interface{}      StorageMu sync.RWMutex  }

serverType 代表這個實例的伺服器類型,通常是 HTTP

caddyfileInputInput 類型,通常我們配置 caddy 伺服器的時候,就是通過編輯 caddyfileInput 的文本實現的修改配置行動。值得注意的是,生成 Instance 的參數同樣是 caddyfile,這裡的 caddyfile 在程式中是一個介面,一會兒繼續講解

wg 是用來等待所有 servers 執行他們操作的訊號量。

context 是實例 Instance的上下文,其中包含 serverType 資訊和伺服器配置管理狀態的資訊。

servers 是一組 server 和 他們的 listeners,兩種 Server TCP/UDP,即 serverType ,兩種不同的 serverType 會對應不同的 caddyfile中的選項。

OnXXX 等 6 個函數是一系列回調函數,通過名字能夠看出在什麼時候回調觸發。

Storage 是存儲數據的地方,本來可以設計在 全局狀態中,但是設計在這裡更好,考慮到垃圾回收機制,進程中重新載入時,舊的 Instance be destroyed 之後,會變成垃圾,收集。這和 12-factor 中的 第九條 Disposability 相符合。意思是每一次重載實例 Instance 即使是在進程中重載,也不會出現數據相互影響到情況,保持冪等


雖然 Instance 操作著眾多操作,但是我們卻不能從它講起,從農村包圍城市,漸漸了解 Instance 能調用的函數,自然 Instance 的功能就清晰了。

Event

首先上圖:

首先我們看到的是 eventHooks 這個結構,實際上他是存儲 key:name value:EventHook 這樣的一個 map[string]EventHook 的結構,只是從 sync 包中引入保證並發安全。

eventHooks = &sync.Map{}

然後是重要的 caddy.EventHook 結構。

type EventHook func(eventType EventName, eventInfo interface{}) error

然後我們關注到如何註冊,和圖中的 caddy.EmitEvent 

註冊與分發

註冊 EventHook

可以看到使用 eventHooks.LoadOrStore方法,不必贅述

func RegisterEventHook(name string, hook EventHook){      if name == "" {          panic("event hook must have a name")      }      _, dup := eventHooks.LoadOrStore(name, hook)      if dup {          panic("hook named" + name + "already registered")      }  }

分發 EmitEvent

通過傳入函數為參數調用回調函數

// EmitEvent executes the different hooks passing the EventType as an  // argument. This is a blocking function. Hook developers should  // use 'go' keyword if they don't want to block Caddy.  func EmitEvent(event EventName, info interface{}) {      eventHooks.Range(func(k, v interface{}) bool {          err := v.(EventHook)(event, info)          if err != nil {              log.Printf("error on '%s' hook: %v", k.(string), err)          }          return true //注意這裡返回的是 true      })  }

這裡使用的 Range函數,實際上是把事件資訊給每一個上述提過 map 中的 EventHook 提供參數進行回調執行,按順序調用,但是如果 傳入函數返回 false ,迭代遍歷執行就會中斷。

可以知道,上文 Overview中啟動伺服器 所說的發送 caddy.StartupEvent 事件就是調用的

caddy.EmitEvent(caddy.StartupEvent, nil)

講到這,相信已經對大致的流程有了一點框架的概念。

下面我們繼續深入了解 在讀取 caddyfile 文件的時候發生了什麼。

Loader

自定義的配置文件都會有讀取分析。在 caddy 中 由 Loader 執行這一項職能。首先我們看一下它的工作流程。
這個圖來源於 plugin.go 文件

可以看到這裡通過 Loader 解耦了 caddyfile 文件的讀取,所以把它放在了 plugin.go 文件中,作為一個插件註冊在 caddy app 中。
這裡可以看到最終流程是 name -> caddy.Input 那麼這個 Input 是什麼呢?
實際上 Input 就是 caddyfile 在程式碼中的映射。可以理解為,caddyfile 轉化為了 Input 給 caddy 讀取。誰來讀取它呢?
那麼幹活的主角登場啦!

Parser

這裡我們來看,各個流程的終點 Token 是如何被分析出來的,需要知道,這裡的 Token 代表著 caddyfile 中的每行選項配置

詞法分析

// allTokens lexes the entire input, but does not parse it.  // It returns all the tokens from the input, unstructured  // and in order.  func allTokens(input io.Reader) ([]Token, error) {      l := new(lexer)      err := l.load(input)      if err != nil {          return nil, err      }      var tokens []Token      for l.next() {          tokens = append(tokens, l.token)      }      return tokens, nil  }

這裡實際上關鍵在於 讀取,可以看到在 dispenser 中由 cursor 來進行 Token 數組中的迭代
關鍵在於移動 cursor 索引的函數
next()

// next loads the next token into the lexer.  // A token is delimited by whitespace, unless  // the token starts with a quotes character (")  // in which case the token goes until the closing  // quotes (the enclosing quotes are not included).  // Inside quoted strings, quotes may be escaped  // with a preceding  character. No other chars  // may be escaped. The rest of the line is skipped  // if a "#" character is read in. Returns true if  // a token was loaded; false otherwise.  func (l *lexer) next() bool {      var val []rune      var comment, quoted, escaped bool        makeToken := func() bool {          l.token.Text = string(val)          return true      }        for {          ch, _, err := l.reader.ReadRune()          if err != nil {              if len(val) > 0 {                  return makeToken()              }              if err == io.EOF {                  return false              }              panic(err)          }            if quoted {              if !escaped {                  if ch == '\' {                      escaped = true                      continue                  } else if ch == '"' {                      quoted = false                      return makeToken()                  }              }              if ch == 'n' {                  l.line++              }              if escaped {                  // only escape quotes                  if ch != '"' {                      val = append(val, '\')                  }              }              val = append(val, ch)              escaped = false              continue          }            if unicode.IsSpace(ch) {              if ch == 'r' {                  continue              }              if ch == 'n' {                  l.line++                  comment = false              }              if len(val) > 0 {                  return makeToken()              }              continue          }            if ch == '#' {              comment = true          }            if comment {              continue          }            if len(val) == 0 {              l.token = Token{Line: l.line}              if ch == '"' {                  quoted = true                  continue              }          }            val = append(val, ch)      }  }

理解了 next 函數,就很容易知道如何分析一塊選項的 token 了,不過都是 next() 的包裝函數罷了。

excuteDirective

func executeDirectives(inst *Instance, filename string,      directives []string, sblocks []caddyfile.ServerBlock, justValidate bool) error {      // map of server block ID to map of directive name to whatever.      storages := make(map[int]map[string]interface{})        // It is crucial that directives are executed in the proper order.      // We loop with the directives on the outer loop so we execute      // a directive for all server blocks before going to the next directive.      // This is important mainly due to the parsing callbacks (below).      for _, dir := range directives {          for i, sb := range sblocks {              var once sync.Once              if _, ok := storages[i]; !ok {                  storages[i] = make(map[string]interface{})              }                for j, key := range sb.Keys {                  // Execute directive if it is in the server block                  if tokens, ok := sb.Tokens[dir]; ok {                      controller := &Controller{                          instance:  inst,                          Key:       key,                          Dispenser: caddyfile.NewDispenserTokens(filename, tokens),                          OncePerServerBlock: func(f func() error) error {                              var err error                              once.Do(func() {                                  err = f()                              })                              return err                          },                          ServerBlockIndex:    i,                          ServerBlockKeyIndex: j,                          ServerBlockKeys:     sb.Keys,                          ServerBlockStorage:  storages[i][dir],                      }                        setup, err := DirectiveAction(inst.serverType, dir)                      if err != nil {                          return err                      }                        err = setup(controller)                      if err != nil {                          return err                      }                        storages[i][dir] = controller.ServerBlockStorage // persist for this server block                  }              }          }            if !justValidate {              // See if there are any callbacks to execute after this directive              if allCallbacks, ok := parsingCallbacks[inst.serverType]; ok {                  callbacks := allCallbacks[dir]                  for _, callback := range callbacks {                      if err := callback(inst.context); err != nil {                          return err                      }                  }              }          }      }        return nil  }

caddyfile 既然被解析完畢,那麼就要開始執行配置更改了,這裡實際上是 caddy.go 中的 函數,最後在 caddy 的 main.go 中調用來執行更改。

DirectiveAction

很容易發現,這裡是通過 操作 Controller 來實現的,此時可以再返回最上文查看上一次提到 Controller 的時候。

// DirectiveAction gets the action for directive dir of  // server type serverType.  func DirectiveAction(serverType, dir string) (SetupFunc, error) {      if stypePlugins, ok := plugins[serverType]; ok {          if plugin, ok := stypePlugins[dir]; ok {              return plugin.Action, nil          }      }      if genericPlugins, ok := plugins[""]; ok {          if plugin, ok := genericPlugins[dir]; ok {              return plugin.Action, nil          }      }      return nil, fmt.Errorf("no action found for directive '%s' with server type '%s' (missing a plugin?)",          dir, serverType)  }

了解完這些,我們注意到有一個 叫做 Action 的東西,它又是怎麼來的?別急,他就在 Plugin 包中。我們知道了,配置文件實際上是配置各種 plugin 作為插件安裝在 caddy 伺服器上,而 caddyfile 正是被轉化為了 Token,Dispenser 來執行配置更改,即不同的插件安裝。那麼 Action 就是 PluginSetupFunc啦,來看看吧。

Plugin

你會注意到,在目錄中有一個 叫 caddyhttp 的文件夾中的文件夾特別多,不用問,這就是 http 的可選 Plugin

Overview

這裡概覽了 Plugin 是如何註冊的。

可以在這裡看到我們之前講解的很多的熟悉的概念,這是因為我們快要讀完 caddy 的架構了,剩下的實際上是具體的 Plugin 的各種擴展實現了。
可以看到,Plugin 是註冊在不同的 伺服器類型 serverType 下的,實際上是在兩重 map 映射的結構中,圖中可以看出,然後是 Action ,最近的上文才說明了它,用它來進行 Plugin 的安裝。
然後來到 Controller ,實際進行配置的傢伙,看到了之前所說的 DispenserToken 配置,還記得嗎,他們在剛才的詞法分析里才出現過。

接下來我們看一個 HTTPPlugin 的例子 errors 的實現

caddyHTTP

errors

這裡我們從下看,caddy.Listener 定義在 caddy.go 中,用來支援 零停機時間載入。

往上看到 Middleware 調用,我們來看看 errorsHandle 的結構

// ErrorHandler handles HTTP errors (and errors from other middleware).  type ErrorHandler struct {      Next             httpserver.Handler      GenericErrorPage string         // default error page filename      ErrorPages       map[int]string // map of status code to filename      Log              *httpserver.Logger      Debug            bool // if true, errors are written out to client rather than to a log  }

可以看到,Next 欄位明顯是 Chain 調用的下一個 Handler 處理。事實上,每一個 Plugin 或者算是 HTTP 服務中的中間件都有這個欄位用於 構建鏈式調用。

每一個 Plugin 值得注意的兩個,
一個是他們會實現 ServeHTTP 介面進行 HTTP 請求處理。

func (h ErrorHandler) ServeHTTP(w http.ResponseWriter, r *http.Request) (int, error) {      defer h.recovery(w, r)        status, err := h.Next.ServeHTTP(w, r)        if err != nil {          errMsg := fmt.Sprintf("%s [ERROR %d %s] %v", time.Now().Format(timeFormat), status, r.URL.Path, err)          if h.Debug {              // Write error to response instead of to log              w.Header().Set("Content-Type", "text/plain; charset=utf-8")              w.WriteHeader(status)              fmt.Fprintln(w, errMsg)              return 0, err // returning 0 signals that a response has been written          }          h.Log.Println(errMsg)      }        if status >= 400 {          h.errorPage(w, r, status)          return 0, err      }        return status, err  }

另一個是安裝到 caddy 中的 setup.go 文件,我們看一下 Plugin 安裝的全流程。

Directives

前面提到過很多次 Directives 這裡做一個它的整個流程概覽。上文中提到,這些註冊實際上都是 Controller 執行的。下半部分是 關於 HTTP 的服務配置
這裡的重點在 errors.serup() 可以看到,它創建了 errors.ErrHandler 並註冊到了 httpserver 的一對中間件中

// setup configures a new errors middleware instance.  func setup(c *caddy.Controller) error {      handler, err := errorsParse(c)      ···      httpserver.GetConfig(c).AddMiddleware(func(next httpserver.Handler) httpserver.Handler {          handler.Next = next          return handler      })      return nil  }

實際上這裡還有一個關於 caddy.Controller 到 ErrorHandler 的一個轉換 通過 errorsParse 函數

謝謝閱讀,如果有不對的地方歡迎指正。