JavaScript ES6函數式編程（一）：閉包與高階函數

2019 年 10 月 20 日
筆記

函數式編程的歷史

函數的第一原則是要小，第二原則則是要更小 —— ROBERT C. MARTIN

解釋一下上面那句話，就是我們常說的一個函數只做一件事，比如：將字元串首字母和尾字母都改成大寫，我們此時應該編寫兩個函數。為什麼呢？為了更好的復用，這樣做保證了函數更加的顆粒化。

早在 1950 年代，隨著 Lisp 語言的創建，函數式編程（ Functional Programming，簡稱 FP）就已經開始出現在大家視野。而直到近些年，函數式以其優雅，簡單的特點開始重新風靡整個編程界，主流語言在設計的時候無一例外都會更多的參考函數式特性（ Lambda 表達式，原生支援 map ，reduce ……），Java8 開始支援函數式編程。

而在前端領域，我們同樣能看到很多函數式編程的影子：Lodash.js、Ramda.js庫的廣泛使用，ES6 中加入了箭頭函數，Redux 引入 Elm 思路降低 Flux 的複雜性，React16.6 開始推出 React.memo()，使得 pure functional components 成為可能，16.8 開始主推 Hooks，建議使用 pure functions 進行組件編寫……

這些無一例外的說明，函數式編程這種古老的編程範式並沒有隨著歲月而褪去其光彩，反而愈加生機勃勃。

什麼是函數式編程

上面我們了解了函數式編程的歷史，確定它是個很棒的東西。接下來，我們要去了解一下什麼是函數式編程？

其實函數我們從小就學，什麼一元函數（f(x) = 3x），二元函數……根據學術上函數的定義，函數即是一種描述集合和集合之間的轉換關係，輸入通過函數都會返回有且只有一個輸出值。

所以，函數實際上是一個關係，或者說是一種映射，而這種映射關係是可以組合的，一旦我們知道一個函數的輸出類型可以匹配另一個函數的輸入，那他們就可以進行組合。

在編程的世界裡，我們需要處理其實也只有「數據」和「關係」，而「關係」就是函數，「數據」就是要傳入的實參。我們所謂的編程工作也不過就是在找一種映射關係，比如：將字元串首字母轉為大寫。一旦關係找到了，問題就解決了，剩下的事情，就是讓數據流過這種關係，然後轉換成另一個數據返回給我們。

想像一個流水線車間的工作過程，把輸入當做原料，把輸出當做產品，數據可以不斷的從一個函數的輸出可以流入另一個函數輸入，最後再輸出結果，這不就是一套流水線嘛？

所以，現在你明確了函數式編程是什麼了吧？它其實就是強調在編程過程中把更多的關注點放在如何去構建關係。通過構建一條高效的建流水線，一次解決所有問題。而不是把精力分散在不同的加工廠中來回奔波傳遞數據。

函數式編程的特點

函數是一等公民

根據維基百科，程式語言中一等公民的概念是由英國電腦學家Christopher Strachey提出來的，時間則早在上個世紀60年代，那個時候還沒有個人電腦，沒有互聯網，沒有瀏覽器，也沒有JavaScript。並且當時也沒給出清晰的定義。

關於一等公民，我找到一個權威的定義，來自於一本書《Programming Language Pragmatics》，這本書是很多大學的程式語言設計的教材。

In general, a value in a programming language is said to have ﬁrst-class status if it can be passed as a parameter, returned from a subroutine, or assigned into a variable.

也就是說，在程式語言中，一等公民可以作為函數參數，可以作為函數返回值，也可以賦值給變數。

例如，字元串在幾乎所有程式語言中都是一等公民，字元串可以做為函數參數，字元串可以作為函數返回值，字元串也可以賦值給變數。

對於各種程式語言來說，函數就不一定是一等公民了，比如Java 8之前的版本。

對於JavaScript來說，函數可以賦值給變數，也可以作為函數參數，還可以作為函數返回值，因此JavaScript中函數是一等公民。

聲明式編程 (Declarative Programming)

通過上面的例子可以看出來，函數式編程大多時候都是在聲明我需要做什麼，而非怎麼去做。這種編程風格稱為聲明式編程 。

// 比如：我們要列印數組中的每個元素  // 1. 命令式編程  let arr = [1, 2, 3];  for (let i = 0, len = arr.length; i < len; i++) {    console.log(arr[i])  }    // 2. 聲明式編程  let arr = [1, 2, 3];  arr.forEach(item => {    console.log(item)  })    /*  * 相對於命令式編程的 for 循環拿到每個元素，聲明式編程不需要自己去找每個元素  * 因為 forEach 已經幫我們拿到了，就是 item，直接列印出來就行  */

這樣有個好處是程式碼的可讀性特別高，因為聲明式程式碼大多都是接近自然語言的，同時，它解放了大量的人力，因為它不關心具體的實現，因此它可以把優化能力交給具體的實現，這也方便我們進行分工協作。

惰性執行（Lazy Evaluation）

所謂惰性執行指的是函數只在需要的時候執行，即不產生無意義的中間變數。

無狀態和數據不可變 (Statelessness and Immutable data)

這是函數式編程的核心概念：

數據不可變：它要求你所有的數據都是不可變的，這意味著如果你想修改一個對象，那你應該創建一個新的對象用來修改，而不是修改已有的對象。
無狀態： 主要是強調對於一個函數，不管你何時運行，它都應該像第一次運行一樣，給定相同的輸入，給出相同的輸出，完全不依賴外部狀態的變化。

沒有副作用(side effect)

副作用，一般指完成分內的事情之後還帶來了不好的影響。在函數中，最常見的副作用就是隨意修改外部變數。由於js對象傳遞的是引用地址，這很容易帶來bug。

例如： map 函數的本來功能是將輸入的數組根據一個函數轉換，生成一個新的數組。而在 JS 中，我們經常可以看到下面這種對 map 的「錯誤」用法，把 map 當作一個循環語句，然後去直接修改數組中的值。

const list = [...];  // 修改 list 中的 type 和 age  list.map(item => {    item.type = 1;    item.age++;  })

傳遞引用一時爽，程式碼重構火葬場

這樣函數最主要的輸出功能沒有了，變成了直接修改了外部變數，這就是它的副作用。而沒有副作用的寫法應該是：

const list = [...];  // 修改 list 中的 type 和 age  const newList = list.map(item => ({...item, type: 1, age:item.age + 1}));

保證函數沒有副作用，一來能保證數據的不可變性，二來能避免很多因為共享狀態帶來的問題。當你一個人維護程式碼時候可能還不明顯，但隨著項目的迭代，項目參與人數增加，大家對同一變數的依賴和引用越來越多，這種問題會越來越嚴重。最終可能連維護者自己都不清楚變數到底是在哪裡被改變而產生 Bug。

純函數 (pure functions)

函數式編程最關注的對象就是純函數，純函數的概念有兩點：

不依賴外部狀態（無狀態）： 函數的的運行結果不依賴全局變數，this 指針，IO 操作等。
沒有副作用（數據不變）： 不修改全局變數，不修改入參。

所以純函數才是真正意義上的「函數」，它也遵循引用透明性——相同的輸入，永遠會得到相同的輸出。

我們這麼強調使用純函數，純函數的意義是什麼？

便於測試和優化：這個意義在實際項目開發中意義非常大，由於純函數對於相同的輸入永遠會返回相同的結果，因此我們可以輕鬆斷言函數的執行結果，同時也可以保證函數的優化不會影響其他程式碼的執行。這十分符合測試驅動開發 TDD（Test-Driven Development ) 的思想，這樣產生的程式碼往往健壯性更強。

可快取性：因為相同的輸入總是可以返回相同的輸出，因此，我們可以提前快取函數的執行結果，有很多庫有所謂的 memoize 函數，下面以一個簡化版的 memoize 為例，這個函數就能快取函數的結果，對於像 fibonacci 這種計算，就可以起到很好的快取效果。

  function memoize(fn) {      const cache = {};      return function() {        const key = JSON.stringify(arguments);        var value = cache[key];        if(!value) {          value = [fn.apply(null, arguments)];  // 放在一個數組中，方便應對 undefined，null 等異常情況          cache[key] = value;        }        return value[0];      }    }      const fibonacci = memoize(n => n < 2 ? n: fibonacci(n - 1) + fibonacci(n - 2));    console.log(fibonacci(4))  // 執行後快取了 fibonacci(2), fibonacci(3),  fibonacci(4)    console.log(fibonacci(10)) // fibonacci(2), fibonacci(3),  fibonacci(4) 的結果直接從快取中取出，同時快取其他的

閉包

定義：一個能夠讀取其他函數內部變數的函數，實質是變數的解析過程（由內而外）

閉包是ES中一個離不開的話題，而且也是是一個難懂又必須搞明白的概念！說起閉包，就不得不提與它密切相關的變數作用域和變數的生命周期。下面來看下：

變數作用域

變數作用域分為兩類：全局作用域和局部作用域。

編寫在script標籤中的變數或者沒用var關鍵字聲明的變數，就代表全局變數，在頁面的任意位置都可以訪問到
在函數中聲明變數帶有var關鍵字的即是局部變數，局部變數只能在函數內才能訪問到

function fn() {      var a = 1;     // a為局部變數      console.log(a);  // 1  }  fn();  console.log(a);     // a is not defined  外部訪問不到內部的變數

上面程式碼展示了在函數中聲明的局部變數a在函數外部拿不到。可是我們就想要在函數外拿到它，怎麼辦？下面就要看發揮閉包的威力了。

函數可以創造函數作用域，在函數作用域中如果要查找一個變數的時候，如果在該函數內沒有聲明這個變數，就會向該函數的外層繼續查找，一直查到全局變數為止。

所以變數的查找是由內而外的，這也形成了所謂的作用域鏈。

var a = 7;  function outer() {      var b = 8;      function inner() {          var c = 9;          alert(b);          alert(a);      }      inner();      alert(c);   // c is not defined  }  outer();    // 調用函數

還是最開始的函數，利用作用域鏈，我們試著去拿到a，改造一下fn函數：

function fn() {      var a = 1;     // a為局部變數      return function() {          console.log(a);      }  }  var fn2 = fn();  fn2();      // 1

理解了變數作用域，順著這條作用域鏈，再來回顧一下閉包的定義：閉包就是能夠讀取其他函數內部變數的函數，實質是變數的解析過程（由內而外）

變數生命周期

理解了變數作用域，再來看看變數的生命周期，直白一點就是它能在程式中存活多久。

對於全局變數而言，它的生命周期機就是永久的，除非我們手動銷毀它（這一點也是很有必要的，防止記憶體溢出）
對於在函數中通過var聲明的變數而言，就沒那麼幸運了。當函數執行完畢後，它也就沒什麼利用價值了，隨之被瀏覽器的垃圾處理機制當垃圾處理掉了
比如下面這段程式碼：

var forever = 'i am forever exist'  // 全局變數，永生  function fn() {      var a = 123;    // fn執行完畢後，變數a就將被銷毀了      console.log(a);  }  fn();

函數執行完畢，內部的變數a就被無情的銷毀了。那麼我們有沒有辦法拯救這個變數呢？答案是肯定的，救星來了——閉包

閉包的創建

function outFn() {      var i = 1;      function inFn () {          return ++i      }      return inFn;  }  var fn = outFn(); // 此處創建了一個閉包  fn();   // 2  fn();   // 3  fn();   // 4

上面的程式碼創建了一個閉包，有兩個特點：

函數inFn嵌套在函數outFn內部
函數outFn返回內部函數inFn

在執行完var fn = outFn();後，變數 fn 實際上是指向了函數 inFn，再執行 fn( ) 後就會返回 i 的值（第一次為1）。這段程式碼其實就創建了一個閉包，這是因為函數 outFn 外的變數 fn 引用了函數 outFn 內的函數inFn。也就是說，當函數 outFn 的內部函數 inFn 被函數 outFn 外的一個變數 fn 引用的時候，就創建了一個閉包（函數內部的變數 i 被保存到記憶體中，不會被立即銷毀）。

參考鏈接：
閉包的創建
 閉包和記憶體

高階函數

定義：高階函數就是接受函數作為參數或者返回函數作為輸出的函數。

下面分兩種情況講解，搞清這兩種應用場景，這將有助於理解並運用高階函數。

函數作為參數傳入

函數作為參數傳入最常見的就是回調函數。例如：在 ajax 非同步請求的過程中，回調函數使用的非常頻繁。因為非同步執行不能確定請求返回的時間，將callback回調函數當成參數傳入，待請求完成後執行 callback 函數。

$.ajax({    url: 'http://musicapi.leanapp.cn/search',  // 以網易雲音樂為例    data: {        keywords    },    success: function (res) {        callback && callback(res.result.songs);    }  })

函數作為返回值輸出

函數作為返回值輸出的應用場景那就太多了，這也體現了函數式編程的思想。其實從閉包的例子中我們就已經看到了關於高階函數的相關內容了。

還記得在我們去判斷數據類型的時候，我們都是通過Object.prototype.toString來計算的，每個數據類型之間只是'[object XXX]'不一樣而已。

下面我們封裝一個高階函數，實現對不同類型變數的判斷：

function isType (type) {      return function (obj) {          return Object.prototype.toString.call(obj) === `[object ${type}]      }  }    const isArray = isType('Array'); // 判斷數組類型的函數  const isString = isType('String'); // 判斷字元串類型的函數  console.log(isArray([1, 2]); // true  console.log(isString({});  // false

參考鏈接：
高階函數，你怎麼那麼漂亮呢！
簡明 JavaScript 函數式編程——入門篇

總結

最後總結一下這次的重點：純函數、變數作用域、閉包、高階函數。

純函數的定義：給定的輸入返回相同的輸出的函數。
變數作用域是閉包的實質。根據變數作用域向上查找的特性，閉包可以快取變數到記憶體中，函數執行完畢不會立即銷毀。
高階函數的核心是閉包，利用閉包快取一些未來會用到的變數，可以實現柯里化、偏應用…

下一節介紹柯里化、偏應用和組合…