【JS】446- 你不知道的 map
- 2019 年 12 月 24 日
- 筆記
前言
今日早读文章由酷家乐@Gloria投稿分享。
正文从这开始~~
作为前端工程师,你肯定用过Array.prototype.map方法。
如果你听说过Ramda,它也提供了和Array.prototype.map方法类似的map方法。
但是这个map背后的东西可以让你看到另外一个世界,我相信,如果你不想了解Ramda,也能从这篇文章中有所收获。
下面我们进入到例子。
简单的使用
像下面这样使用这个函数。
R.map(x => x + 1, [1, 2, 3]); // [2, 3, 4]
除了数组外它还可以作用于Object:
R.map(x => x + 1, {a: 1, b: 2, c: 3}); // {a: 2, b: 3, c: 4}
你以为就完了吗?它还能作用于函数:
R.map(x => x + 1, a => a + 1); // a => (a+1)+1
哇,作用于函数真的是没想到,那还能作用于其它奇奇怪怪的东西吗?
当然可以,有很多东西从某种维度上讲都是同一类东西,关键R.map的维度是什么呢?
先别讲什么乱七八糟的,接下来咱们来看一看官方文档上都有哪些描述.
文档上都说了啥
- 接收一个函数和一个 functor, 将该函数应用到 functor 的每个值上,返回一个具有相同形态的 functor。
- Ramda 为 Array 和 Object 提供了合适的 map 实现,因此 R.map 适用于 [1, 2, 3] 或 {x: 1, y: 2, z: 3}。
- 若第二个参数自身存在 map 方法,则调用自身的 map 方法。
- 若在列表位置中给出 transfomer,则用作 transducer 。
- 函数也是 functors,map 会将它们组合起来(相当于 R.compose)。
行了,除了2,3能看懂,其它都是啥??!!functor??transfomer??transducer??
我们找到Ramda的源码,看看这个map究竟都有哪些魔法?
看看ramda源码
隐去了一些不需要了解的逻辑,下面是代码:
var map = _dispatchable(['fantasy-land/map', 'map'], _xmap, function map(fn, functor) { /*ramda默认处理逻辑*/ switch(Object.prototype.toString.call(functor)) { case'[object Function]': returnfunction() { return fn.call(this, functor.apply(this, arguments)); }; case'[object Object]': return _reduce(function(acc, key) { acc[key] = fn(functor[key]); return acc; }, {}, keys(functor)); default: return _map(fn, functor); } });
先说说_dispatchable的逻辑:
function _dispatchable(methodNames, xf, fn): Function
- _dispatchable返回的函数作为R.map的处理过程
- 接收 3 个参数:methodNames(方法名数组),xf(transformer),fn(默认的ramda实现)
- 如果 methodNames 中的方法名存在于传进 R.map方法的最后一个参数f上,则将该方法作为处理过程 (如 f 是数组,则使用默认的处理过程)
- 如果最后一个参数 f 是transformer,处理结果则是:一个新的transformer
- 如果以上3,4说的情况都没有,则使用Ramda的默认处理过程(第一个代码块注释处)
总体看下来R.map有3种处理策略(按照优先级从上到下):
- 最后一个参数f上出现在 methodNames 中的方法
- 根据最后一个参数 f 返回新的 transformer
- Ramda默认处理逻辑
默认的处理逻辑就不再展开了,比较容易明白,先说说2,1放在后面讲。
transduce
进入正题之前,抛开ramda,看一个简单的栗子:
const add = (a, b) => a + b; [1,2,3,4].reduce(add, 0); // 10
计算出一个数组中所有数字的和。
现在如果要对每个数字+1,再求和:
const add = (a, b) => a + b; const plusOne = a => a + 1; [1,2,3,4].map(plusOne).reduce(add, 0); // 14
上面的代码会遍历数组两次,虽然代码写起来省事了,如果数据量比较大,这个做法看起来就有些笨拙了。但是又不能改写add方法,万一别的地方也用到了add。
想办法只遍历一次:结合add和plusOne生成一个新的函数addNPlusOne:
const addNPlusOne = (acc, value) => add(acc, plusOne(value)); [1,2,3,4].reduce(addNPlusOne, 0); // 14
嗯,解决了。但是还不够通用,将add视为reducer,plusOne视为对value的预处理函数fn,通过结合fn和reducer生成一个新的reducer提供给reduce
const makeMapReducer = fn => reducer => (acc, value) => reducer(acc, fn(value)); const addNPlusOne = makeMapReducer(plusOne)(add); [1,2,3,4].reduce(addNPlusOne); // 14
transducer
makeMapReducer(plusOne)就是一个transducer。
在之前的基础上:如果需要先筛选出小于等于2的数值,然后再给每一项+1,最后统计出数组中所有数的和。
需要再添加一个filterTransducer:
const makeFilterReducer = fn => reducer => (acc, value) => fn(value)? reducer(acc, value) : acc; const filterTransducer = makeFilterReducer(a => a <= 2); const addNPluslteTwo = filterTransducer(addNPlusOne); [1,2,3,4].reduce(addNPlusltTwo); // 5
好了,也就是说如果你不使用任何第三方库,这个生成transducer的函数需要你自己去实现。
在Ramda中
在Ramda中你可以这样实现上面的栗子:
R.transduce(R.map(a => a+1), (acc, value) => acc + value, 0, [1,2,3,4]); // 14 R.transduce(R.pipe( R.map(a => a+1), R.filter(a => a <= 2), ), (acc, value) => acc+value, 0, [1,2,3,4]); // 5
再简化一点:
R.transduce(R.map(R.inc), R.add, 0, [1,2,3,4]); // 14 R.transduce(R.pipe( R.map(R.inc), R.filter(R.gte(2)), ), R.add, 0, [1,2,3,4]); // 5
之前的例子,我们自己实现了transducer。
而对于ramda来说,很多作用于数组的api都会有默认的生成transducer的实现,比如map,filter,find等等api。
好了,好像扯远了,我们再回到R.map上,看一看这里的transformer是啥意思。
- 根据最后一个参数f返回新的transformer
回到开始的话题
当你调用R.transduce的时候,它会把第二个参数R.add,转化为一个对象,这个对象上存在方法@@transducer/step,这个方法返回的是R.add(acc, value)。存在方法@@transducer/step的对象就叫做transformer。
其实你可以这样理解:transformer是一个函数的载体,transformer['@@transducer/step']就是这个函数。
好了,如果当R.map的第二个参数是一个transformer的时候:
// _xwrap是ramda内部函数,用于将函数转为transformer R.map(R.inc)(_xwrap(R.add)) // 跟下面是等价的 R.map(R.inc, _xwrap(R.add))
R.map(R.inc)其实就是上面我们说的transducer(transducer还能组合起来,不再展开了,有兴趣的同学可以加群讨论)
transducer + transformer = transformer,所以上面两行代码返回的结果依然是一个transformer,这个transformer的@@transducer/step方法最终效果是下面这样:
XMap.prototype['@@transducer/step'] = function(acc, value) { return R.add(acc, R.inc(value)); };
这个transformer代表的就是最终的reducer函数的容器
R.transduce(R.map(R.inc), R.add, 0, [1,2,3,4]); // 与下面是等价的 const xf = R.map(R.inc)(_xwrap(R.add)); R.reduce(xf['@@transducer/step'], 0, [1,2,3,4]);
总结一下
为了减少遍历次数,用transduce替代reduce,把之前reduce过程的前置操作比如map,filter,find等操作在一次遍历中完成。
为了实现这个transduce,以及在其上map,filter,find这种操作的可组合性,引入了transducer+transformer的概念。
这个transducer的概念最早是在Clojure里出现,有兴趣的同学可以看看:https://video.tudou.com/v/XMjMxNTY2MDgzNg==.html?__fr=oldtd
fantasyland/map
- 最后一个参数
f
上出现在methodNames
中的方法 - 根据最后一个参数
f
返回新的transformer
- ramda默认处理逻辑
既然第2点讲完了,开始这篇文章的最后一部分,这一部分与上面讲的transducer没有任何关系,这一部分也是本文想着重介绍的。
var map = _dispatchable(['fantasy-land/map', 'map'],...)
从上面R.map的实现中可以看到,传入_dispatchable的methodsName中,第一个方法名是fantasyland/map。
如果R.map(fn, obj),obj上有fantasyland/map方法,则R.map(fn, obj)等价于 obj['fantasyland/map'](fn)
。
那么methodsName中另一个map和这个fantasyland/map有啥区别?为啥还有这么长的一个名字?
fantasyland规范
其实fantasyland/map这个名字是有特殊含义的,fantasyland/map没有特定的实现,不过,如果你要实现这么一个方法,你需要遵循fantasyland规范。
所谓的fantasyland规范,其实就是一个文档,这个文档里规定了一些代数结构在javascript里实现的约束
Fantasy Land Specificationaka "Algebraic JavaScript Specification"
如果你在大学有接触过《离散数学》的话,其中的一些概念会在这个规范中有具体的javascript定义,比如:二元关系(等价关系,全序关系),群,半群。当然,除了这3类数据结构,还有范畴以及在基础代数结构上衍生出来的其它结构。
类型签名
接下去我们会着重看一下与fantasy-land/map相关的定义,不过,在此之前有一些简单的类型签名,需要提前了解一下(下面的类型签名解释,是个人翻译版本,如果你有兴趣,可以直接看github上英文原版的解释):
:: :“a属于类型b”
e :: t:可以理解成:“e属于类型t”
true :: Boolean:“ true 属于 Boolean 类型”
42 :: Integer,Number :“42既属于 Integer 也属于 Number 类型”
通过类型构造函数可以构造一个新的类型
类型构造函数接受0个或多个参数
Array 就是一个类型构造函数,它接受一个类型作为参数
Array String 是存放着字符串的数组,像这几个数组都是属于 Array String :[],['foo', 'bar', 'baz']
Array(Array String) 是存放着数组的数组,存放的数组里面又存放着字符串,像这几个数组都是属于 Array(Array String):[],[[], []],[[], ['foo'], ['bar`, 'baz']]
小写字母是类型变量
类型变量可以代表任何类型,除非用胖箭头(下面有介绍)对它做类型约束
->(箭头)函数的类型构造函数
-> 是一个中缀类型构造函数,这个类型构造函数接受两个参数,箭头左边的参数是输入类型,右边的参数是输出类型
-> 可以接受0个或多个输入类型作为左边的参数。语法:() ->,中的多个类型以“ , ”分隔。一元函数输入参数旁边的括号可以省略,比如:String -> Boolean,(String, String) -> Boolean
String -> Array String 对应一类函数:接受一个 String 类型的参数,然后返回一个类型为 Array String 的值
String -> Array String -> Array String 代表着一类函数:接受一个类型为String的输入,输出一个类型为 Array String -> Array String 的函数,这个输出的函数接受一个类型为 Array String 的参数,输出类型为 Array String 的值
(String, Array String) -> Array String代表着一类函数:接受两个参数,第一个是String 类型,第二个是 Array String 类型,输出类型为 Array String 的值
() -> Number 代表着一类函数:不接受输入,返回一个类型为 Number 的值
~>(波浪箭头)方法的类型构造函数
当一个函数是一个对象的属性时,它被叫做这个对象上的“方法”。所有的“方法”都拥有一个隐含的参数类型-所在对象的类型
a ~> a -> a 代表着一类方法:是类型为 a 的对象上的方法,且这个方法接受一个类型为a 的参数,返回一个类型为 a 的值
=>(胖箭头)胖箭头用来对类型变量做类型约束
比如有这么一个方法 a ~> a -> a ,在这个方法的类型签名中,a 可以代表任何类型。Semigroup a => a ~> a -> a,而这个类型签名中就对类型变量 a 做了类型约束,使得类型 a 必须满足类型类 Semigroup 。当一个类型满足一个类型类的意思是,这个类型实现了所有类型类指定的函数/方法。
就拿这次我们要说的fantasy-land/map举例:
fantasy-land/map
fantasy-land/map解析
先不管下面这部分
Functoru'fantasy-land/map' is equivalent to u (identity)u'fantasy-land/map') is equivalent to u'fantasy-land/map''fantasy-land/map' (composition)
直接看规范中对fantasy-land/map的定义:
fantasy-land/map :: Functor f => f a ~> (a -> b) -> f b
Functor是一个类型类,f 必须满足 Functor, f a 代表了以 f 作为类型构造函数,类型 a 作为构造参数生成的类型,比如 Array String,代表字符串数组,Array 就是 f ,它满足Functor类型类。
如果一个对象,是Functor实例(具体的值)。那么这个对象上需要存在一个名为 fantasy-land/map 的方法,这个方法必须接受一个函数作为参数:
u['fantasy-land/map'](f) // 举个例子 [1,2,3]['fantasy-land/map'](f)
f 必须是一个函数
- 如果 f 不是一个函数,fantasy-land/map 的行为是不确定的
- f 可以返回任何类型的值
- 不应该检测 f 的返回类型
fantasy-land/map 方法,必须返回一个相同的Functor(比如 [1,2,3]'fantasy-land/map' 必须返回也一个数组:Array)
其实可以类比 Array.prototype.map 方法,只是换了个名字而已。
那么说了这么多,Functor 是个什么东东?除了 Array 以外,还有什么是 Functor ?
其实 Function 也是 Functor ,惊喜吗?
不卖关子了,Functor 的中文名是“函子”,接下来讲讲“函子”。
啥是函子
“函子”是范畴论中的概念,所以,在准备完全理解“函子”之前,你需要明白啥是“范畴”?
范畴
其实,在生活中,无处不充斥着范畴,只不过范畴论把这些东西抽象成了数学结构。
范畴此一概念代表着一堆数学实体和存在于这些实体间的关系。–维基百科
范畴的定义其实很简单,就是实体的集合+实体间的关系。
那么什么是“实体”?这取决于你怎么看。
从集合的角度来说,实体是 a set of values ,首先它得是一个集合(set),其次,这个集合是由有好多的值组成(value)。
还是比较抽象,再具体一点,比如:一个类型可被看作为值的集合(a set of values),类型与类型之间的关系就是函数,所以一堆类型+类型之间的函数,就是范畴。
比如有下面这些函数:
fn1 :: Number-> String const fn1 = (a: number) => `${a}1`; fn2 :: String-> Boolean const fn2 = (a: string) => a === '1'; ...
这些函数都是定义在Number和String上的映射关系。Number,String和Boolean,以及它们之间的映射关系,构成下面这个范畴
范畴
在范畴论中,图片中的 NUMBER , STRING 和 BOOLEAN 叫做“对象”(Object),fn1 和 fn2 叫做“态射”(Morphism), fn2 * fn1 叫做“态射复合”, NUMBER -> NUMBER 叫做单位态射。
明白什么是范畴之后,接下来说一说我们的主角:函子
函子
先来看看维基上的解释:
在范畴论中,函子是范畴间的一类映射。函子也可以解释为小范畴范畴内的态射。–维基百科
范畴和范畴也会有映射关系,如果把范畴视作一个对象时,函子就是范畴之间的态射。然后组成了一个范畴的范畴。
举个例子:考虑一个基础类型的范畴A,一个数组范畴B。
两个范畴
思考以下几个问题:
- Number 和 Array 之间的关系
- String 和 Array 之间的关系
- Number 到 String 的态射与 Array 到 Array 的态射的关系
之前介绍过 Array 是类型构造函数:
- 将 Number 传进 Array ,构造出 Array
- 将 String 传进 Array ,构造出 Array
- 可通过 Array 上的 map 方法会保持 Number -> String 映射到
Array<Number>->Array<String>
再回顾一下上文对函子的定义:
在范畴论中,函子是范畴间的一类映射。
上面例子中,范畴A到范畴B的映射其实就是类型构造函数 Array ,所以说, Array 就是函子。
函子
这里省去了对公式上的定义的match,争取大家对这个概念有感性的认识,如果想知道函子严谨的定义,可以看这里
回到fantasy-land/map
了解了函子的感性定义之后,回到严谨的规范上来。
之前解析 fantasy-land/map 的时候,有个定义一直没有提及,就是 Functor , fantasy-land/map 在文档中的位置其实是Functor的子标题,现在再来回顾一下。
Functor 1. u['fantasy-land/map'](a => a) is equivalent to u (identity) 2. u['fantasy-land/map'](x => f(g(x))) is equivalent to u['fantasy-land/map'](g)['fantasy-land/map'](f) (composition)
通过对比函子的公式定义,解析Functor需满足的条件(F即函子):
保持着单位态射(id即单位态射,idX即对象X上的单位态射)
保持着态射的复合
总结一下fantasyland规范中对函子的定义
如果实现一个函子,你需要在函子上实现 fantasy-land/map 方法,这个方法的类型签名应该是这样的:
fantasy-land/map :: Functor f => f a ~> (a -> b) -> f b
函子实例调用方法 fantasy-land/map 时,需同时保持单位态射和态射的复合。
结尾
这篇文章不知不觉写得有些长了,从Ramda文档->源码->transducer->fantasyland规范->范畴论->函子,算是自己完整的探索过程,希望能够带给你一些不一样的东西。
参考文章
- JavaScript玩转Clojure大法之Transducer
- Wikipedia 范畴论
- Wikipedia 函子
关于本文作者:@Gloria原文:https://zhuanlan.zhihu.com/p/96059965