python里的map和reduce

有不少文章介绍python的map与reduce,这到底是什么样的东西呢?

先看看google的paper里对mapreduce的解释

http://static.googleusercontent.com/media/research.google.com/zh-CN//archive/mapreduce-osdi04.pdf

MapReduce is a programming model and an associated implementation for processing and generating large data sets. Users specify a map function that processes a key/value pair to generate a set of intermediate key/value pairs, and a reduce function that merges all intermediate values associated with the same intermediate key.

map

map(function, iterable, …)的第一个参数是一个函数,第二个参数接受一个iterable对象(字符串,列表,元组等)。该函数返回一个列表。

python实现map的代码

实现:将输入的不规范的用户名转换成首字母大写的标准格式

逻辑写的简单点,就3种情况,当然可以写成4种,就相对复杂了。。。

  1. 初次循环,首字母小写
  2. 非初次循环,字母大写
  3. 其它(因为初次循环,首字母大写和非初次循环,字母小写默认就满足我们的需求)
def lower2upper(s):      loop = 0   '''循环计数'''      str = ""    '''定义一个空字符串'''      for i in s:          if i.islower() and loop ==0:              str = str + i.upper()              loop +=1          elif i.isupper() and loop !=0:              str = str + i.lower()              loop +=1          else:              str = str + i              loop +=1      return str    result = map(lower2upper,["adam","LiSA","ChEn","Peter","tOM"])  print result

reduce reduce(function, iterable[, initializer])把函数从左到右累积作用在元素上,产生一个数值。如reduce(lambda x, y: x+y, [1, 2, 3, 4, 5])就是计算((((1+2)+3)+4)+5)。Python提供的sum()函数可以接受一个list并求和,现实现一个prod()函数,可以接受一个list并利用reduce()求积。 def prod(list):     def multiply(x, y):         return x * y     return reduce(multiply, list) print prod([1, 3, 5, 7]) map和reduce 我们可以综合利用map和reduce来完成一个简单的字符串到数字的程序。 def str2int(s):     def fn(x, y):         return x * 10 + y     def char2num(s):         return {"0":0, "1":1, "2":2, "3":3, "4":4, "5":5, "6":6, "7":7, "8":8, "9":9}     return reduce(fn, map(char2num, s)) print str2int("12345") 其中map用于将字符串拆分为对应的数字,并以list的方式返回。reduce用来累加各个位上的和。