使用 yield 压平多层嵌套字典列表混合数据

  • 2019 年 11 月 7 日
  • 筆記

摄影:产品经理

买单:kingname

在上一篇文章里面,我们讲到了如何使用Python的yield关键字简化代码,压平多层嵌套字典的。

那么如果我们的数据不仅仅有字典,还有列表,是一个字典列表多层嵌套的数据怎么办呢?例如:

nest_dict = {      'a': 1,      'b': {          'c': 2,          'd': 3,          'e': {'f': 4}      },      'g': {'h': 5},      'i': 6,      'j': {'k': {'l': {'m': 8}}},      'n': [1, {'o': 1, 'p': [1, 2, 3],  'q': {'r': {'s': 100}}}, 3, [1, 2, 3], 5]  }

现在,请停下来,敲一敲代码,想想如何把处理列表的逻辑添加进去。

首先,我们来看一下最终被压平以后的数据长什么样:

{'a': 1,   'b_c': 2,   'b_d': 3,   'b_e_f': 4,   'g_h': 5,   'i': 6,   'j_k_l_m': 8,   'n_0': 1,   'n_1_o': 1,   'n_1_p_0': 1,   'n_1_p_1': 2,   'n_1_p_2': 3,   'n_1_q_r_s': 100,   'n_2': 3,   'n_3_0': 1,   'n_3_1': 2,   'n_3_2': 3,   'n_4': 5}

对于'n': ['a', 'b', 'c']这种形式的数据,我们把它转换为:{'n_0': 'a', 'n_1': 'b', 'n_2': 'c'}

我们原来的核心代码是这样的:

def flat(x):      for key, value in x.items():          if isinstance(value, dict):              for k, v in flat(value):                  k = f'{key}_{k}'                  yield (k, v)          else:              yield (key, value)

你的第一反应,是不是这样修改代码:

def flat(x):      for key, value in x.items():          if isinstance(value, dict):              for k, v in flat(value):                  k = f'{key}_{k}'                  yield (k, v)          elif isinstance(value, list):              "一大堆处理列表的代码"          else:              yield (key, value)

如果你使用return和递归,你可能确实需要这样写。

但如果你使用yield关键字,那么,你虽然也要修改代码,可是修改的地方却不是这里。我们要修改的地方在for key, value in x.items()

因为.items()这个方法是字典的方法,列表没有这个方法。所以我们需要写一个通用的迭代生成器,支持字典和列表,所以我们增加一个函数:iter_x:

def iter_x(x):      if isinstance(x, dict):          for key, value in x.items():              yield (key, value)      elif isinstance(x, list):          for index, value in enumerate(x):              yield (index, value)

现在,我们在原来的代码中调用这段个新的生成器函数:

def flat(x):      for key, value in iter_x(x):          if isinstance(value, (dict, list)):              for k, v in flat(value):                  k = f'{key}_{k}'                  yield (k, v)          else:              yield (key, value)

其中,isinstance(value, (dict, list)),相当于isinstance(value, dict) or isinstance(value, list)

我们来看一下运行效果:

掌握yield关键字,你的编程思路和想问题的方式会发生一个重大的转变。