Python collection的使用
- 2020 年 1 月 9 日
- 筆記
Python中的基本數據結構有list,dict,tuple,set。Python還有一個功能比較強大的包collections,可以處理並維護一個有序的dict,可以提高程式的運行效率。 1、collections中defaultdict的使用 defaultdict在字典dict的基礎之上添加一個參數default_factory(default_factory可以指定為list,set,int) 例子1:將下面的list轉換成一個dict,其中key對應的value是一個list
>>from collections import defaultdict >>l=[('a',2),('b',3),('a',1),('b',4),('a',3),('a',1),('b',3)] >>d=defaultdict(list) >>for key,value in l: d[key].append(value) >>d defaultdict(<class 'list'>,{'a':[2,1,3,1],'b':[3,4,3]}
例子2:例1中value中包含重複元素,如果我們不想要value中的元素重複,可以用defaultdict(set)來解決這個問題,set與list不同之處就是set中不允許存在相同的元素
>>d = defaultdict(set) >>for key,value in s: d[key].add(value) >>d defaultdict(<class 'set'>, {'a': {2,1,3}, 'b': {3,4}})
例子3:如果要統計一個字元串中每個字元出現的次數,可以使用defaultdict(int)
>sen='hello world' >d=defaultdict(int) >for key,value in sen: d[key]+=1 >d defaultdict(<class 'int'>, {'o': 2, 'h': 1, 'w': 1, 'l': 3, ' ': 1, 'd': 1, 'e': 1, 'r': 1})
2、collections中OrdereDict的使用 字典dict是無序的,如果我們想要有序的dict,可以使用OrdereDict 例子1:
>from collections import OrderedDic >d={'b':3,'a':4,'c':2,'d':1} # 將d按照key來排序 >OrderedDic(sorted(d.items(),key=lambda t:t[0])) OrderedDic([('a',4),('b',3),('c',2),('d',1)]) # 按照value來排序 >OrderedDict(sorted(d.items(),key=lambda t:t[1])) OrderedDic([('d',1),('c',2),('b',3),('a',4)]) # 按照key的長度來排序 >OrderedDic(sorted(d.items(),key=lambda t:len(t[0])))
如果我們要刪除dict中的key-value,popitem(last=True)按照先進後出的順序刪除dict中的key-value,popitem(last=False)按照先進先出的規則刪除dict中的key-value
例子2:例1中已經按照key排序的dict,使用使用popitem()方法來移除最後一個key-value對 >d.popitem() ('d',1) # 使用popitem(last=False) >d.popitem(last=False) ('a',4)
例子3:如果我們想要改變有序的OrderedDict對象的key-value順序,可以使用move_to_end(key,last=True)
>d = OrderedDict.fromkeys('abcde') OrderedDict([('a', None), ('b', None), ('c', None), ('d', None), ('e', None)]) # 將key為c的key-value移動到最後 >d.move_to_end('c') # 將key為c的key-value移動到最前面 >d.move_to_end('c',last=False) >''.join(d.keys()) cabde
3、collections中deque的使用 deque是為了向list中刪除和插入的效率更高,用法與list相似,而list自帶的append和pop方法(尾部插入和刪除)速度慢 4、collections中ChainMap的使用 ChainMap可以合併多個dict,而且效率很高
>from collections import ChainMap > a = {'a': 4, 'c': 2} > b = {'b': 3, 'c': 1} > c=ChainMap(a,b) ChainMap({'a': 4, 'c': 2}, {'b': 3, 'c': 1}) # 將c變成一個list >c.maps [{'a': 4, 'c': 2}, {'b': 3, 'c': 1}]
5、collections中Counter的使用 例子1:若想統計相關元素出現的次數,可以使用Counter
>from collections import Counter >cnt=Counter() >for w in ['a','b','a','a','a','r','b']: cnt[w]+=1 Counter({'a': 4, 'b': 2, 'r': 1}) # 統計字元串出現的次數 前面有統計sen='hello world',用defaultdict(int) >cnt = Counter() > for ch in 'hello': cnt[ch] = cnt[ch] + 1 Counter({'l': 2, 'o': 1, 'h': 1, 'e': 1})
例子2:elements()方法按照元素的出現次數返回一個iterator(迭代器),元素以任意的順序返回,如果元素的計數小於1,將忽略它。
>c = Counter(a=4, b=3, c=1, d=-4,e=0) Counter({'a': 4, 'b': 3, 'c': 1, 'd': -4, 'e':0}) >sorted(c.elements()) ['a', 'a', 'a', 'a', 'b', 'b','b','c'] # most_common(n)返回一個list, list中包含Counter對象中出現最多前n個元素。 >c = Counter('abracadabra') Counter({'a': 5, 'b': 2, 'r': 2, 'd': 1, 'c': 1}) >c.most_common(3) [('a', 5), ('b', 2), ('r', 2)]
6、collections中namedtuple的使用 命名tuple中的元素,使用namedtuple(typename,field_names)
>from collections import namedtuple >nm=namedtuple('helloworld',['x','y']) >n=nm(1,2) >n__class__.__name__ 'helloworld' >n.x 1 >n.y 2