python 读取与存储json
- 2020 年 1 月 13 日
- 笔记
官方文档:http://python3-cookbook.readthedocs.io/zh_CN/latest/c06/p02_read-write_json_data.html
JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式。它基于ECMAScript的一个子集。 JSON采用完全独立于语言的文本格式,但是也使用了类似于C语言家族的习惯(包括C、C++、Java、JavaScript、Perl、Python等)。这些特性使JSON成为理想的数据交换语言。易于人阅读和编写,同时也易于机器解析和生成(一般用于提升网络传输速率)。
JSON在python中分别由list和dict组成。
这是用于序列化的两个模块:
- json: 用于字符串和python数据类型间进行转换
- pickle: 用于python特有的类型和python的数据类型间进行转换
- Json模块提供了四个功能:dumps、dump、loads、load
json dumps
把数据类型转换成字符串 dump
把数据类型转换成字符串并存储在文件中 loads把字符串转换成数据类型 load
把文件打开从字符串转换成数据类型
json
是可以在不同语言之间交换数据的,而pickle
只在python
之间使用。json
只能序列化最基本的数据类型,josn
只能把常用的数据类型序列化(列表、字典、列表、字符串、数字、),比如日期格式、类对象!josn
就不行了。而pickle可以序列化所有的数据类型,包括类,函数都可以序列化。
import json # Writing JSON data with open('data.json', 'w') as f: json.dump(data, f) # Reading data back with open('data.json', 'r') as f: data = json.load(f)
字典排序
问题
你想创建一个字典,并且在迭代或序列化这个字典的时候能够控制元素的顺序。
解决方案
为了能控制一个字典中元素的顺序,你可以使用 collections 模块中的 OrderedDict 类。 在迭代操作的时候它会保持元素被插入时的顺序,示例如下:
from collections import OrderedDict d = OrderedDict() d['foo'] = 1 d['bar'] = 2 d['spam'] = 3 d['grok'] = 4 # Outputs "foo 1", "bar 2", "spam 3", "grok 4" for key in d: print(key, d[key])
OrderedDict
内部维护着一个根据键插入顺序排序的双向链表。每次当一个新的元素插入进来的时候, 它会被放到链表的尾部。对于一个已经存在的键的重复赋值不会改变键的顺序。
需要注意的是,一个 OrderedDict
的大小是一个普通字典的两倍,因为它内部维护着另外一个链表。 所以如果你要构建一个需要大量 OrderedDict
实例的数据结构的时候(比如读取 100,000 行 CSV
数据到一个 OrderedDict
列表中去), 那么你就得仔细权衡一下是否使用 OrderedDict
带来的好处要大过额外内存消耗的影响。
# from collections import ChainMap # # dict(index=0,name='none',width=0,height=0,bbox=str([0,0,0,0]),gender='none',age=0,mask='none',glass='none',hat='none') # jsonDefault=dict(bbox=str([0,0,0,0]),gender='male',age=0,mask='none',glass='none',hat='none') # # name:文件名str,width:图片宽int,height:图片高int,bbox:str([0,1,2,3]), # # gender:"male"|"female",glass:"sunglasses"|"glasses"|"none",age:年龄值int,hat:"Yes"|"No", # jsonTemp=lambda args:'''{{"image_key":"{name}","video_name":"1","video_index":"{index}","width":{width},"height":{height},"face":[{{"id":1,"track_id":-1,"data":{bbox},"struct_type":"rect","attrs":{{"gender":"{gender}","has_glasses":"{glass}","specific_age":"{age}","has_mask":"none","Wear_a_hat":"{hat}","occlusion":"{asvisible}"}}}}]}} # '''.format(**ChainMap(args,jsonDefault)) # # 为什么不使用json标准的空值:null from collections import ChainMap # dict(index=0,name='none',width=0,height=0,bbox=str([0,0,0,0]),gender='none',age=0,mask='none',glass='none',hat='none') jsonDefault=dict(bbox=str([0,0,0,0]),gender='male',age=0,mask='none',glass='none',hat='none') # name:文件名str,width:图片宽int,height:图片高int,bbox:str([0,1,2,3]), # gender:"male"|"female",glass:"sunglasses"|"glasses"|"none",age:年龄值int,hat:"Yes"|"No", jsonTemp=lambda args:'''{{"image_key":"{name}","video_name":"1","video_index":"{index}","width":{width},"height":{height},"face":[{{"id":1,"track_id":-1,"data":"none","struct_type":"rect","attrs":{{"gender":"{gender}","has_glasses":"none","specific_age":"{age}","has_mask":"none","Wear_a_hat":"none","occlusion":"none","ignore":"no"}}}}]}} '''.format(**ChainMap(args,jsonDefault)) # 为什么不使用json标准的空值:null # 基础 转换结果至指定json格式 def toJson(re_fileName): result = [] for j, cur_line in enumerate(open(re_fileName).readlines()): (ind,sex,age,mask,glass,sunglass,hat,img) = (i.strip() for i in cur_line.strip().split('t')) form=dict(index=int(float(ind)),name=img,width=72,height=72,gender='male' if int(float(sex))==1 else 'female',age=int(float(age))) result.append(jsonTemp(form)) return result re_fileName = 'filename.lst' ipc_train_result=toJson(re_fileName) with open('filename.json','w+') as f: for i in ipc_train_result: f.write(i)