当前位置:   article > 正文

【强烈推荐】Python中JSON的基本使用(超详细)_python json

python json

1. JSON简介

JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式,它是JavaScript的子集,易于人阅读和编写。

JSON用来存储和交换文本信息,比xml更小/更快/更易解析,易于读写,占用带宽小,网络传输速度快的特性,适用于数据量大,不要求保留原有类型的情况。。

前端和后端进行数据交互,其实就是JSPython进行数据交互!

2. JSON语法规则

  1. 名称必须用双引号(即:" ")来包括
  2. 值可以是双引号包括的字符串、数字、true、false、null、JavaScript数组,或子对象
  3. 数据在name/value
  4. 数据见用逗号分隔
  5. 花括号保存对象
  6. 方括号保存数组

3. JSON数据类型

一并列举出Python与JSON数据类型的映射关系:

| Python | JSON | | --- | --- | | dict | object | | list, tuple | array | | str, unicode | string | | int, long, float | number | | True | true | | False | false | | None | null |

4. JSON对象

在花括号中书写,对象可以包含多个名称/值对。

例:

  1. {"firstname": "jonh", "lastname": "Doe"}

5. JSON数组

Employees是包含三个对象的数组。

每个对象代表一条关于某个人名的记录,在方括号中书写,数组可以包含多个对象:

  1. {
  2. "employees": [
  3. { “firstName”:“John” , “lastName”:“Doe” },
  4. { “firstName”:“Anna” , “lastName”:“Smith” },
  5. { “firstName”:“Peter” , “lastName”:“Jones” }
  6. ]
  7. }

6. JSON中常用的方法

python在使用json这个模块前,首先要导入json库:import json.

| | | | --- | --- | | 方法 | 描述 | | json.dumps() | 将 Python 对象编码成 JSON 字符串 | | json.loads() | 将已编码的 JSON 字符串解码为 Python 对象 | | json.dump() | 将Python内置类型序列化为json对象后写入文件 | | json.load() | 读取文件中json形式的字符串元素转化为Python类型 |

注意:不带s的是序列化到文件或者从文件反序列化,带s的都是内存操作不涉及持久化。

6.1 json.dumps()

  1. import json
  2. data = {'name':'nanbei','age':18}
  3. # 将Python对象编码成json字符串
  4. print(json.dumps(data))

结果:

  1. {"name": "nanbei", "age": 18}

: 在这里我们可以看到,原先的单引号已经变成双引号了

6.2 json.loads()

  1. import json
  2. data = {'name':'nanbei','age':18}
  3. # 将Python对象编码成json字符串
  4. # print(json.dumps(data))
  5. # 将json字符串解码成Python对象
  6. a = json.dumps(data)
  7. print(json.loads(a))

结果:

  1. {'name': 'nanbei', 'age': 18}

在这里举个元组和列表的例子:

  1. import json
  2. data = (1,2,3,4)
  3. data_json = [1,2,3,4]
  4. #将Python对象编码成json字符串
  5. print(json.dumps(data))
  6. print(json.dumps(data_json))
  7. #将Python对象编码成json字符串
  8. a = json.dumps(data)
  9. b = json.dumps(data_json)
  10. #将json字符串编码成Python对象
  11. print(json.loads(a))
  12. print(json.loads(b))

结果:

  1. [1, 2, 3, 4]
  2. [1, 2, 3, 4]
  3. [1, 2, 3, 4]
  4. [1, 2, 3, 4]

可以看到,元组和列表解析出来的均是数组。

由以上输出可以看出编码过程中,Python中的list和tuple都被转化成json的数组,而解码后,json的数组最终被转化成Python的list的,无论是原来是list还是tuple。

6.3 json.dump()

将Python内置类型序列化为json对象后写入文件:

  1. import json
  2. data = {
  3. 'nanbei':'haha',
  4. 'a':[1,2,3,4],
  5. 'b':(1,2,3)
  6. }
  7. with open('json_test.txt','w+') as f:
  8. json.dump(data,f)

6.4 json.load()

读取文件中json形式的字符串元素转化为Python类型:

  1. import json
  2. data = {
  3. 'nanbei':'haha',
  4. 'a':[1,2,3,4],
  5. 'b':(1,2,3)
  6. }
  7. with open('json_test.txt','w+') as f:
  8. json.dump(data,f)
  9. with open('json_test.txt','r+') as f:
  10. print(json.load(f))

结果:

  1. {'a': [1, 2, 3, 4], 'b': [1, 2, 3], 'nanbei': 'haha'}

6.5 更多实例

json.dumps():将一个Python数据类型列表编码成json格式的字符串

  1. #python的列表转换为json的数组
  2. >>> import json
  3. >>> json.dumps([1,2,3])
  4. '[1, 2, 3]'
  5. #python的字符串转换为json的字符串
  6. >>> json.dumps('abdcs')
  7. '"abdcs"'
  8. #python的元祖转换为json的数组
  9. >>> json.dumps((1,2,3,'a'))
  10. '[1, 2, 3, "a"]'#注意此时显示的是方括号
  11. #python的字典转换为json的对象
  12. >>> json.dumps({1:'a',2:'b'})
  13. '{"1": "a", "2": "b"}'#注意此时1和2转换后是加了引号的,因为json的名称是必须要加引号的
  14. #python的整数转换为json的数字
  15. >>> json.dumps(13)
  16. '13'
  17. #python的浮点数转换为json的数字
  18. >>> json.dumps(3.1415)
  19. '3.1415'
  20. #python的unicode字符串转换为json的字符串
  21. >>> json.dumps(u'a')
  22. '"a"'
  23. #python的True转换为json的数组true
  24. >>> json.dumps(True)
  25. 'true'
  26. #python的False转换为json的数组false
  27. >>> json.dumps(False)
  28. 'false'
  29. #python的None转换为json的null
  30. >>> json.dumps(None)
  31. 'null'
  32. #json本质上是一个字符串
  33. >>> type(json.dumps('abc'))
  34. <class 'str'>

dump和dumps:

  1. import json
  2. # dumps可以格式化所有的基本数据类型为字符串
  3. data1 = json.dumps([]) # 列表
  4. print(data1, type(data1))
  5. data2 = json.dumps(2) # 数字
  6. print(data2, type(data2))
  7. data3 = json.dumps('3') # 字符串
  8. print(data3, type(data3))
  9. dict = {"name": "Tom", "age": 23} # 字典
  10. data4 = json.dumps(dict)
  11. print(data4, type(data4))
  12. with open("test.json", "w", encoding='utf-8') as f:
  13. # indent 超级好用,格式化保存字典,默认为None,小于0为零个空格
  14. f.write(json.dumps(dict, indent=4))
  15. json.dump(dict, f, indent=4) # 传入文件描述符,和dumps一样的结果

得到的输出结果如下:格式化所有的数据类型为str类型:

  1. [] <class 'str'>
  2. 2 <class 'str'>
  3. "3" <class 'str'>
  4. {"name": "Tom", "age": 23} <class 'str'>

test.json中的内容:

  1. {
  2. "name": "Tom",
  3. "age": 23
  4. }

load和loads

  1. import json
  2. dict = '{"name": "Tom", "age": 23}' # 将字符串还原为dict
  3. data1 = json.loads(dict)
  4. print(data1, type(data1))
  5. with open("test.json", "r", encoding='utf-8') as f:
  6. data2 = json.loads(f.read()) # load的传入参数为字符串类型
  7. print(data2, type(data2))
  8. f.seek(0) # 将文件游标移动到文件开头位置
  9. data3 = json.load(f)
  10. print(data3, type(data3))

运行结果如下:

  1. {'name': 'Tom', 'age': 23} <class 'dict'>
  2. {'name': 'Tom', 'age': 23} <class 'dict'>
  3. {'name': 'Tom', 'age': 23} <class 'dict'>

7. 参数详解

  1. dumps(obj,skipkeys=False, ensure_ascii=True, check_circular=True,
  2. allow_nan=True, cls=None, indent=None, separators=None,
  3. default=None, sort_keys=False, **kw):

函数作用:Python对象转变成JSON对象,便于序列化内存/文件中。

参数

  • skipkeys: 如果为True的话,则只能是字典对象,否则会TypeError错误, 默认False
  • ensure_ascii: 确定是否为ASCII编码
  • check_circular: 循环类型检查,如果为True的话
  • allow_nan: 确定是否为允许的值
  • indent: 会以美观的方式来打印,呈现,实现缩进
  • separators: 对象分隔符,默认为,
  • encoding: 编码方式,默认为utf-8
  • sort_keys: 如果是字典对象,选择True的话,会按照键的ASCII码来排序

对于dump来说,只是多了一个fp参数:

简单说就是dump需要一个类似文件指针的参数(并不是真正的指针,可以称之为文件对象),与文件操作相结合,即先将Python文件对象转化为json字符串再保存在文件中。

  1. dump(obj, fp, skipkeys=False, ensure_ascii=True, check_circular=True,
  2. allow_nan=True, cls=None, indent=None, separators=None,
  3. default=None, sort_keys=False, **kw)
  4. Serialize ``obj`` as a JSON formatted stream to ``fp`` (a``.write()``-supporting file-like object).

类似Java中的class implements java.io.Serializable

Java提供了一种对象序列化的机制,该机制中,一个对象可以被表示为一个字节序列,该字节序列包括该对象的数据、有关对象的类型的信息和存储在对象中数据的类型。

8. JSON反序列化为对象

JSON反序列化为类对象或者类的实例,使用的是loads()方法中的object_hook参数:

代码示例:

  1. import json
  2. # 定义一个员工类
  3. class Employee(object):
  4. def __init__(self,name,age,sex,tel):
  5. self.name=name
  6. self.age=age
  7. self.sex=sex
  8. self.tel=tel
  9. # 实例化一个对象
  10. emp = Employee('kongsh',18,'female',13123456789)
  11. # 定义JSON转换Python实例的函数
  12. def jsonToClass(emp):
  13. return Employee(emp['name'], emp['age'], emp['sex'], emp['tel'])
  14. # 定义一个json字符串(字典)
  15. json_str = '{"name": "kongsh", "age": 18, "sex": "female", "tel": 13123456789}'
  16. emp = json.loads(json_str, object_hook=jsonToClass)
  17. print (emp)
  18. print(emp.name)

结果展示:

9. 常见的错误

9.1 读取多行的JSON文件

假如要读取一个多行的JSON文件:

  1. {"坂": ["坂5742"]}
  2. {"构": ["构6784"]}
  3. {"共": ["共5171"]}
  4. {"钩": ["钩94a9"]}
  5. {"肮": ["肮80ae"]}
  6. {"孤": ["孤5b64"]}

如果直接使用:

  1. with open(json_path, 'r') as f:
  2. json_data = json.load(f)

就会报错:抛出异常JSONDecodeError

json.decoder.JSONDecodeError: Extra data: line 2 column 1 (char 17)

表示数据错误,数据太多,第2行第一列

因为json只能读取一个文档对象,有两个解决办法

  1. 单行读取文件,一次读取一行文件。
  2. 保存数据源的时候,格式写为一个对象(dump)。

1. 单行读取文件:

  1. with open(json_path, 'r') as f:
  2. for line in f.readlines():
  3. json_data = json.loads(line)

但是这种做法还有个问题,如果JSON文件中包含空行,还是会抛出JSONDecodeError异常。

  1. json.decoder.JSONDecodeError: Expecting value: line 2 column 1 (char 1)

可以先处理空行,再进行文件读取操作:

  1. for line in f.readlines():
  2. line = line.strip() # 使用strip函数去除空行
  3. if len(line) != 0:
  4. json_data = json.loads(line)

2. 合并为一个对象:

将json文件处理成一个对象文件(序列化):

  1. {"dict": [
  2. {"坂": ["坂5742"]},
  3. {"构": ["构6784"]},
  4. {"共": ["共5171"]},
  5. {"钩": ["钩94a9"]},
  6. {"肮": ["肮80ae"]},
  7. {"孤": ["孤5b64"]}
  8. ]}

然后再用:

  1. with open(json_path, 'r') as f:
  2. json_data = json.loads(f.read())

9.2 控制台乱码

  1. # ensure_ascii=False 表示在控制台能够显示中文
  2. json_str = json.dumps(center_data_list, ensure_ascii=False)

10. 总结

  • json.dumps 将 Python 对象编码成 JSON 字符串
  • json.loads 将已编码的 JSON 字符串解码为 Python 对象
  • json.dump和json.load,需要传入文件描述符,加上文件操作。
  • json内部的格式要注意,一个好的格式能够方便读取,可以用indent格式化。

个人总结:

  • dump:存入的实例对象object(序列化)
  • dumps:存入的JSON的字符串数据
  • load:读取的实例对象object(反序列化)
  • loads:读取的JSON的字符串数据,转化为Python字典对象

参考 【强烈推荐】Python中JSON的基本使用(超详细)

摘自大佬博客的内容,感觉很有意思,很逗呀!(* ̄︶ ̄)

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/IT小白/article/detail/191225
推荐阅读
相关标签
  

闽ICP备14008679号