import pickle
 
# 创建一个字典对象
data = {'name': 'Alice', 'age': 30, 'city': 'New York'}
 
# 序列化
with open('data.pkl', 'wb') as file:
    pickle.dump(data, file)
 
# 反序列化
with open('data.pkl', 'rb') as file:
    loaded_data = pickle.load(file)
 
print(loaded_data)  # 输出: {'name': 'Alice', 'age': 30, 'city': 'New York'}

2.2 `json`模块

json模块用于处理JSON格式的数据。它适用于轻量级数据交换，且支持跨语言。

2.2.1 使用示例


import json
 
# 创建一个字典对象
data = {'name': 'Alice', 'age': 30, 'city': 'New York'}
 
# 序列化
with open('data.json', 'w') as file:
    json.dump(data, file)
 
# 反序列化
with open('data.json', 'r') as file:
    loaded_data = json.load(file)
 
print(loaded_data)  # 输出: {'name': 'Alice', 'age': 30, 'city': 'New York'}

2.3 `yaml`模块

yaml模块是处理YAML格式的库，YAML格式更加人性化，适合配置文件。

2.3.1 使用示例


import yaml
 
# 创建一个字典对象
data = {'name': 'Alice', 'age': 30, 'city': 'New York'}
 
# 序列化
with open('data.yaml', 'w') as file:
    yaml.dump(data, file)
 
# 反序列化
with open('data.yaml', 'r') as file:
    loaded_data = yaml.load(file, Loader=yaml.FullLoader)
 
print(loaded_data)  # 输出: {'name': 'Alice', 'age': 30, 'city': 'New York'}

2.4 `marshal`模块

marshal用于读写Python的内建数据类型，主要用于Python内部的实现，不推荐用于序列化用户数据。

3. 实战案例：配置文件管理

在实际工作中，配置文件的序列化与反序列化非常常见。我们将创建一个简单的程序来管理应用程序的配置。

3.1 创建配置管理类


import json
import os
 
class ConfigManager:
    def __init__(self, config_file='config.json'):
        self.config_file = config_file
        self.config = {}
        self.load_config()
 
    def load_config(self):
        if os.path.exists(self.config_file):
            with open(self.config_file, 'r') as file:
                self.config = json.load(file)
        else:
            self.config = {}
 
    def save_config(self):
        with open(self.config_file, 'w') as file:
            json.dump(self.config, file)
 
    def set_value(self, key, value):
        self.config[key] = value
        self.save_config()
 
    def get_value(self, key):
        return self.config.get(key, None)
 
# 使用示例
config = ConfigManager()
config.set_value('app_mode', 'production')
print(config.get_value('app_mode'))  # 输出: 'production'

4. 注意事项与常见问题

4.1 安全性问题

不信任的数据：使用pickle反序列化来自不信任来源的数据可能导致安全风险。尽量使用json或其他安全格式。

4.2 版本兼容性

数据结构变化：在软件迭代过程中，数据结构可能发生变化。在反序列化时，需注意处理旧版本数据的兼容性。

4.3 性能考虑

4.3.1 序列化速度

Pickle：在序列化复杂的Python对象（如自定义类、集合等）时，pickle的速度通常较快，因为它直接支持多种Python对象类型，并能够有效地处理复杂的对象图。
JSON：在序列化简单数据结构（如字典、列表、基础数据类型）时，json的速度也很快，但对于复杂对象（如自定义类），需要先将其转换为基本的数据结构，这会影响性能。

4.3.2 序列化后的文件大小

Pickle：序列化后的数据通常比JSON格式更大。pickle包含了对象的元信息，这使得数据的体积更大，但它能更精确地保留Python对象的类型信息。
JSON：生成的文件通常较小，因为它只保留了数据本身，不包含对象类型信息。这使得JSON在存储和传输效率上更具优势，尤其在网络通信中。

4.3.3 使用场景

Pickle

优势：
- 能够序列化几乎所有Python对象，包括自定义类、函数和复杂数据结构。
- 反序列化后对象的类型和状态完全保留。
劣势：
- 输出的文件通常体积较大。
- 不安全：反序列化不受信任的数据可能会导致安全风险（执行任意代码）。
- 仅限于Python，其他语言不易解析。

JSON

优势：
- 输出文件体积较小，易于传输和存储。
- 格式简单，易于阅读，且人类可读性强。
- 跨语言支持广泛，几乎所有编程语言都支持JSON格式。
劣势：
- 仅支持基本的数据类型（字符串、数字、布尔值、列表、字典），不支持复合对象和自定义类。
- 在序列化复杂对象时需要手动转换为基本类型，可能影响性能。

4.3.4性能测试示例

我们可以用以下简单的代码来测试pickle和json的序列化和反序列化性能。


import pickle
import json
import time
 
# 创建一个复杂的Python对象
data = {
    'name': 'Alice',
    'age': 30,
    'friends': ['Bob', 'Charlie'],
    'attributes': {'height': 170, 'weight': 65},
    'is_student': False
}
 
# Pickle性能测试
start_time = time.time()
pickle_data = pickle.dumps(data)
pickle_duration = time.time() - start_time
 
start_time = time.time()
unpickled_data = pickle.loads(pickle_data)
unpickle_duration = time.time() - start_time
 
print(f"Pickle - Serialization time: {pickle_duration:.6f}s, Deserialization time: {unpickle_duration:.6f}s")
 
# JSON性能测试
start_time = time.time()
json_data = json.dumps(data)
json_duration = time.time() - start_time
 
start_time = time.time()
unjsoned_data = json.loads(json_data)
unjson_duration = time.time() - start_time
 
print(f"JSON - Serialization time: {json_duration:.6f}s, Deserialization time: {unjson_duration:.6f}s")

选择Pickle：当你需要序列化复杂的Python对象，且只在Python环境中使用时，pickle是更合适的选择。
选择JSON：当你需要跨语言传输数据或希望保持数据的可读性时，JSON更为合适。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/喵喵爱编程/article/detail/923546