首页 > Python资料 博客日记
python json jsonl 的用法
2024-09-20 04:00:06Python资料围观72次
JSON
JSON(JavaScript Object Notation)是一种轻量级的数据交换格式,广泛用于在客户端和服务器之间传输数据。以下是 Python 中使用 JSON 的一些常见用法:
1. 将 Python 对象转换为 JSON 字符串
使用 json.dumps()
函数将 Python 对象(如字典、列表等)转换为 JSON 字符串。
import json
# Python 字典
data = {
"name": "Alice",
"age": 30,
"city": "New York",
"skills": ["Python", "Machine Learning"]
}
# 转换为 JSON 字符串
json_str = json.dumps(data)
print(json_str)
输出示例:
{"name": "Alice", "age": 30, "city": "New York", "skills": ["Python", "Machine Learning"]}
2. 将 JSON 字符串解析为 Python 对象
使用 json.loads()
函数将 JSON 字符串解析为 Python 对象(如字典、列表等)。
json_str = '{"name": "Alice", "age": 30, "city": "New York", "skills": ["Python", "Machine Learning"]}'
# 将 JSON 字符串解析为 Python 字典
data = json.loads(json_str)
print(data)
输出示例:
{'name': 'Alice', 'age': 30, 'city': 'New York', 'skills': ['Python', 'Machine Learning']}
3. 将 Python 对象写入 JSON 文件
使用 json.dump()
函数将 Python 对象写入到 JSON 文件中。
import json
data = {
"name": "Alice",
"age": 30,
"city": "New York",
"skills": ["Python", "Machine Learning"]
}
# 将 Python 对象写入 JSON 文件
with open('data.json', 'w') as json_file:
json.dump(data, json_file)
4. 从 JSON 文件读取数据
使用 json.load()
函数从 JSON 文件中读取数据并解析为 Python 对象。
import json
# 从 JSON 文件读取数据
with open('data.json', 'r') as json_file:
data = json.load(json_file)
print(data)
输出示例:
{'name': 'Alice', 'age': 30, 'city': 'New York', 'skills': ['Python', 'Machine Learning']}
5. 自定义 JSON 编码
如果你有自定义的类对象并想要将其转换为 JSON,可以通过实现自定义的编码器:
import json
class Employee:
def __init__(self, name, age, position):
self.name = name
self.age = age
self.position = position
# 自定义的 JSON 编码器
def encode_employee(obj):
if isinstance(obj, Employee):
return {'name': obj.name, 'age': obj.age, 'position': obj.position}
raise TypeError(f"Object of type {obj.__class__.__name__} is not JSON serializable")
# 创建 Employee 对象
employee = Employee("John", 28, "Software Engineer")
# 使用自定义编码器将对象转换为 JSON 字符串
json_str = json.dumps(employee, default=encode_employee)
print(json_str)
输出示例:
{"name": "John", "age": 28, "position": "Software Engineer"}
6. 格式化 JSON 输出
使用 json.dumps()
时,可以通过 indent
参数生成格式化的 JSON 字符串,便于阅读。
import json
data = {
"name": "Alice",
"age": 30,
"city": "New York",
"skills": ["Python", "Machine Learning"]
}
# 生成格式化的 JSON 字符串
json_str = json.dumps(data, indent=4)
print(json_str)
输出示例:
{
"name": "Alice",
"age": 30,
"city": "New York",
"skills": [
"Python",
"Machine Learning"
]
}
7. 处理复杂对象
如果需要序列化更复杂的对象,可以通过自定义 JSONEncoder
类来处理。
import json
class Employee:
def __init__(self, name, age, position):
self.name = name
self.age = age
self.position = position
class EmployeeEncoder(json.JSONEncoder):
def default(self, obj):
if isinstance(obj, Employee):
return {'name': obj.name, 'age': obj.age, 'position': obj.position}
return super().default(obj)
employee = Employee("John", 28, "Software Engineer")
# 使用自定义的编码器将对象转换为 JSON 字符串
json_str = json.dumps(employee, cls=EmployeeEncoder)
print(json_str)
输出示例:
{"name": "John", "age": 28, "position": "Software Engineer"}
JSONL
JSONL(JSON Lines)是一种简单的文件格式,专门用于存储多个JSON对象,每个对象占用一行。JSONL文件的扩展名通常为 .jsonl
或 .ndjson
(Newline Delimited JSON)。这种格式在处理大量结构化数据时非常有效,因为它允许逐行读取和处理数据。
下面是JSONL的常见用法示例,包括如何在Python中读取和写入JSONL格式的数据。
1. JSONL 文件的结构
一个JSONL文件可能看起来如下:
{"name": "Alice", "age": 30, "city": "New York"}
{"name": "Bob", "age": 25, "city": "Los Angeles"}
{"name": "Charlie", "age": 35, "city": "Chicago"}
每一行都是一个有效的JSON对象,行与行之间用换行符 \n
分隔。
2. 读取 JSONL 文件
使用Python读取JSONL文件时,可以逐行处理文件中的JSON对象:
import json
# 读取 JSONL 文件
with open('data.jsonl', 'r') as jsonl_file:
for line in jsonl_file:
# 解析每一行的 JSON 对象
data = json.loads(line)
print(data)
输出示例:
{'name': 'Alice', 'age': 30, 'city': 'New York'}
{'name': 'Bob', 'age': 25, 'city': 'Los Angeles'}
{'name': 'Charlie', 'age': 35, 'city': 'Chicago'}
3. 写入 JSONL 文件
写入JSONL文件时,可以逐行将多个JSON对象写入文件,每个对象占用一行:
import json
# 准备要写入的多个 JSON 对象
data_list = [
{"name": "Alice", "age": 30, "city": "New York"},
{"name": "Bob", "age": 25, "city": "Los Angeles"},
{"name": "Charlie", "age": 35, "city": "Chicago"}
]
# 写入 JSONL 文件
with open('data.jsonl', 'w') as jsonl_file:
for data in data_list:
jsonl_file.write(json.dumps(data) + '\n')
4. 追加写入 JSONL 文件
如果需要追加数据到已有的JSONL文件中,可以使用追加模式 'a'
:
import json
# 要追加写入的 JSON 对象
new_data = {"name": "Diana", "age": 28, "city": "Houston"}
# 追加写入 JSONL 文件
with open('data.jsonl', 'a') as jsonl_file:
jsonl_file.write(json.dumps(new_data) + '\n')
5. 处理大数据集
由于JSONL格式允许逐行读取和处理数据,特别适合用于处理大数据集。比如当数据量较大时,可以用下面的方式逐行读取并处理,而不需要将整个文件一次性加载到内存中:
import json
# 逐行处理大数据集
with open('large_data.jsonl', 'r') as jsonl_file:
for line in jsonl_file:
data = json.loads(line)
# 对每一行的数据进行处理
process_data(data)
6. 与Pandas集成
如果你需要将JSONL文件的数据加载到Pandas DataFrame中,Pandas的 read_json
方法也支持读取JSONL格式的数据:
import pandas as pd
# 使用 Pandas 读取 JSONL 文件
df = pd.read_json('data.jsonl', lines=True)
print(df)
输出示例:
name age city
0 Alice 30 New York
1 Bob 25 Los Angeles
2 Charlie 35 Chicago
总结
JSONL格式是一种非常实用的数据存储格式,特别适合处理大型、结构化的数据集。使用它的主要优点包括:
- 逐行读取:有效处理大文件,节省内存。
- 简便性:每一行都是独立的JSON对象,便于解析和处理。
- 灵活性:可以很容易地将数据追加到已有文件中。
通过上述方法,您可以轻松地在Python中读取、写入和处理JSONL格式的数据。
标签:
相关文章
最新发布
- 光流法结合深度学习神经网络的原理及应用(完整代码都有Python opencv)
- Python 图像处理进阶:特征提取与图像分类
- 大数据可视化分析-基于python的电影数据分析及可视化系统_9532dr50
- 【Python】入门(运算、输出、数据类型)
- 【Python】第一弹---解锁编程新世界:深入理解计算机基础与Python入门指南
- 华为OD机试E卷 --第k个排列 --24年OD统一考试(Java & JS & Python & C & C++)
- Python已安装包在import时报错未找到的解决方法
- 【Python】自动化神器PyAutoGUI —告别手动操作,一键模拟鼠标键盘,玩转微信及各种软件自动化
- Pycharm连接SQL Sever(详细教程)
- Python编程练习题及解析(49题)
点击排行
- 版本匹配指南:Numpy版本和Python版本的对应关系
- 版本匹配指南:PyTorch版本、torchvision 版本和Python版本的对应关系
- Python 可视化 web 神器:streamlit、Gradio、dash、nicegui;低代码 Python Web 框架:PyWebIO
- 相关性分析——Pearson相关系数+热力图(附data和Python完整代码)
- Anaconda版本和Python版本对应关系(持续更新...)
- Python与PyTorch的版本对应
- Windows上安装 Python 环境并配置环境变量 (超详细教程)
- Python pyinstaller打包exe最完整教程