首页 > Python资料 博客日记

python的csv库常用操作

2024-11-01 04:00:05Python资料围观6

Python资料网推荐python的csv库常用操作这篇文章给大家,欢迎收藏Python资料网享受知识的乐趣

        csv 模块是 Python 标准库中的一个模块,用于处理 CSV(逗号分隔值)文件。它提供了简单易用的功能来读取和写入 CSV 文件。以下是一些常用的操作:

一、读取 CSV 文件

新建文件data.csv,内容如下:

使用 csv.reader 读取CSV 文件

使用reader之前先要使用python的内置标准函数open()打开文件。open()的用法见:

python的open()函数-CSDN博客

import csv

with open('data.csv', mode='r', newline='') as file:
    

 csv.reader(file) 创建的 reader 对象是一个迭代器,用于逐行读取 CSV 文件中的数据。reader 对象的格式是一个生成器对象,每次迭代返回一行数据,每一行数据以列表的形式呈现,每个列表元素对应 CSV 文件中的一个字段(单元格)。

逐行打印reader数据:

import csv

with open('data.csv', mode='r', newline='') as file:
    reader = csv.reader(file)
    
    for row in reader:
        print(row)
打印输出结果:
['line0_0', 'line0_1', 'line0_2', 'line0_3', 'line0_4', 'line0_5']
['line1_0', 'line1_1', 'line1_2', 'line1_3', 'line1_4', 'line1_5']
['line2_0', 'line2_1', 'line2_2', 'line2_3', 'line2_4', 'line2_5']
['line3_0', 'line3_1', 'line3_2', 'line3_3', 'line3_4', 'line3_5']
['line4_0', 'line4_1', 'line4_2', 'line4_3', 'line4_4', 'line4_5']
['line5_0', 'line5_1', 'line5_2', 'line5_3', 'line5_4', 'line5_5']

 将reader数据转换为列表:

import csv

with open('data.csv', mode='r', newline='') as file:
    reader = csv.reader(file)
    
    csv_data = list(reader)
打印输出结果:
[['line0_0', 'line0_1', 'line0_2', 'line0_3', 'line0_4', 'line0_5'], ['line1_0', 'line1_1', 'line1_2', 'line1_3', 'line1_4', 'line1_5'], ['line2_0', 'line2_1', 'line2_2', 'line2_3', 'line2_4', 'line2_5'], ['line3_0', 'line3_1', 'line3_2', 'line3_3', 'line3_4', 'line3_5'], ['line4_0', 'line4_1', 'line4_2', 'line4_3', 'line4_4', 'line4_5'], ['line5_0', 'line5_1', 'line5_2', 'line5_3', 'line5_4', 'line5_5'], ['', '', '', '', '', ''], ['', '', '', '', '', ''], ['', '', '', '', '', ''], ['', '', '', '', '', ''], ['', '', '', '', '', '']]

csv.reader 对象的特性


返回类型:csv.reader 对象的每一项是一个列表,每个列表表示 CSV 文件中的一行数据。列表中的元素是每个字段的值。

迭代方式:csv.reader 是一个迭代器,可以使用 for 循环逐行遍历 CSV 文件。

默认分隔符:csv.reader 默认使用逗号(,)作为字段分隔符,但你可以通过设置 delimiter 参数来使用其他分隔符,如分号(;)。 

reader = csv.reader(file, delimiter=';')

引号处理:csv.reader 可以处理字段中的引号。默认情况下,它会将被引号括起来的字段视为一个单独的字段,并自动处理字段中的引号和转义字符。

reader = csv.reader(file, quotechar='"')

 例如,data.csv的内容如下:

import csv

with open('data.csv', newline='', encoding='gbk') as csvfile:
    reader = csv.reader(csvfile, quotechar='"')
    for row in reader:
        print(row)

 输出结果:

['A', 'B']
['A,B']

 在这个例子中,第一行中的逗号是字段之间的分隔符,第二行的逗号被双引号包围,这个逗号不被解释为字段之间的分隔符,而是作为一个字段中的字符存在。

转义符:escapechar
escapechar 参数用于指定一个转义字符。在 CSV 文件中,如果某个字段中包含了 quotechar 指定的字符,并且您不希望这个字符被解释为字段的边界,您可以使用 escapechar 来转义它。转义字符通常出现在要转义的字符之前,表示该字符应该按字面意义解释,而不是作为特殊字符。

​ 

import csv

with open('data.csv', newline='', encoding='gbk') as csvfile:
    reader = csv.reader(csvfile, quotechar='"', escapechar='\\')
    for row in reader:
        print(row)

输出结果:

['Trunpm', '30', 'He said, "Hello!"']

 He said前面的双引号和末尾的双引号,由于没有转义符,就被识别为字段的边界。而Hello!处的双引号有转义符,就被识别为字符双引号。

当然,除了"\",也可以使用别的字符作为转义符。例如:

import csv

with open('data.csv', newline='', encoding='gbk') as csvfile:
    reader = csv.reader(csvfile, quotechar='"', escapechar='#')
    for row in reader:
        print(row)

输出结果相同。

csv.DictReader

使用 csv.DictReader 从 CSV 文件中读取数据,并将每一行数据转换为字典格式。

读CSV 文件并将其转换为字典的示例:

import csv

# 打开 CSV 文件进行读取
with open('output.csv', mode='r', newline='') as file:
    # 创建 DictReader 对象
    reader = csv.DictReader(file)
    
    # 读取数据并打印
    for row in reader:
        print(row)

二、写入csv文件

使用 csv.writer 写入

import csv

data = [
    ["Name", "Age", "City"],
    ["Alice", "30", "New York"],
    ["Bob", "25", "Los Angeles"]
]

with open('output.csv', mode='w', newline='') as file:
    writer = csv.writer(file)
    writer.writerows(data)

csv.writer(file):创建一个 CSV 写入器对象。
writer.writerows(data):将 data 中的所有行写入 CSV 文件。

基本的写入和读取

import csv

# 读取
with open('data.csv', mode='r', newline='') as file:
    reader = csv.reader(file)
    data = list(reader)

# 写入
with open('output.csv', mode='w', newline='') as file:
    writer = csv.writer(file)
    writer.writerows(data)

# 再次读取
with open('output.csv', mode='r', newline='') as file:
    reader = csv.reader(file)
    data = list(reader)
    print(data)

使用 csv.DictWriter 写入

import csv

fieldnames = ['Name', 'Age', 'City']
data = [
    {'Name': 'Alice', 'Age': '30', 'City': 'New York'},
    {'Name': 'Bob', 'Age': '25', 'City': 'Los Angeles'}
]

with open('output.csv', mode='w', newline='') as file:
    writer = csv.DictWriter(file, fieldnames=fieldnames)
    writer.writeheader()
    writer.writerows(data)

csv.DictWriter(file, fieldnames=fieldnames):创建一个字典写入器对象。fieldnames 指定了字典的键的顺序。
writer.writeheader():写入 CSV 文件的头部(列名)。
writer.writerows(data):将字典数据写入 CSV 文件。

读和写的demo:

import csv

fieldnames = ['Name', 'Age', 'City']
data = [
    {'Name': 'Alice', 'Age': '30', 'City': 'New York'},
    {'Name': 'Bob', 'Age': '25', 'City': 'Los Angeles'}
]

with open('output.csv', mode='w', newline='') as file:
    writer = csv.DictWriter(file, fieldnames=fieldnames)
    writer.writeheader()
    writer.writerows(data)

with open('output.csv', mode='r', newline='') as file:
    reader = csv.DictReader(file)
    data = list(reader)
    print(data)

 输出结果:

[{'Name': 'Alice', 'Age': '30', 'City': 'New York'}, {'Name': 'Bob', 'Age': '25', 'City': 'Los Angeles'}]

三、不同的分隔符

CSV 文件的分隔符默认是逗号(,),但有时候需要使用其他分隔符,例如分号(;)。可以通过设置 delimiter 参数来指定不同的分隔符。

import csv

# 读取使用分号作为分隔符的 CSV 文件
with open('input.csv', mode='r', newline='') as file:
    reader = csv.reader(file, delimiter=';')
    for row in reader:
        print(row)

# 写入使用分号作为分隔符的 CSV 文件
with open('output.csv', mode='w', newline='') as file:
    writer = csv.writer(file, delimiter=';')
    writer.writerows(data)


版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:jacktools123@163.com进行投诉反馈,一经查实,立即删除!

标签:

相关文章

本站推荐