首页 > Python资料 博客日记
Excel读写之xlrd模块
2024-09-27 19:30:04Python资料围观41次
1.1、xlrd模块介绍
xlrd:用于读取Excle数据文件将返回的数据对象放到内存中,然后查询数据文件对象的相关信息。
xlwt:用于在内存中生成新的数据文件对象,处理完成后写入到Excel数据文件中。
xlutils:主要的作用就是copy新的文件对象,在新的数据对象中完成数据处理操作。
注意:在使用 xlrd 读取 .xlsx 文件时,由于 xlrd 从版本 2.0.0 开始停止支持 .xlsx 格式,可能会遇到 xlrd.biffh.XLRDError: Excel xlsx file; not supported 的错误。
如果需要读取.xlsx文件,你可能需要安装1.2.0版本的xlrd。
1.2、xlrd操作方法汇总
1.2.1、Excel操作
1.2.1.1、打开文件
import xlrd
workbook = xlrd.open_workbook('test.xls')
print(workbook) # <xlrd.book.Book object at 0x7f592100ff50>
1.2.1.2、获取所有的表名
import xlrd
workbook = xlrd.open_workbook(r'./code/excelRead/test.xls')
# 获取所有的工作表名
sheet_names = workbook.sheet_names()
print(sheet_names) # ['sdxl', 'hzgg', 'sdyxz', 'TB2018']
# 获取所有的sheet对象
Sheets = workbook.sheets()
print(Sheets) # [Sheet 0:<sdxl>, Sheet 1:<hzgg>, Sheet 2:<sdyxz>, Sheet 3:<TB2018>]
1.2.1.3、获取指定的Sheet
import xlrd
workbook = xlrd.open_workbook(r'./code/excelRead/test.xls')
# 方式一:通过索引选取
sheet1 = workbook.sheets()[0]
print(sheet1 ) # Sheet 0:<sdxl>
# 方式二:通过索引选取
sheet2 = workbook.sheet_by_index(2)
print(sheet2) # Sheet 2:<sdyxz>
# 方式三:通过表名选取,返回一个<class 'xlrd.sheet.Sheet'>对象
sheet = workbook.sheet_by_name("hzgg")
print(sheet) # Sheet 1:<hzgg>
1.2.1.4、某个sheet是否导入完毕
# 通过索引,检查某个sheet是否导入完毕
print(workbook.sheet_loaded(0)) # True
# 通过文件名,检查某个sheet是否导入完毕
print(workbook.sheet_loaded("hzgg")) # True
1.2.2、sheet对象的基本操作
1.2.2.1、sheet表行操作
1.2.2.1.1、获取表中所有的行数
import xlrd
workbook = xlrd.open_workbook(r'./code/excelRead/test.xls')
sheet2 = workbook.sheet_by_name("hzgg")
# 特别注意,这是属性而不是方法,不加括号
print(sheet2.nrows) # 17
1.2.2.1.2、返回指定行的所有单元格数值组成的列表
1.2.2.1.3、获取某行的类型及数据
1.2.2.1.4、获取某行的类型的列表
单元类型ctype:empty为0,string为1,number为2,date为3,boolean为4, error为5(左边为类型,右边为类型对应的值)
1.2.2.1.5、以切片形式获取某行的类型及数据
1.2.2.1.6、获取某行的长度
1.2.2.1.7、获取sheet的所有行生成器
1.2.2.2、sheet表列操作
1.2.2.2.1、获取有效列数
import xlrd
workbook = xlrd.open_workbook(r'./code/excelRead/test.xls')
sheet2 = workbook.sheet_by_name("hzgg")
# 获取有效列数
print(sheet2.ncols) # 9
1.2.2.2.2、获取某列数据
1.2.2.2.3、获取某列类型
1.2.2.2.4、以切片方式获取某列类型及数据
1.2.2.3、单元格操作
1.2.2.4、单元格中的日期/时间操作
在使用xlrd读取excel时,我们常常会遇到日期格式的数据,如果我们不经过任何处理,那么我们得到会是如 45089.0、45171.0 这样的excel时间戳。那么我们该如何读取呢?这里介绍俩方法。
1.2.2.4.1、xlrd.xldate_as_tuple(xldate, datemode)
xlrd.xldate_as_tuple(xldate,datemode)
:param xldate: 要处理的单元格值,自然是excel中的日期数据
:param datemode: 使用哪条基准的时间戳(0代表1900-01-01为基准,1代表1904-01-01为基准);常使用1900为基准
返回值:返回一个元组,类似于(year,month,day,hour,minute,nearest_second)
但是,仅适用于date类型的excel单元格,不适用于time类型的单元格,对于time类型的单元格值,报错:XLDateAmbiguous
1.2.2.4.2、xlrd.xldate.xldate_as_datetime(xldate, datemode)
xlrd.xldate.xldate_as_datetime(xldate,datemode)
:param xldate: 要处理的单元格值,自然是excel中的日期数据
:param datemode: 使用哪条基准的时间戳(0代表1900-01-01为基准,1代表1904-01-01为基准);常使用1900为基准
返回值:datetime对象,格式 year-month-day hour:minute:second
但是,对于time类型的单元格值,转化后自动以基准补充;如基准选择1900时,时间 13:09:30 转化后为:1900-01-01 23:08:00
标签:
相关文章
最新发布
- 【Python】selenium安装+Microsoft Edge驱动器下载配置流程
- Python 中自动打开网页并点击[自动化脚本],Selenium
- Anaconda基础使用
- 【Python】成功解决 TypeError: ‘<‘ not supported between instances of ‘str’ and ‘int’
- manim边学边做--三维的点和线
- CPython是最常用的Python解释器之一,也是Python官方实现。它是用C语言编写的,旨在提供一个高效且易于使用的Python解释器。
- Anaconda安装配置Jupyter(2024最新版)
- Python中读取Excel最快的几种方法!
- Python某城市美食商家爬虫数据可视化分析和推荐查询系统毕业设计论文开题报告
- 如何使用 Python 批量检测和转换 JSONL 文件编码为 UTF-8
点击排行
- 版本匹配指南:Numpy版本和Python版本的对应关系
- 版本匹配指南:PyTorch版本、torchvision 版本和Python版本的对应关系
- Python 可视化 web 神器:streamlit、Gradio、dash、nicegui;低代码 Python Web 框架:PyWebIO
- 相关性分析——Pearson相关系数+热力图(附data和Python完整代码)
- Python与PyTorch的版本对应
- Anaconda版本和Python版本对应关系(持续更新...)
- Python pyinstaller打包exe最完整教程
- Could not build wheels for llama-cpp-python, which is required to install pyproject.toml-based proj