首页 > Python资料 博客日记
Python——Pandas库,超详细教程
2025-01-16 11:30:10Python资料围观12次
前言
1、Python的Pandas是一个基于Python构建的开源数据分析库,它提供了强大的数据结构和运算功能。
2、
-
Series:一维数组,类似于Numpy中的一维array,但具有索引标签,可以保存不同类型的数据,如字符串、布尔值、数字等。
-
DataFrame:二维表格型数据结构,与SQL表或Excel工作表类似,每列可以是不同的数据类型(如数值、字符串或日期),并且具有列名和行索引。DataFrame是Pandas的核心数据结构,提供了丰富的数据操作方法。
接下来我们将逐步介绍他的用法
一、导入Pandas库
简写为pd
import pandas as pd
二、使用Series,创建一维数组
从0开始存储
三、index查看下标,values查看下标的值
注意:不知道标签和下标的区别请看目录五的解释
1、index的输出类似于range:
start代表起始标签;stop代表结束标签(不会到这个值,到n-1值);step代表步长。
2、valuses:
直接查看下标的值,记得是重0开始的值
四、使用index指定标签
注意:可以看到数组中1的标签不是默认值0了,而是标签5,如果利用想输出下标0,这时候会报错,我们要使用到 “iloc“ and ” loc“,请看五
五、iloc and loc的使用
解释:
1、iloc是原下标,也就是默认值,计算机的记忆
2、loc是修改过的下标,我们把他叫作标签,标签是由我们自主给的,计算机并不会自己产生
可以看到计算机的下标1的值是2
可以看到我们给的标签1的值是5
六、创建对象
1、这里的我们所理解的键其实就是数据的标签,大部分的人可能会理解为这里是一个字典或者一个数组,其实都不是,是一个一维数据
2、什么是键?如果不知道,就需要回头学习python基础了。
键是字典的一个解释,前键后值,称为键值对,如下的:“键”:值
3、修改数据
使用loc,找标签“小张”让他的值等于95,可以看到被修改了
4、筛选数据
这里的&就是python,and的意思
七、两个数据相加、相减、相乘、相除
1、相加——add
可以看到需要链接s1,如果没有s1,那会导致数据相加错误,出现NaN;
这个时候,我们应该使用add:
在s1的基础上add(s2,fill_value = “如果出现没有值的情况,以0代替”)
2、相减——sub
3、相乘——mul
4、相除——div
八、求最大值、最小值、求和值、平均值
九、describe() —— 数据分析方法
十、apply() —— 定义函数判断数据
apply()对数据批量处理
十一、DataFrame —— 创建二维数组
十二、修改标签
标签名要统一,否则会报错;但是可以缺少,但数据也要缺少,一一对应
特别:标签会自动排序好
十二、查看标签(行属性)
十三、查看列属性
十四、查看数据
十五、数据颠倒——行列调换
十六、提取数据(列)
1、查看班级数据
2、查看成绩数据
3、查看学号和成绩,这里我们需要再加一个【】,如果不加会报错
十七、提取数据(行)
注意:loc和iloc的区别
十八、切片操作
1、标签切片
2、下标切片
注意:3是终止,并不会执行,如果想小红到小丽,需要 [1:4]
3、行列切片——标签
4、行列切片——下标
十九、筛选——判断、提取数据
1、单单判断数据,输出布尔值
2、判断完数据并提取数据,输出数据
二十、查看前几行数据——数据量庞大可使用
注意:如果head()不输入任何的值,那他的默认值为5,输出前5行数据
二十一、drop搭配axis用法
我们先导入要使用的数据
添加考试4的数据
drop:就是删除的意思
axis:用来指定是行还是列
可以看到删除了行的002和004
可以看到删除了列的考试2和考试4
二十二、两个数据相加
1、student的数据请看目录二十一
2、先定于一个数据bonus,让他们两个相加
3、注意:运行一次相加一次;标签要一一对应,否则会导致数据错误。
相加完之后不会改变原数据,如果需要改变原数据,全部都是要重新赋值
实现重新赋值,以考试4位例
二十三、案例实操——求出平均值
mean(axis=1):求平均值每一行。
这里可能会导致理解冲突,上面解释axis=0代表行,axis=1代表列,但是mean(axis=1)为什么代表的是行???请看下面的解释
可以理解为如果被包含,则方向相反。
行对列操作
列对行操作
二十四、案例实操——筛选出第二大的数据
1、loc[:,"考试1":"考试3"] 其实就是 loc["001":"006","考试1":"考试3"]
2、lambda x:定义匿名函数x
3、np.sort(x):使用numpy库的sort方法,进行升序
4、np.sort(x)[-2]:升序完后提取倒数第二个值,也就是第二大的值,然后返回匿名函数x
标签:
相关文章
最新发布
- 光流法结合深度学习神经网络的原理及应用(完整代码都有Python opencv)
- Python 图像处理进阶:特征提取与图像分类
- 大数据可视化分析-基于python的电影数据分析及可视化系统_9532dr50
- 【Python】入门(运算、输出、数据类型)
- 【Python】第一弹---解锁编程新世界:深入理解计算机基础与Python入门指南
- 华为OD机试E卷 --第k个排列 --24年OD统一考试(Java & JS & Python & C & C++)
- Python已安装包在import时报错未找到的解决方法
- 【Python】自动化神器PyAutoGUI —告别手动操作,一键模拟鼠标键盘,玩转微信及各种软件自动化
- Pycharm连接SQL Sever(详细教程)
- Python编程练习题及解析(49题)
点击排行
- 版本匹配指南:Numpy版本和Python版本的对应关系
- 版本匹配指南:PyTorch版本、torchvision 版本和Python版本的对应关系
- Python 可视化 web 神器:streamlit、Gradio、dash、nicegui;低代码 Python Web 框架:PyWebIO
- 相关性分析——Pearson相关系数+热力图(附data和Python完整代码)
- Anaconda版本和Python版本对应关系(持续更新...)
- Python与PyTorch的版本对应
- Windows上安装 Python 环境并配置环境变量 (超详细教程)
- Python pyinstaller打包exe最完整教程