首页 > Python资料 博客日记
【Python】NumPy(一):数据类型、创建数组及基本操作
2024-10-24 13:00:05Python资料围观80次
目录
NumPy初识
1.什么是NumPy?
NumPy作为数据分析的三剑客之一,是Python中用于科学计算和数据分析的一个开源扩展库,包含了一个强大的N维数组对象和一组函数,可以用来处理各种数组和矩阵运算。NumPy的核心是ndarray对象,是一个功能强大的N维数组对象,封装了n维同类数组,与Python内置的列表相比,NumPy数组的计算速度更快,适合处理大量的数据。
NumPy的应用
NumPy通常与SciPy(算法库)、Pandas(数据分析库)和Matplotlib(绘图库)一起使用。这种组合广泛应用于替代MatLab,进行数据分析或者机器学习。
NumPy数据类型
NumPy支持的数据类型要比Python内置的数据类型要多,基本上可以和C语言的数据类型对应,我们先来回顾一下Python的基本数据类型。
Python基本数据类型
在python中,支持的数字类型有以下5种:
类型 | 说明 |
int | 整型,通常为int32或int64 |
long | 仅在Python2中存在 |
float | 浮点型 |
bool | 布尔型 |
complex | 复数型 |
NumPy数据类型
NumPy支持的数值类型更多,有以下:
类型 | 说明 |
bool_ | 布尔型数据类型(True或者False) |
int_ | 默认的整数类型(类似C语言中的long,int32或int64) |
intc | 与C的int类型一样,一般是int32或int64 |
intp | 用于索引的整数类型(类似C的ssize_t,一般情况下仍然是int32或int64) |
int8 | 字节(-128 ~ 127) |
int16 | 整数(-32768 ~ 32767) |
int32 | 整数(-2147483648 ~ 2147483647) |
int64 | 整数(-9223372036854775808 ~ 9223372036854775807) |
uint8 | 无符号整数(0 ~ 255) |
unit16 | 无符号整数(0 ~ 65535) |
uint32 | 无符号整数(0 ~4294967295) |
uint64 | 无符号整数(0 ~18446744073709551615) |
float_ | float64类型的缩写 |
float16 | 半精度浮点数,包括:1 个符号位,5 个指数位,10 个尾数位 |
float32 | 单精度浮点数,包括:1 个符号位,8 个指数位,23 个尾数位 |
float64 | 双精度浮点数,包括:1 个符号位,11 个指数位,52 个尾数位 |
complex_ | complex128 类型的简写,即 128 位复数 |
complex64 | 复数,表示双 32 位浮点数(实数部分和虚数部分) |
complex128 | 复数,表示双 64 位浮点数(实数部分和虚数部分) |
Numpy的这些数值类型都归于 dtype对象实例中。我们可以用 numpy.dtype(object,align,copy)来指定数据类型。若我们使用array,则可以在创建数组的同时,用 dtype= 参数来指定类型。
我们来看例子:
# 将所需要用到的Numpy导入
import numpy as np
# 利用NumPy中的array来创建数组,同时指定类型为int8
arr = np.array([1,2,3,4],dtype=np.int8)
# 查看数组同时查看类型
print(arr,arr.dtype)
# 如果想更改数组的类型,可以使用变量名.astype(type)
arr=arr.astype('float')
# 查看数组同时查看类型
print(arr,arr.dtype)
如果我们想要更改数组的数据类型,那么我们可以使用 数组名.astype('type') 的方式来更改,同时需要让数组重新接收一下返回的数组。
输出如下:
[1 2 3 4] int8
[1. 2. 3. 4.] float64
NumPy数组
在Numpy中,最核心的一个就是ndarray多维数组对象。区别于Python的标准类,有着处理高维数组的能力,也是数值计算中缺一不可的重要特性。
ndarray类具有以下6个参数:
- shape:数组的形状;
- dtype:数据类型;
- buffer:对象暴露缓存区接口;
- offset:偏移量;
- strides:步长;
- order:{‘C’,‘F’},以行或列为主排列顺序。
创建数组
在NumPy中,创建 ndarray的方式有很多种,这里我们讲下常见的几种
1.使用numpy.array()
array中的参数:
array(object,dtype=None,copy=True,order=None,subok=False,ndmin=0)
- object:表示一个数组序列。列表、元组等;
- dtype:可选参数,通过它可以改变数组的数据类型;
- copy:可选参数,当数据源是ndarray时,表示数组能否被复制,默认是True。
- order:可选参数,以哪种内存布局创建数组,有3个可选值:C(行序列)、 F(列序列)、 A(默认);
- ndmin:可选参数,用于指定数组的维度;
- subok:可选参数,类型为bool值,默认是False。为True,使用object的内部数类型;False:使用object数组的数据类型。
示例:
# 创建一个一维数组
arr = np.array([1,2,3,4,5])
print('arr:',arr)
# 创建一个二维数组
arr2 = np.array([
[1,2,3],
[4,5,6]
])
print('arr2:',arr2)
#也可以使用元组
arr3 = np.array([
(1,2,3,4),
(5,6,7,8)
])
print('arr3:',arr3)
结果:
arr: [1 2 3 4 5]
arr2: [[1 2 3]
[4 5 6]]
arr3: [[1 2 3 4]
[5 6 7 8]]
2.使用arange()方法创建
除了上述的array(),我们还可以使用arange()方法来创建,
numpy.arange(start,stop,step,dtype)
- stop:起始值,默认为0;
- stop:终止值(不包含)
- step:步长,即每次+/-的长度,默认1;
- dtype:返回ndarray的数据类型,如果没提供,会使用输入数据的类型。
示例:
# 若arange中的参数只有一个,说明要生成以步长为1,范围在[0,所给值)的新数组
arr = np.arange(20)
print(arr)
# 新建范围在[10,50),步长为2的新数组
arr1 = np.arange(10,50,2)
print(arr1)
结果:
[ 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19]
[10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48]
3.使用linspace()创建等差数列
linspace和arange一样,都能创建均匀间隔的数组。
linspace(start,stop,num=50,endpoint=True,retstep=False,dtype=None)
- start:序列的起始值;
- step:序列的结束值;
- num:生成的样本数,默认50;
- endpoint:布尔值,如果为真,则结束值(最后一个值恰好是结束值)也包含在序列中;
- retstep:布尔值,如果为真,返回间距;
- dtype:数组的类型。
示例:
# 生成在1~10 ,总数为10个的数组
arr = np.linspace(1,10,num=10,endpoint=True)
print(arr)
#不包含10
arr = np.linspace(1,10,num=10,endpoint=False)
print(arr)
结果:
[ 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.]
[1. 1.9 2.8 3.7 4.6 5.5 6.4 7.3 8.2 9.1]
4使用zeros()创建数组
利用zeros()方法,我们可以创建一个全部为0的多维数组。
numpy.zeros(shape,dtype=None,order='C')
- shape:用于指定数组的形状,例如:(2,3)表示创建一个2行3列的全0数组;
- dtype:数据类型;
- order:{‘C’,‘F’},按行或者按列存储数组。
示例:
# 新建一个2行3列的全0整型数组,
arr = np.zeros((2,3),'int64')
arr,arr.dtype
结果:
(array([[0, 0, 0],
[0, 0, 0]], dtype=int64),
dtype('int64'))
5.使用ones()创建数组
与上面的zeros()的参数一致,不过填充的是1。
示例:
# 新建一个2行3列的全1整型数组,
arr = np.ones((2,3),'int64')
arr,arr.dtype
结果:
(array([[1, 1, 1],
[1, 1, 1]], dtype=int64),
dtype('int64'))
6.利用eye()方法创建数组
numpy.eye() 用于创建一个二维数组,特点是k对角线上的值为1,其余值为0,可以理解为单位矩阵E。
eye(N,M=None,k=0,dtype=<type 'float'>)
- N:输出数组的行数;
- M:输出数组的列数;
- k:对角线索引:0(默认)是主对角线,正值指上对角线,负值表示下对角线。
示例:
arr = np.eye(4,4)
arr,arr.dtype
结果:
(array([[1., 0., 0., 0.],
[0., 1., 0., 0.],
[0., 0., 1., 0.],
[0., 0., 0., 1.]]),
dtype('float64'))
7.利用rand()创建随机数组
在处理一些需要模拟随机数据的情况下,可以使用随机数组。会生成一个具有特点形状和大小的数组。
在NumPy中,random类下有三种方法:
random.rand() :这个函数的参数是数组的维度;
random.randn():这个函数的参数是数组的维度;
random.randint(low,high=None,size=None,dtype='|'):
- low:随机数最小值;
- high:随机数的最大值(不包含);
- size:数组维度;
- dtype:数据类型,默认int。
示例:
# 生成3行4列的随机数数组
arr = np.random.rand(3,4)
arr,arr.dtype
# 生成4行4列的随机数数组
arr = np.random.randn(4,4)
arr,arr.dtype
# 生成4行4列的随机数数组
arr = np.random.randn(4,4)
arr,arr.dtype
结果:
(array([[0.66930943, 0.6543889 , 0.67554026, 0.95700263],
[0.91809325, 0.45346589, 0.14391797, 0.29588364],
[0.34052777, 0.38234875, 0.71249733, 0.19030281]]),
dtype('float64'))
(array([[ 1.16236082, 0.25761912, -0.69193693, -0.45389874],
[ 0.4289053 , -0.33901307, 3.15225338, -0.5902022 ],
[ 1.021301 , 0.22364381, 0.08164906, 0.04529836],
[-0.49172765, -0.40732204, -0.97332439, 1.47626338]]),
dtype('float64'))
(array([[4, 3, 2, 4, 7],
[7, 1, 7, 3, 6],
[4, 3, 8, 0, 9],
[4, 9, 1, 8, 5]]),
dtype('int32'))
ndarray数组的属性
1.ndarray.ndim:表示数组的秩,一维数组的秩为1,二维数组的秩为2,三维为3,依次类推。
# 创建一个二维数组,reshape用于重新设置数组的形状
arr = np.arange(20).reshape(4,5)
print('arr:',arr)
print('数组的秩为:',arr.ndim)
arr: [[ 0 1 2 3 4]
[ 5 6 7 8 9]
[10 11 12 13 14]
[15 16 17 18 19]]
数组的秩为: 2
2.ndarray.shape :输出数组的形状
依旧用上面的例子:
print('数组的形状:',arr.shape)
数组的形状: (4, 5)
3.ndarray.size:输出数组元素个数
print('数组元素个数:',arr.size)
数组元素个数: 20
4.ndarray.itemsize:输出一个数组元素的字节数.
print('数组元素所占字节:',arr.itemsize)
数组元素所占字节: 4
5.ndarray.real 用来输出数组包含元素的实部。
print('数组的实部为:',arr.real)
数组的实部为: [[ 0 1 2 3 4]
[ 5 6 7 8 9]
[10 11 12 13 14]
[15 16 17 18 19]]
6.ndarray.imag 用来输出数组包含元素的虚部。
print('数组的虚部为:',arr.imag)
数组的实部为: [[ 0 1 2 3 4]
[ 5 6 7 8 9]
[10 11 12 13 14]
[15 16 17 18 19]]
7.ndarray.T用于数组的转值,与.transpose() 相同。
print('转置前:\n',arr)
print('数组转置后:\n',arr.T)
转置前:
[[ 0 1 2 3 4]
[ 5 6 7 8 9]
[10 11 12 13 14]
[15 16 17 18 19]]
数组转置后:
[[ 0 5 10 15]
[ 1 6 11 16]
[ 2 7 12 17]
[ 3 8 13 18]
[ 4 9 14 19]]
数组的基本操作
在数组中,一个一维数组称为向量,二维数组称为矩阵,三维称为数据立方。
重置形状reshape
reshape可以在不改变数组数据的同时,改变数组的形状。
numpy.reshape(a,newshape)
<==>
ndarray.reshape(newtype)
- a:表示原数组;
- newshape:用于指定新的形状;
注意:重置形状后的数组,如果没有赋给源数组,则原数组形状不会发送改变
示例:
a = np.arange(20).reshape(4,5)
print('原数组为:\n',a)
print('改变后,数组为:\n',a.reshape(5,4))
# 重置形状后的数组,如果没有赋给源数组,则原数组形状不会发送改变
原数组为:
[[ 0 1 2 3 4]
[ 5 6 7 8 9]
[10 11 12 13 14]
[15 16 17 18 19]]
改变后,数组为:
[[ 0 1 2 3]
[ 4 5 6 7]
[ 8 9 10 11]
[12 13 14 15]
[16 17 18 19]]
数组展开ravel
ravel 的目的是将任意形状的数组变成一个一维数组。
numpy.ravel(a , oder='C')
a为要处理的数组
'F':按列读取
'C':按行读取
示例:
# 将二维数组按行展开
print(a.ravel(order='C'))
# 将二维数组按列展开
print(a.ravel(order='F'))
[ 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19]
[ 0 5 10 15 1 6 11 16 2 7 12 17 3 8 13 18 4 9 14 19]
数组堆叠
在numpy中,相关的堆叠函数有:
- stack(arrays,axis):沿着新轴连接数组的序列;
- column_stack():将一维数组作为列堆叠到二维数组中;
- hstack():按水平方向堆叠数组;
- vstack():按竖直方向堆叠数组。
示例:
a = np.array([1,2,3])
b = np.array([4,5,6])
# 将a和b堆叠,按行堆叠(2*3)(水平方向)
print(np.stack((a,b),axis=0))
# 按列堆叠,生成3*2的数组(沿竖直方向)
print(np.stack((a,b),axis=1))
[[1 2 3]
[4 5 6]]
[[1 4]
[2 5]
[3 6]]
数组轴移动moveaxis
moveaxis 可以将数组的轴移动到新的位置,改变数组的形状。
numpy.moveaxis(a, source , destination)
- a:数组;
- source:要移动的轴的原始位置;
- destination:要移动的轴的目标位置。
示例:
a = np.array([
[
[1,2,3],
[4,5,6]
],
[
[7,8,9],
[10,11,12]
]
])
print('数组的形状:',a.shape,'\na:',a)
a=np.moveaxis(a,0,-1)
print('数组改变轴位置后的形状:',a.shape,'\na:',a)
数组的形状: (2, 2, 3)
a: [[[ 1 2 3]
[ 4 5 6]]
[[ 7 8 9]
[10 11 12]]]
数组改变轴位置后的形状: (2, 3, 2)
a: [[[ 1 7]
[ 2 8]
[ 3 9]]
[[ 4 10]
[ 5 11]
[ 6 12]]]
数组轴位置交换swapaxes
和上面的moveaxis不同,这个是直接交换两个轴的位置。
numpy.swapaxes( a , axis1 ,axis2)
- a:数组;
- axis1:需要交换的轴位置1;
- axis2:需要交换的轴位置2.
示例:
a = np.array([
[
[1,2,3],
[4,5,6]
],
[
[7,8,9],
[10,11,12]
]
])
print('数组的形状:',a.shape)
np.swapaxes(a,0,-1).shape
数组的形状: (2, 2, 3)
(3, 2, 2)
数组拆分
在numpy中,数组拆分split有一系列相关的方法:
- split(arrays,indices_or_sections,axis):将数组拆分为多个子数组;
- dsplit(arrays,indices_or_sections):按照深度方向将数组拆分为多个子数组;
- hsplit(arrays,indices_or_sections):按照水平方向将数组拆分为多个子数组;
- vsplit(arrays,indices_or_sections):按照垂直方向将数组拆分为多个子数组。
示例:
# 首先创建一个3*3的数组,
a = np.arange(9).reshape((3,3))
print(a)
# 再把数组a拆分成3个子数组,每个子数组的元素个数为3
np.split(a,3)
[[0 1 2]
[3 4 5]
[6 7 8]]
[array([[0, 1, 2]]), array([[3, 4, 5]]), array([[6, 7, 8]])]
数组插入insert
insert(arr,obj,values,axis)
- arr:所要插入的数组;
- obj:要插入数组的目标位置;
- values:要插入的值或数组;
- anix:水平方向插入axis=0,竖直插入axis=1
示例:
a = np.arange(20).reshape(4,5)
b = np.arange(5)
print(a)
print(b)
#在a中按照水平方向插入第3行的位置
np.insert(a,2,b,axis=0)
[[ 0 1 2 3 4]
[ 5 6 7 8 9]
[10 11 12 13 14]
[15 16 17 18 19]]
[0 1 2 3 4]
array([[ 0, 1, 2, 3, 4],
[ 5, 6, 7, 8, 9],
[ 0, 1, 2, 3, 4],
[10, 11, 12, 13, 14],
[15, 16, 17, 18, 19]])
数组删除delete
delete(arr, obj, axis)
沿特定轴删除数组中的子数组,与insert类似。
示例:
以上面的插入为基础,删除插入的子数组。
# 删除第3行子数组
np.delete(a,2,axis=0)
array([[ 0, 1, 2, 3, 4],
[ 5, 6, 7, 8, 9],
[10, 11, 12, 13, 14],
[15, 16, 17, 18, 19]])
数组附加append
numpy.append(arr, values, axis)
数组附加,其实就是在原数组的基础上按照设置的附加值和轴位置来附加即可。只能在添加到数组末尾。
注意:附加后,会返回一个一维数组。
示例:
a = np.arange(10).reshape(2,5)
b = np.arange(4)
np.append(a,b)
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 0, 1, 2, 3])
重设尺寸resize
除了前面的reshape,那么我们还可以使用resize,对数组的形状进行改变。
resize(a ,new_shape)
示例:
# 对数组的形状进行重设(先生成一个4*5的数组)
a = np.arange(20).reshape(4,5)
print(a.shape,'\n',a)
#进行重设,需要注意重设的行列乘积要等于原本的行列乘积
a.resize(2,10)
print(a.shape,'\n',a)
(4, 5)
[[ 0 1 2 3 4]
[ 5 6 7 8 9]
[10 11 12 13 14]
[15 16 17 18 19]]
(2, 10)
[[ 0 1 2 3 4 5 6 7 8 9]
[10 11 12 13 14 15 16 17 18 19]]
resize和reshape的区别
两个方法都能改变数组的形状,但是reshape在改变数组的形状的时候,不会影响原数组,相当于拷贝了一份,而resize则是在原数组上直接进行操作。
两者区别在于 是否会影响到原数组。
以上就是本篇所有内容咯~
标签:
相关文章
最新发布
- 光流法结合深度学习神经网络的原理及应用(完整代码都有Python opencv)
- Python 图像处理进阶:特征提取与图像分类
- 大数据可视化分析-基于python的电影数据分析及可视化系统_9532dr50
- 【Python】入门(运算、输出、数据类型)
- 【Python】第一弹---解锁编程新世界:深入理解计算机基础与Python入门指南
- 华为OD机试E卷 --第k个排列 --24年OD统一考试(Java & JS & Python & C & C++)
- Python已安装包在import时报错未找到的解决方法
- 【Python】自动化神器PyAutoGUI —告别手动操作,一键模拟鼠标键盘,玩转微信及各种软件自动化
- Pycharm连接SQL Sever(详细教程)
- Python编程练习题及解析(49题)
点击排行
- 版本匹配指南:Numpy版本和Python版本的对应关系
- 版本匹配指南:PyTorch版本、torchvision 版本和Python版本的对应关系
- Python 可视化 web 神器:streamlit、Gradio、dash、nicegui;低代码 Python Web 框架:PyWebIO
- 相关性分析——Pearson相关系数+热力图(附data和Python完整代码)
- Anaconda版本和Python版本对应关系(持续更新...)
- Python与PyTorch的版本对应
- Windows上安装 Python 环境并配置环境变量 (超详细教程)
- Python pyinstaller打包exe最完整教程