首页 > Python资料 博客日记
boto3:Python连接S3对象存储并进行文件操作(上传、下载、删除)
2024-09-20 01:00:05Python资料围观44次
Python资料网推荐boto3:Python连接S3对象存储并进行文件操作(上传、下载、删除)这篇文章给大家,欢迎收藏Python资料网享受知识的乐趣
目录
一、前言
在日常进行数据高可用时,会将数据存入对象存储中。在一般的企业中,对象存储资源池只有管理员拥有Web界面管理,普通账号需要对数据进行管理时,有如下方法:
一、通用对象存储管理客户端,如对于S3对象存储有S3browser可以进行使用,其优点是操作简单,界面可视化;缺点是每次需要手动操作。
二、利用对象存储指定的API或者SDK工具进行开发,其优点是适合无法使用可视化界面的IT环境和可自动完成,缺点是需要自己编辑。
二、boto3
boto3是针对S3云存储的Python SDK工具,是boto2的迭代版本,对于可使用S3对象存储接口协议的基本可使用boto3。
安装:pip install boto3
三、代码
1、连接
import boto3
from datetime import datetime, timedelta
# 定义 endpoint、access key 和 secret key
endpoint_url = 'http://*************'
access_key = '****'
secret_key = '****'
# 创建 S3 客户端实例并指定 endpoint 和凭证信息
s3 = boto3.client('s3',
endpoint_url=endpoint_url,
aws_access_key_id=access_key,
aws_secret_access_key=secret_key,
verify=False) # 如果不需要SSL验证,可以设置verify=False,即http或者https
# 列出所有的桶
responses = s3.list_buckets()
buckets = [bucket['Name'] for bucket in responses['Buckets']]
print('All of Buckets:', buckets)
2、列出桶中文件
#前面连接桶的代码段此处已省略
response = s3.list_objects_v2(Bucket='****') #选择你需要列出的桶名,
# 输出列出的所有对象
if 'Contents' in response:
for obj in response['Contents']:
key = obj['Key']
timestep = obj['LastModified'] #文件对应的最后更改时间
print(key, timestep) #输出桶中文件名及最后更改时间
3、删除文件
删除文件:
s3.delete_object(Bucket='****', Key='****')
Bucket即为桶名,Key为桶中要删除的文件名(包含完整路径)
#以删除桶中30天以前的文件来直观了解一下
#省略前面连接代码
response = s3.list_objects_v2(Bucket='****')
days_hup = 30
del_date = datetime.now() - timedelta(days=days_hup)
#print(del_date)
# 删除30天以前的文件
if 'Contents' in response:
for obj in response['Contents']:
key = obj['Key']
timestep = obj['LastModified']
timestep = timestep.replace(tzinfo=None) #注意进行时间offset-aware和offset-naive的转换
if timestep < del_date:
s3.delete_object(Bucket='****', Key=key)
print(f'删除文件 {key} 成功')
4、上传下载
s3.upload_file(本地路径及文件,桶名,对象存储路径及文件)
s3.download_file(桶名,对象存储路径及文件,本地路径及文件)
#省略前面连接代码
bucket_name = '****' #your bucket name
# 上传文件
local_file_path = '/data/testfile' # 本地文件路径
s3_file_key = '/TEST/uptestfile' # S3中的文件名,可以包括文件夹
s3.upload_file(local_file_path, bucket_name, s3_file_key)
print('文件上传成功')
# 下载文件
download_path = '/data/downtestflie' # 下载到本地的路径,包含文件名
s3_file_key = '/TEST/uptestfile'
s3.download_file(bucket_name, s3_file_key, download_path)
print('文件下载成功')
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:jacktools123@163.com进行投诉反馈,一经查实,立即删除!
标签:
相关文章
最新发布
- 【Python】selenium安装+Microsoft Edge驱动器下载配置流程
- Python 中自动打开网页并点击[自动化脚本],Selenium
- Anaconda基础使用
- 【Python】成功解决 TypeError: ‘<‘ not supported between instances of ‘str’ and ‘int’
- manim边学边做--三维的点和线
- CPython是最常用的Python解释器之一,也是Python官方实现。它是用C语言编写的,旨在提供一个高效且易于使用的Python解释器。
- Anaconda安装配置Jupyter(2024最新版)
- Python中读取Excel最快的几种方法!
- Python某城市美食商家爬虫数据可视化分析和推荐查询系统毕业设计论文开题报告
- 如何使用 Python 批量检测和转换 JSONL 文件编码为 UTF-8
点击排行
- 版本匹配指南:Numpy版本和Python版本的对应关系
- 版本匹配指南:PyTorch版本、torchvision 版本和Python版本的对应关系
- Python 可视化 web 神器:streamlit、Gradio、dash、nicegui;低代码 Python Web 框架:PyWebIO
- 相关性分析——Pearson相关系数+热力图(附data和Python完整代码)
- Python与PyTorch的版本对应
- Anaconda版本和Python版本对应关系(持续更新...)
- Python pyinstaller打包exe最完整教程
- Could not build wheels for llama-cpp-python, which is required to install pyproject.toml-based proj