首页 > Python资料 博客日记
将NC栅格表示时间维度的数据提取出来的方法
2024-10-22 17:30:02Python资料围观41次
本文介绍基于Python语言,逐一读取大量.nc
格式的多时相栅格文件,导出其中所具有的全部时间信息的方法。
.nc
是NetCDF
(Network Common Data Form)文件的扩展名,表示一种常用的科学数据存储格式。NetCDF
是一种自描述的、可移植的二进制文件格式,用于存储科学和工程领域的大型数据集;由于其自身的特性,.nc
数据被广泛应用于气象学、海洋学、地球科学、气候研究、大气科学、地理信息系统等领域。
首先,明确一下本文的需求。现在有一个文件夹,其中具有大量的.nc
格式的栅格文件,如下图所示。
其中,每一个.nc
格式的文件都具有多个时相(或者说是多个维度),而不仅仅只是一个时相。我们希望,读取这个文件夹中的全部.nc
格式文件,并获取其所表示的每一个时相。
明确了需求后,我们就可以开始具体的操作。首先,本文所需用到的代码如下。
# -*- coding: utf-8 -*-
"""
Created on Sun Dec 31 20:28:03 2023
@author: fkxxgis
"""
import os
import netCDF4
from netCDF4 import Dataset
def list_nc_dates(folder_path):
nc_dates = []
for file_name in os.listdir(folder_path):
if file_name.endswith(".nc"):
file_path = os.path.join(folder_path, file_name)
try:
dataset = Dataset(file_path)
time_var = dataset.variables["time"]
time_values = time_var[:]
time_units = time_var.units
time_calendar = time_var.calendar
dates = []
for value in time_values:
date = netCDF4.num2date(value, units=time_units, calendar=time_calendar)
dates.append(date.strftime("%Y-%m-%d %H:%M:%S"))
nc_dates.append((file_name, dates))
except Exception as e:
print(f"Error reading file {file_name}: {str(e)}")
return nc_dates
folder_path = "F:/Data_Reflectance_Rec/soil_1"
nc_dates = list_nc_dates(folder_path)
for nc_file, dates in nc_dates:
for date in dates:
print(date)
这段代码整体思路也很明确。
首先,我们导入所需的模块。在这里,需要导入Python的os
模块,用于处理文件和文件夹路径操作;同时导入netCDF4
库,并接着从netCDF4
库中导入Dataset
类,用于打开和读取.nc
文件。在这里,如果需要配置netCDF4
库,大家可以参考文章配置h5py、netCDF4库的方法:Anaconda环境。
接下来,我们定义了一个名为list_nc_dates
的函数,接受一个文件夹路径作为参数。在函数中,首先创建一个空列表nc_dates
,用于存储每个.nc
文件及其对应的日期列表;随后,使用os.listdir()
函数遍历文件夹中的所有文件,通过检查文件名是否以.nc
结尾来筛选出.nc
文件。紧接着,对于筛选出来的.nc
文件,使用os.path.join()
函数构建其完整路径。
其次,使用Dataset
类打开.nc
文件,并将打开的文件对象赋值给dataset
变量;随后,获取.nc
文件的时间,在本文的.nc
数据中,也就是名为time
的变量,并将时间变量的值读取到time_values
变量中。接下来,分别获取时间变量的单位与时间类型。
随后,我们创建一个空列表dates
,用于存储日期字符串。遍历时间变量的每个值,使用netCDF4.num2date()
函数将时间值转换为日期对象。紧接着,将日期对象转换为指定格式的字符串,并将其添加到dates
列表中。此外,这里还将.nc
文件名和对应的日期列表作为元组添加到nc_dates
列表中,方便我们后期对日期的核对。函数的最后,返回包含每个.nc
文件及其对应日期的列表。
在函数外部,我们设置文件夹路径,随后即可调用list_nc_dates
函数,将文件夹路径传递给它,并将返回的结果赋值给nc_dates
变量。最后,通过循环,打印每个日期即可。
执行上述代码,即可出现如下图所示的结果(结果很长,就截取一部分)。由于在本文中,每一个.nc
格式文件的每一个维度(即每一个时相)都是精确到天的,所以下图天数后的时、分、秒都是00
。当然,如果大家的.nc
格式文件维度很多,时相打印出来的话也不好完全显示,所以可以考虑将时间信息导出为表格文件等;例如,可以将每一个date
都放在DataFrame中,随后导出为.csv
文件。
至此,大功告成。
标签:
相关文章
最新发布
- 【Python】selenium安装+Microsoft Edge驱动器下载配置流程
- Python 中自动打开网页并点击[自动化脚本],Selenium
- Anaconda基础使用
- 【Python】成功解决 TypeError: ‘<‘ not supported between instances of ‘str’ and ‘int’
- manim边学边做--三维的点和线
- CPython是最常用的Python解释器之一,也是Python官方实现。它是用C语言编写的,旨在提供一个高效且易于使用的Python解释器。
- Anaconda安装配置Jupyter(2024最新版)
- Python中读取Excel最快的几种方法!
- Python某城市美食商家爬虫数据可视化分析和推荐查询系统毕业设计论文开题报告
- 如何使用 Python 批量检测和转换 JSONL 文件编码为 UTF-8
点击排行
- 版本匹配指南:Numpy版本和Python版本的对应关系
- 版本匹配指南:PyTorch版本、torchvision 版本和Python版本的对应关系
- Python 可视化 web 神器:streamlit、Gradio、dash、nicegui;低代码 Python Web 框架:PyWebIO
- 相关性分析——Pearson相关系数+热力图(附data和Python完整代码)
- Python与PyTorch的版本对应
- Anaconda版本和Python版本对应关系(持续更新...)
- Python pyinstaller打包exe最完整教程
- Could not build wheels for llama-cpp-python, which is required to install pyproject.toml-based proj