上一节,我们介绍了xmitgcm的LLCreader入门操作,总体上这个工具可以通过网络自动加载门户网站(ECCO)的模式数据,实现对大数据模式LLC4320和LLC2160的读取。但还有许多问题尚未解决:
- 能否保存数据到本地
- 能否按照经纬范围选取数据
- 能否选择连续的一段时间(如70天,每小时一个)
- 能否做较复杂计算
本节先介绍怎么通过LLCreader将数据下载本地,并使用GMT绘图。
加载llcreader
1 | import xmitgcm.llcreader as llcreader |
初始化模型
因为LLC4320数据体量较大,这里先以LLC2160为例。我们选择Theta
进行导出测试。
1 | model = llcreader.ECCOPortalLLC2160Model() |
ds_sst
的数据结构为Xarray的dataset
,ds_sst.Theta
的数据结构为Xarray的dataarray
。可以看到Theta
的数据大小是231M,这只是一个小时快照的单层全球数据,体积不算太大。
上图为其coordinates
,这是dataarray
数据结构的一个关键术语,其中黑色粗体i,j,k,time
表示维度坐标(Dimension coordinate),其他为无维度坐标(Non-dimension coordinate)。
Xarray: https://docs.xarray.dev/en/stable/user-guide/terminology.html#term-Dimension-coordinate
绘图查看
1 | temp.Theta.plot() |
维度坐标i,j
作为其x
和y
轴,另一维度time
和k
(深度0)出现在标题上。
因为LLC为特殊的网格结构,这里暂时不能直接实现地理绘图。后面会对此进行单独介绍。
保存 .to_netcdf()
to_netcdf()
是Xarray
内置的函数,可将数据保存为nc格式。注意数据保存和llcreader
函数无关,llcreader
的主要作用是在线获得LLC模式数据,并转化成Xarray
特有的数据结构,后面所有的操作都是使用Xarray
,因此有必要对Xarray
做全面的学习。后面会对此介绍。
1 | ds_sst.Theta.to_netcdf('myfile.nc') |
上述命令可以将Theta
参数保存。通过panoply
可以绘图展示SST参数的全球分布:
删除不重要的坐标
但可以发现保存的文件大小是2.5G,远远超过了其自身大小,这是什么原因呢?
原来是把无维度坐标全部保存了,这些坐标其实也是数据,因此占用很大空间。一共有11个这样的2D坐标,再加上Theta
,数据体积就达到2.5G了。
这些无维度坐标可以删去:
1 | ds_sst.Theta.reset_coords() # 将无维度坐标转为变量(不删除) |
若想保留某些坐标,比如经纬度XC,YC
:
1 | ds_sst.Theta.reset_coords()[["XC", "YC","Theta"]] |
上面使用了[[ ]]
做变量的筛选。
参考:https://docs.xarray.dev/en/stable/user-guide/data-structures.html#transforming-datasets
然后保存:
1 | ds_sst[["Theta"]].reset_coords(drop=True).to_netcdf('myfile2.nc') |
这样,数据体积就小了,其中myfile2.nc
仅包含Theta
,大小213M。
GMT绘图
GMT绘图比ython自带函数更加强大,既然已经下载到本地,则看一下GMT绘图效果:
1 | gmt begin ex02 png |
下节预告
- 范围的筛选
- 时间维度的连续导出
交流群
因为公众号留言功能未开通,为了促进交流,小编建立了一个QQ交流群,欢迎大家入群。暂时没开通微信群。
主要功能定位:
- 交流国内外卫星遥感数据信息和现场实测数据信息
- 对国内海洋实测数据的申请提供必要的指导
- 物理海洋、大地测量、海洋遥感等学科交流
- 传播有价值的科研工具、开源程序,提高科研生产力