引言与示例:datenum日序转月序

在处理数据时,我们经常需要将逐日数据转为逐月数据,这就需要我们知道日序对应的月序,比方说,我有2019年一整年的天数据共365个,我知道这个文件代表的是2018年的第几天?那么我如何知道它是2018年的第几个月呢?
如果直接上网搜索你会发现一个常见的思路:首先判断是闰年还是非闰年,然后给出每个月都日期总数,编写函数来计算。
这方法当然可行,但却是基于C语言的一种操作,实际上,利用matlab的datenum函数,我们只用一行代码就能实现这个过程。

function mon= day2mon(year,daynum)
%   year为年份,daynum为日序列
mon=month(datenum(year,1,0)+daynum);
end

比如说,我想知道2020年第234天是第几个月,我们只要输入:day2mon(2020,234)即可。

逐月计算PSI的python函数_正则表达式

利用正则表达式提取日期

当然,这种方法有一个要求,即,逐日数据需要完整,文件命名按照日序排列。

这时候我们再用日序似乎就不再适用了,这时如果你的文件名如果包含了日期的话,可以构造一个正则表达式提取。

比如说我这个文件:

逐月计算PSI的python函数_数据_02


2006年逐日海冰,本来应当有365天,却只有364个数据,不知道哪儿缺了,这时可以构造正则表达式把月份从文件名里提出来。

文件名的命名规则:“POGOC_OUC_AMSR-E_DTASI_n_sic_YYYYMMDD.hdf”,命名相当有规律,通过正则表达式可以很轻松地提取。

numstr=regexp(str,'\d{8}','match')

返回

逐月计算PSI的python函数_逐月计算PSI的python函数_03


然后将其转换为数值型,再用datenum返回月序即可。

numdate=str2num(numstr{j}{1});
mon(j)=month(datenum(numdate))

具体应用-15年海冰日数据转月数据

下面我们来讲讲一下具体的运用过程,
我们的目的是:将2005-2019年的海冰日数据转为月数据。
首先定义一下年份:year=2005:2019 然后先批量读个数据文件(hdf格式),为了避免过于复杂,我们先算一年的吧,这时,i=1,year(i)=2005。
先批量读个文件:

files=dir([path,num2str(year(i)),'\*.hdf']);
fullname=cell(1,length(files));
seaice=cell(1,length(files));
filename=cell(1,length(files));
% 读取逐日数据
for n=1:length(files)
fullname{n}=[path,num2str(year(i)),'\',files(n).name];
seaice{n}=hdfread(fullname{n},'OUC_SIC');
filename{n}=files(n).name;
end

然后用我们正则,提取出月序:

daynum=1:length(files);
numstr=regexp(filename,'\d{8}','match');
mon=zeros(1,length(numstr));

将提取的月序与索引一一对应,由于存在元胞数组里,先用cat函数拼接,再相加。

for m=1:12
    d=seaice(mon==m);
    monsic{12*(i-1)+m}=mean(cat(3,d{:}),3);
end

完成。