Marginal Distribution Sampling(MDS)方法的介绍

1.MDS方法介绍

Reichstein et al.等人提出了一种用于填补通量数据缺失值的方法,如今被称为Marginal Distribution Sampling (MDS)方法,该方法在通量数据的填充中广泛应用。MDS 方法结合了平均昼夜变化法(Mean Diurnal Variation, MDV)和查表法(Look-Up Table, LUT)的特点。

2.MDS插值过程

2.1 条件识别

条件1:只有直接感兴趣的数据缺失(想要进行插值的数据),但气象数据(辐射)RgR_gRg ,气温 TairT_{air}Tair,和水汽压亏缺 VPD是可用的。
条件2:气温或水汽压亏缺也缺失,但辐射是可用的。
条件3:辐射数据也缺失。

2.2 填补策略

对于满足条件1的情况:缺失值被替换为在相似气象条件下的平均值,即通过查找表(LUT)方法进行填补。相似气象条件是指辐射偏差不超过50 W/m²,气温偏差不超过2.5°C,水汽压亏缺偏差不超过5.0 hPa。如果在初始时间窗口(7天)内没有找到相似气象条件,则将窗口大小将逐渐增加。

对于满足条件2的情况:采用与条件1相同的方法,但相似气象条件只能通过辐射在7天的时间窗口内定义。如果在初始时间窗口(7天)内没有找到相似气象条件,则将窗口大小将逐渐增加。

对于满足条件3的情况:在该情况下,气象条件不可以用。该方法首先查看,它将查看前一小时和后一小时的待插值数据。如果存在,则使用它们的平均值进行填充。如果不存在,则检查在前后各一天中相同时间的待插值数据,如果存在,则使用均值进行填充,如果不存在则逐渐增加窗口大小。

插值的流程图

3.MDS方法举例

3.1情况1(气象数据可用)

假设现在现在存在数据如下,我们需要对2022年8月1日 12:00 PM时刻的NEE数据进行填充。

时间 Rg Tair VPD NEE
2022年7月30日 1:00 PM 460 W/m² 28.1°C 3.2 hPa -5.0 μmol m⁻² s⁻¹
2022年7月30日 12:00 PM 455 W/m² 28.2°C 3.1 hPa -4.8 μmol m⁻² s⁻¹
2022年7月31日 11:00 AM 453 W/m² 27.8°C 2.9 hPa -4.7 μmol m⁻² s⁻¹
2022年7月31日 12:00 PM 447 W/m² 28.0°C 3.0 hPa -5.2 μmol m⁻² s⁻¹
2022年8月1日 12:00 PM 450 W/m² 28°C 3 hPa 缺失

  1. 查找相似的气象条件
    • 辐射偏差:本时刻辐射为 450 W/m²,过去几天的辐射分别为 455 W/m², 447 W/m², 460 W/m², 和 453 W/m²,都在 ±50 W/m² 范围内,符合要求。
    • 气温偏差:本时刻气温为 28°C,相似时刻的气温分别为 28.2°C, 28.0°C, 28.1°C, 和 27.8°C,都在 ±2.5°C 范围内,符合要求。
    • VPD偏差:本时刻VPD为 3 hPa,相似时刻的VPD分别为 3.1 hPa, 3.0 hPa, 3.2 hPa, 和 2.9 hPa,都在 ±5 hPa 范围内,符合要求。
  2. 计算相似时刻的平均值(NEE):
    填充值=(−5.0)+(−4.8)+(−4.7)+(−5.2)4=−4.925 μmol m−2 s−1 \text{填充值} = \frac{(-5.0)+(-4.8) + (-4.7) +(-5.2) }{4} = -4.925 \, \mu \text{mol} \, \text{m}^{-2} \, \text{s}^{-1} 填充值=4(5.0)+(4.8)+(4.7)+(5.2)=4.925μmolm2s1
填充后的数据:
时间 Rg Tair VPD NEE
2022年8月1日 12:00 PM 450 W/m² 28°C 3 hPa -4.925 μmol m⁻² s⁻¹(填充值)
2022年7月30日 12:00 PM 455 W/m² 28.2°C 3.1 hPa -4.8 μmol m⁻² s⁻¹
2022年7月31日 12:00 PM 447 W/m² 28.0°C 3.0 hPa -5.2 μmol m⁻² s⁻¹
2022年7月30日 1:00 PM 460 W/m² 28.1°C 3.2 hPa -5.0 μmol m⁻² s⁻¹
2022年7月31日 11:00 AM 453 W/m² 27.8°C 2.9 hPa -4.7 μmol m⁻² s⁻¹

3.2情况2(TairT_{air}Tair和VPD缺失,但RgR_gRg可用)

示例数据
时间 辐射(Rg) 气温(Tair) VPD 通量(NEE)
2022年7月28日 10:00 AM 460 W/m² 30.5°C 3.5 hPa -6.0 μmol m⁻² s⁻¹
2022年7月29日 2:00 PM 340 W/m² 26.0°C 5.0 hPa -4.0 μmol m⁻² s⁻¹
2022年7月30日 1:00 PM 395 W/m² 27.9°C 3.0 hPa -4.8 μmol m⁻² s⁻¹
2022年7月30日 12:00 PM 405 W/m² 28.1°C 2.9 hPa -5.1 μmol m⁻² s⁻¹
2022年7月31日 11:00 AM 398 W/m² 28.3°C 3.1 hPa -5.0 μmol m⁻² s⁻¹
2022年7月31日 12:00 PM 410 W/m² 28.0°C 2.7 hPa -5.2 μmol m⁻² s⁻¹
2022年8月1日 12:00 PM 400 W/m² 缺失 缺失 缺失

  1. 查找相似的辐射条件
    • 2022年8月1日 12:00 PM 时的 辐射(Rg)400 W/m²,我们将在 ±50 W/m² 范围内寻找与之相似的时刻。
      • 2022年7月30日 12:00 PM405 W/m²,相似
      • 2022年7月31日 12:00 PM410 W/m²,相似
      • 2022年7月30日 1:00 PM395 W/m²,相似
      • 2022年7月31日 11:00 AM398 W/m²,相似
      • 2022年7月29日 2:00 PM340 W/m²,不相似(辐射偏差过大)
      • 2022年7月28日 10:00 AM460 W/m²,不相似(辐射偏差过大)
        结论:满足相似气象条件的时刻为2022年7月30日 1:00 PM, 2022年7月30日 12:00 PM2022年7月31日 11:00 AM,和2022年7月31日 12:00 PM。不满足条件的为 2022年7月29日 2:00 PM2022年7月28日 10:00 AM,因为它们的 RgR_gRg 偏差过大。
  2. 计算相似时刻的平均通量
    • 从相似的辐射条件下提取 NEE
      • 2022年7月30日 1:00 PM:-4.8 μmol m⁻² s⁻¹
      • 2022年7月30日 12:00 PM:-5.1 μmol m⁻² s⁻¹
      • 2022年7月31日 11:00 AM:-5.0 μmol m⁻² s⁻¹
      • 2022年7月31日 12:00 PM:-5.2 μmol m⁻² s⁻¹
    • 平均值:
      填充值=(−4.8)+(−5.1)+(−5.0)+(−5.2)4=−5.025 μmol m−2 s−1 \text{填充值} = \frac{ (-4.8) + (-5.1) + (-5.0)+(-5.2)}{4} = -5.025 \, \mu \text{mol} \, \text{m}^{-2} \, \text{s}^{-1} 填充值=4(4.8)+(5.1)+(5.0)+(5.2)=5.025μmolm2s1
填充后的数据表格:
时间 Rg Tair VPD NEE
2022年7月28日 10:00 AM 460 W/m² 30.5°C 3.5 hPa -6.0 μmol m⁻² s⁻¹
2022年7月29日 2:00 PM 340 W/m² 26.0°C 5.0 hPa -4.0 μmol m⁻² s⁻¹
2022年7月30日 1:00 PM 395 W/m² 27.9°C 3.0 hPa -4.8 μmol m⁻² s⁻¹
2022年7月30日 12:00 PM 405 W/m² 28.1°C 2.9 hPa -5.1 μmol m⁻² s⁻¹
2022年7月31日 11:00 AM 398 W/m² 28.3°C 3.1 hPa -5.0 μmol m⁻² s⁻¹
2022年7月31日 12:00 PM 410 W/m² 28.0°C 2.7 hPa -5.2 μmol m⁻² s⁻¹
2022年8月1日 12:00 PM 400 W/m² 缺失 缺失 -5.025 μmol m⁻² s⁻¹

3.3情况3(气象数据全部不可用)

在这种情况下,气象条件不能用于填充,而是通过数据的时间相关性来填充缺失的数据。

3.3.1前后一小时的数据存在
  1. 首先,我们检查 前后1小时 的数据。如果存在数据,则用这两个时刻的平均值来填充缺失数据。
时间 Rg Tair VPD NEE
2022年7月30日 12:00 PM 440 W/m² 27.8°C 2.9 hPa -5.0 μmol m⁻² s⁻¹
2022年7月31日 11:00 AM 450 W/m² 28.2°C 3.1 hPa -5.2 μmol m⁻² s⁻¹
2022年7月31日 12:00 PM 455 W/m² 28.0°C 3.0 hPa -5.0 μmol m⁻² s⁻¹
2022年8月1日 1:00 PM 460 W/m² 28.3°C 3.2 hPa -5.1 μmol m⁻² s⁻¹
2022年8月1日 2:00 PM 缺失 缺失 缺失 缺失
2022年8月1日 3:00 PM 465 W/m² 28.1°C 3.3 hPa -5.3 μmol m⁻² s⁻¹

则填充值为:
填充值=(−5.1)+(−5.3)2=−5.2 μmol m−2 s−1 \text{填充值} = \frac{ (-5.1)+(-5.3)}{2} = -5.2 \, \mu \text{mol} \, \text{m}^{-2} \, \text{s}^{-1} 填充值=2(5.1)+(5.3)=5.2μmolm2s1

填充后的数据为:

时间 Rg Tair VPD NEE
2022年7月30日 12:00 PM 440 W/m² 27.8°C 2.9 hPa -5.0 μmol m⁻² s⁻¹
2022年7月31日 11:00 AM 450 W/m² 28.2°C 3.1 hPa -5.2 μmol m⁻² s⁻¹
2022年7月31日 12:00 PM 455 W/m² 28.0°C 3.0 hPa -5.0 μmol m⁻² s⁻¹
2022年8月1日 1:00 PM 460 W/m² 28.3°C 3.2 hPa -5.1 μmol m⁻² s⁻¹
2022年8月1日 2:00 PM 缺失 缺失 缺失 -5.2 μmol m⁻² s⁻¹
2022年8月1日 3:00 PM 465 W/m² 28.1°C 3.3 hPa -5.3 μmol m⁻² s⁻¹

3.3.2 前后1小时的数据缺失

2.如果1小时内的数据都缺失,我们检查 前后24小时内(即前一天和后一天的相同时间点数据)。如果仍然没有数据,则逐步增加时间窗口,直到填充缺失的数据。

时间 Rg Tair VPD NEE
2022年7月30日 12:00 PM 440 W/m² 27.8°C 2.9 hPa -5.0 μmol m⁻² s⁻¹
2022年7月31日 11:00 AM 450 W/m² 28.2°C 3.1 hPa -5.2 μmol m⁻² s⁻¹
2022年7月31日 2:00 PM 455 W/m² 28.0°C 3.0 hPa -5.0 μmol m⁻² s⁻¹
2022年8月1日 1:00 PM 460 W/m² 28.3°C 3.2 hPa 缺失
2022年8月1日 2:00 PM 缺失 缺失 缺失 缺失
2022年8月1日 3:00 PM 465 W/m² 28.1°C 3.3 hPa 缺失
2022年8月2日 2:00 PM 455 W/m² 28.0°C 3.0 hPa -5.0 μmol m⁻² s⁻¹

  • 2022年8月1日 2:00 PM 缺失数据,检查 2022年8月1日 1:00 PM2022年8月1日 3:00 PM 的数据,但这两个时刻的NEE缺失。
  • 检查前后24小时数据:由于1小时内的数据无法使用,我们继续检查 前后24小时内 的数据相同时间的数据
    • 2022年7月31日 2:00 PM:-5.0 μmol m⁻² s⁻¹
    • 2022年8月2日 2:00 PM:-5.0 μmol m⁻² s⁻¹
  • 计算这两个时刻的平均值:
    填充值=(−5)+(−5)2=−5 μmol m−2 s−1 \text{填充值} = \frac{(-5) + (-5)}{2} = -5\, \mu \text{mol} \, \text{m}^{-2} \, \text{s}^{-1} 填充值=2(5)+(5)=5μmolm2s1
填充后的数据:
时间 Rg Tair VPD NEE
2022年7月30日 12:00 PM 440 W/m² 27.8°C 2.9 hPa -5.0 μmol m⁻² s⁻¹
2022年7月31日 11:00 AM 450 W/m² 28.2°C 3.1 hPa -5.2 μmol m⁻² s⁻¹
2022年7月31日 2:00 PM 455 W/m² 28.0°C 3.0 hPa -5.0 μmol m⁻² s⁻¹
2022年8月1日 1:00 PM 460 W/m² 28.3°C 3.2 hPa 缺失
2022年8月1日 2:00 PM 缺失 缺失 缺失 -5.0 μmol m⁻² s⁻¹
2022年8月1日 3:00 PM 465 W/m² 28.1°C 3.3 hPa 缺失
2022年8月2日 2:00 PM 455 W/m² 28.0°C 3.0 hPa -5.0 μmol m⁻² s⁻¹

4.参考文献

  1. Reichstein, M. et al. On the separation of net ecosystem exchange into assimilation and ecosystem respiration: review and improved algorithm. Global Change Biol. 11, 1424–1439 (2005).
Logo

开源鸿蒙跨平台开发社区汇聚开发者与厂商,共建“一次开发,多端部署”的开源生态,致力于降低跨端开发门槛,推动万物智联创新。

更多推荐