- S/ m% q, ^6 i- [2 r0 Q
S$ p- r* L# f* \8 G! I5 |/ z* q! t; J3 @) K
海洋观测数据的质量控制是建立高质量海洋科学数据库的基础,其对于推动海洋科学及多学科交叉研究、预测预报、灾害预警等具有重要意义。然而,由于获取数据手段多样、数据质量千差万别、数据错情类型繁多等因素,使得如何高效和精准地发现这些质量问题并对其进行质量控制是一个难点,也是数据处理中的核心技术。
* ?. X7 D P; x3 p; U& ^$ N& T+ H! w3 v 近日,由中国科学院大气物理研究所牵头,联合了来自中国科学院海洋研究所、中国科学院海洋大科学研究中心、自然资源部第二海洋所、国家海洋信息中心的科研团队,在《中国科学:地球科学》(中、英文版)上发表了题为“海洋观测数据质量控制技术研究现状及展望”的综述文章,针对海洋观测数据的质量控制的发展历史进行了回顾,指出了该研究领域当前面临的挑战与研究方向。
) b. z! b* x3 N- t0 J, T; z 文章系统性回顾了目前国内外针对温盐等物理海洋方面观测数据的主要质量控制技术及其原理方法,例如范围检查、相关性检查、连续性检查、等值检查、梯度检查、逆温检查、尖峰检查、最大深度检查、气候态检查等(图1)。同时,该论文还对目前由不同国内外科研组织(如美国国家海洋和大气管理局国家环境信息中心、英国气象局哈德莱中心、全球温盐剖面计划、Argo全球海洋观测阵列计划等)研发的主流质控系统进行了归纳整理和对比,并讨论了不同系统之间的差异。通过对比,最新研究表明,在模块的选取、定义和质控标记符(flag)的划分上,不同的质控系统之间存在着许多差异和区别。 - b& f' @+ b3 ?3 j4 ^
! F8 _# J; I! x, j) b ?7 j
4 W% L8 z/ ]) b, X6 ?
图1 不同模块的质量控制示意图 3 H j7 i. j, z' r
黑色线为温度现场观测廓线, 红色点为被质量控制识别出的错误(可疑)观测值
! e4 u2 P \3 q ^ 目前,国内外在自动化质量控制的研发上已有很好基础。但基于对国内外现有的几个质控系统的简要性能评估,论文发现现有的各个系统存在各自的优势和缺陷,尚未有一种国内外公认的最佳方案。在此基础上,文章还讨论了评估质控系统性能的可能方法和思路,并使用了一些基准数据集对目前已有的一些主流质控系统进行了独立的综合评估。
' d# e1 ~% C ?5 \! F3 z, l. } ^ 文章指出未来有必要开展更广泛的质量控制系统性能的评估工作,推进其他溶解氧等其他要素的质量控制研发工作,呼吁质量控制系统深度融合到我国实时、联动的海洋数据库业务化工作中。近几十年来,国内外对如何获得高质量的现场观测数据越来越重视。只有提供高质量的数据,才能更好地推动海洋科学及其相关交叉学科的发展。
. A, K1 m4 H' }+ \6 V y: k
/ E5 t& R! n1 q4 S% Q0 [ 6 G9 F. E8 p8 w. }: L- w; \
5 |" h0 D' I+ B5 O
! M* Y* n+ T# a3 c0 T
! h# Y: B/ I# ~, z
3 ~' E/ I) S; d k3 g+ Q/ h+ ?! t& z |