|
0 h5 p: K) H1 f% O- _) i 
' I- G4 j7 f' [$ m 引文格式:任焕萍, 李一凡, 张斌, 郑双强, 王彦俊, 冯立强, 李富超. 海洋科学数据汇聚共享服务平台建设[J]. 数据与计算发展前沿,2024, 6(3): 92-98. ; @+ o( Z, G5 Z/ I* h
文章摘要
; h# H5 n4 u; V" U- o 【应用背景】海洋数据是认识海洋、经略海洋的基础,随着海洋观测和探测技术的快速发展,海洋数据呈爆炸式增长,数据的开放共享需求日益迫切。
. L1 v; `6 Y, J. M9 F+ L- i 【目的】为了实现多源海洋科学数据的整合,打通数据存储孤岛,建立统一的元数据标准和数据共享链路。 ; x( T& q, b; A; F( t o( H- C. [
【方法】本文构建了一个海洋科学数据汇聚共享服务平台,提供海洋数据汇交、审核、注册、存储、检索和共享全过程管理的一体化、在线化和流程化服务,为不同用户提供公平渠道获取数据、信息、知识和技术;提供DOI/CSTR自动注册服务,加强数据知识产权保护,保护数据所有者权益。 ( M4 E9 J. v$ ~7 @' u4 x- ]: c
【结果】平台以数据规范为牵引,将数据存储规范、管理流程规范、元数据标准纳入系统设计中,实现数据统一编码、统一管理、统一存储、统一发布的“四统一”。
5 |: D& w! l& @7 `5 R" L; F 【结论】通过平台的应用推广,能够更好地推进海洋科学数据高效共享和利用,充分挖掘海洋信息资源的潜在价值,高质量支撑海洋科学研究。 ! ^$ @3 Y) Q# _& r
文章引言 5 G0 ]9 a/ z. r2 r# D! ^
...... 9 y3 P% \/ y2 }5 q1 A7 O
国际上,欧美等传统海洋科技强国持续汇聚和整合本国、本地区乃至全球的海洋科学数据资源,在数据存储、保护和引用等方面积累了很多经验做法[3]。美国NOAA CoastWatch自1987年开始实施,为用户提供全球和区域卫星数据,支持有关了解、管理和保护海洋和沿海资源以及评估环境变化对生态系统、天气和气候的影响等主题的研究、资源管理和决策[4] ;欧洲中期天气预报中心(ECWMF)既是一个研究机构,也是一个24*7业务服务机构,负责制作和向其成员国传播数值天气预报,还提供一个预测数据目录,可供世界各地的企业和其他商业客户购买[5]。近年来,国内越来越重视海洋数据的收集和共享,各部委、机构建立了多个海洋数据中心,研究海洋科学数据共享政策法规与标准规范,总结发达国家海洋科学数据共享的发展模式[6];开展海洋航次数据开放共享的实践[7];开展多源异构海洋数据的融合示范,通过多维数据格式进行数据融合、通过半结构化数据库进行数据存储等[8];开展海洋数据共享研究与平台建设应用,采用云桌面的方式为用户搭建数据使用平台[9],这些都为国内海洋数据的全面共享和应用打下了坚实的基础。
2 I; U' Y |3 l% ^+ e 本文围绕海洋数据汇聚、管理和共享需求,针对海洋数据采集方式多样、传统海洋数据多源异构难整合、元数据不统一和数据共享不易等问题[10],设计研发了海洋科学数据汇交共享服务平台(http://www.casodc.com 或http://msdc.qdio.ac.cn)。 ) |1 S" a, S9 A) o% z7 P0 y5 x5 x
平台提供海洋科学数据的在线化、流程化、自助式的汇交、管理和共享服务以及计算资源服务,支持科研人员与数据中心共同建设和管理数据,实现多源数据融合汇聚,集中存储,统一标准,规范管理,实现数据的“四统一”,即统一编码、统一管理、统一存储、统一发布。通过在线数据汇聚与共享,发挥多源、复杂、高成本的海洋科学数据共享利用价值[10]。 0 |8 h- |9 L: ~4 u& [
文章图表 - ^/ F' m3 \1 i
海洋科学数据汇聚共享服务平台采用B/S模式,按照数据层、服务层、应用层三层架构设计,系统架构如图1。数据层将实体数据和信息数据分离,实体数据集中存储在数据服务器上。服务层实现栏目信息发布服务、数据接口服务、GIS可视化服务以及系统管理运维服务,为应用层提供数据服务支撑。应用层设计为门户网站、数据管理系统、微信小程序三部分。
* b' |0 b' U5 V3 A8 U2 D7 x- c 图1 系统整体架构图
- [' T4 l+ [% Q$ S! X! V0 i5 H 平台的3个应用部分紧密衔接,完成数据的全流程、在线化处理过程,实现数据的共享下载,系统功能结构图见图2。主要有以下特点: : z5 M. ?1 `" X- n9 l
(1) 开放的数据资源共享。分级分类共享数据,国际观测数据面向国内外用户公开共享,专题数据产品根据权限分公开共享和申请共享,项目数据超过保护期后公开共享。 ) b! D3 L6 I" D6 w/ Y t- V
(2) 便捷的线上申请服务。提供了数据汇交、DOI/CSTR、资源申请、服务申请等多种线上申请服务,提升各类申请的实时性和便捷性。 8 {( Z0 o1 b" u) k4 F1 T
(3)灵活的数据检索方式。采用国际通用方式,提供数据地图检索、条件检索,快速定位,提高数据使用效率。 2 m6 D* @0 h: R, I6 L" R$ M
(4)更轻量的微信小程序移动应用。系统分中英文网站。中文网站划分为9个模块30个功能点,模块包括:数据资源、数据汇交、展厅预约、应用服务、计算服务、工具箱、新闻动态、关于我们、个人中心。核心功能是实现了数据在线汇聚流程,数据在线共享流程,并且打通了数据汇聚与共享之间的关系,实现从数据汇交、元数据管理、实体数据分类存储到数据共享的全过程在线化、流程化处理。 % T* i3 ~- M+ m: I# |, U F k( w
图2 系统功能结构图
1 j3 c, M* H# Y, w 通过门户网站汇交的数据,需要进行审核,经过前后台交互过程完成审核流程处理,数据汇交流程图见图3。论文数据审查流程分为中心初审、课题组负责人审核、中心终审。DOI/CSTR申请审核通过后,自动生成DOI/CSTR注册码,并链接至中英文页面进行展示。科技项目数据、支撑部门数据等,都可以通过其他数据汇交渠道提交,经审核确认后自动发布。 + P# `/ g/ C' K3 Y
这里设计主要有以下特点: : D- Q1 M+ z* V! A% H
一是实现角色授权。根据功能需求设置角色,对用户进行角色授权,不同角色具有相应的审批权限。 . ~: V" O0 D. P% {$ Y# {4 ~
二是实现多级审核。后台按照用户权限,将提交的申请单转给相应的审批人,通过多级审批过程完成整个流程过程。 ( l3 C5 e6 \8 h9 D7 n
三是不同渠道之间最终归于统一。所有渠道汇聚的数据统一在专题数据产品展示,不同业务之间可以相互衔接,协同处理。
. j1 k% o7 E; f 四是实体数据集中存储,统一管理。 7 H: l$ _; Q( h, J
图3 海洋科学数据汇交流程图
) l. ?( X i1 y 系统通过专题数据产品、全球观测数据和数据资源目录等功能,提供海洋数据和信息资源的在线访问和开放共享[12],数据共享流程图见图4。 ; @# }( P# e. z
图4 海洋科学数据共享流程图 + G: M: c+ O2 ^1 A
总结与展望
2 V! E. ]1 T/ A4 [4 Y O, c 目前国内海洋领域数据共享平台的建设日趋多元化,有效推进了海洋数据的科学共享、高效利用,但同时又呈现出“分散建设、信息孤岛、标准不一、业务难协同”的局面,缺乏全局战略性的海洋信息集成共享网络。通过本文构建的海洋科学数据汇聚共享服务平台,提供了海洋数据汇交、审核、注册、存储、检索和共享全过程管理的一体化、在线化和流程化服务,为不同用户提供公平渠道获取数据、信息、知识和技术;利用在线数据汇聚和海量数据资源的在线检索共享,不断汇聚发布更多的海洋科学数据资源和产品。但不容忽视的是,目前海洋领域数据标准和安全规范仍不够完善,海洋数据封闭化、碎片化严重、共享不足,制约海洋信息化向纵深发展。下一步需要继续深入打造良好的海洋数据生态环境,各方加强共同协作,打破机构壁垒,在保障国家安全、个人隐私与数据知识产权的同时,扩大数据共享范围,让更多用户合法获取数据,进一步挖掘海洋信息资源的潜在价值,促进海洋科学前沿研究[13-14]。 & E, c, ^6 y( J& s( @; L( j
作者简介 2 K0 P, ~) m" n: C
任焕萍
- B/ C }1 c1 v7 v& B 中国科学院海洋研究所,高级工程师,主要从事海洋大数据和信息化研发工作,主要研究方向为海洋大数据质控技术、大数据服务平台和数据库应用。 / J* J7 w! k: } c) H
李富超
9 ]9 W$ I7 U' A# o; O 中国科学院海洋研究所,海洋大数据中心主任,研究员,硕士生导师,主要从事基于基因组学的海洋微生物群落、功能及产物多样性研究。近年来,组织建设海洋大数据中心,整合多源海洋数据资源,构建海洋科学数据综合平台,发表学术论文70余篇,申请和授权专利20余项,获山东省自然科学奖等科技奖励3项。 5 v: ~3 H" Q& I, T7 H" O! F! F
相关文章推荐
, X; e% c6 O8 q2 i/ M. e+ @+ ^9 ~+ J 《数据与计算发展前沿》2024年第3期目次
2 C; _1 a. b8 j2 Z6 P
% \( k3 C7 v3 F 智慧医疗前沿与进展专刊序言
+ j1 i4 \2 {9 j+ l% E( v3 o % t/ \* l9 U# k4 r4 g, B
基于深度学习的医学多模态数据融合方法在肿瘤学中的进展和挑战
4 w' w4 P7 S0 b : V8 Y+ x# d/ `% _) ^/ e3 F
孤独症人工智能诊疗进展及前沿
/ b& Z: b8 b A2 x/ _5 Q0 U 8 r$ F, l+ s( q/ k2 _' s% m% R
基于外轮廓识别与内部像素分类的双阶段血管内超声影像分割与术中显示
/ Y" y2 n x- ^
" k F3 W4 {0 Y# x1 W- P9 l 深度学习在口腔种植影像学中的应用:研究进展与挑战
' L4 f; o! e" O) }8 A" ] x - n/ F/ k- [; t9 @
口腔种植机器人在不同牙位植入精度研究
$ w8 p; ~' b) @4 ~$ S
* i7 b5 ^: W p( y0 X! U 基于Rucio的高能物理网格数据管理的研究和应用
2 l4 f( P4 l$ e% _
% u4 [4 g: m; A" e, a- ^" a2 Y 多波段多信使天文警报信息汇集与发布平台的设计与实现 4 b; C% s! m7 Y7 l+ W, O' q2 ~
, D% B, d0 s# L6 |8 q7 m
同步辐射光源实验中虚拟计算系统的设计和应用
% Y, g: Q8 p) Z ) |8 [1 T- w- A, o$ \
LHAASO模拟作业从X86到ARM计算集群的移植
! [6 g- a5 `1 S) X
' o w4 F+ I# ~5 [, F 点击左下角,阅读原文
8 e+ f9 k! [; a6 B; m5 X8 k
, B" d0 O! A6 p" d3 ~/ M+ d i+ S* L
3 d1 x y" B! i6 F. u
* C6 P# |) E" s) j |