第1卷第1期计算机学报Vol. 1 No. 1 2015年5月CHINESE JOURNAL OF COMPUTERS 5. 2015
2 k) X0 O& S: _- U, y5 ~空间抽样方法在海洋地理信息系中的研究
* u) y( w3 T7 f! K; p8 S郑宗生徐首珏0 p4 z9 H1 ` ]4 I: F
(上海海洋大学信息学院,上海201306): p% j( O" z: |
摘要海洋大数据的真实、可靠,对于掌握海洋环境情况、有效监测和维护具有十分重要的作用。运用传统的抽样方法来对海洋数据质量进行检测变得尤为困难。因此,针对海洋空间数据空间位置不准确、空间数据采集多源、空间数据格式多样性、空间数据逻辑不一致等特点,本文对空间抽样的方法做了总结与讨论。
P& |( e; {/ } |5 _关键词空间抽样方法;系统抽样方法;空间相关性;灰度共生矩阵- t$ ^; b$ d0 O, {0 U. W: e
The Research of Spatial Sampling Method in Marine Geographic
3 M( X7 Z0 f g% R9 aInformation System, W4 n2 j+ i1 A: k! J0 \8 q
ZHENG Zongsheng XU Shoujue1 c% V8 c$ _7 o& o/ O- o" X$ N& n
(College of information, Shanghai Ocean University, Shanghai 201306) j6 o& {3 U6 _7 y5 e; F' h
Abstract The trueness and reliability of ocean big data take a greatly important role in the master of the marine environment and the effective monitoring and maintenance. It is particularly difficult to use traditional sampling methods to detect marine data quality. This paper summarizes and discusses the spatial sampling methods used in the ocean big data which has the feature of inaccurate in spatial location, multi-source in spatial data collection, diversity in spatial data format and inconsistent in spatial data logicality.: i- l0 v: ?% x% h, o* ]2 N
Key words spatial sampling method; systematic sampling method;spatial correlation8 g6 E/ T* ]0 L
2016年5期1引言6 o7 A1 E' F( `' L$ N$ A$ H* Q
抽样调查是海洋探索、资源评估、环境检测等问题研究的重要手段。以简单随机抽样、分层随机抽样、系统抽样和整群抽样为核心的经典抽样调查方法已广泛应用于社会、自然、经济、人文等各个领域,其理论体系建立在样本完全独立的前提条件下[1、2]。空间抽样方法是对具有空间相关性的各种资源与监测对象进行抽样设计的基础。在几大经典抽样方法的基础上,王劲峰等人针对地理空间进一步探索了分层抽样方法,更提出了三明治抽样模型。4 n0 Q. C) U% ~1 `0 ]
然而,对于海洋分布的各种资源,由于海洋大数据多为空间数据,具有空间相关性,又存在着空间位置不准确、空间数据采集多源、空间数据格式多样性、空间数据逻辑不一致等数据质量问题,因此运用传统的抽样方法来对海洋环境检测变得尤为困难。! X# _; Y$ _7 T( V0 Z+ {
针对海洋空间数据的特点,本文以经典抽样方法为基础,分析适合海洋环境数据质量检测的空间抽样方法,同时指出改领域研究所面临的主要问题。
. ?0 @' {7 T$ m' R& f2 空间抽样的发展* B1 a0 q2 ~+ x
1895年,在瑞士伯尔尼举办的国际统计学会(ISI)第五届大会上,挪威统计学家凯尔(A.N.Kiaer)提出用代表性样本方法来代替全面调查,被认为是抽样调查历史的开端。经过一百多年的研究,抽样调查已形成为一门成熟的统计学分支学科,
! E' ]. w) M7 o) P, {4 c2 k随着我国经济体制从计划经济向社会主义市场经济的转变以及统计制度的深化改革, 20 年多年来,抽样调查作为统计调查的一种重要方法及获取统计资料的重要手段,日益受到政府各部门、企业、学术界与社会公众的重视,它的应用无论从广度还是深度都有了极大的发展[6]。: P5 I9 \2 X) O; n+ v; n6 ]. I
地统计学最早是矿物学家D.R.krige 将其应用于南非金矿的查找,这个方法是由Matheron 提出来的[1, 2]。七十年代提出了托普勒第一定律:任何事物之间都有相关性,相距近的事物比相距远的事物之间更加相关[3],对这种相关性的研究和量化构成了空间统计理论的基础,一大批学者对空间相关性和空间变异等问题做了大量的研究,奠定了空间统计、空间数据分析的基础,基于样本不独立假设的空间抽样调查技术得以迅速发展,在生态、海洋、渔业、林业、农业、人口健康调查、环境、土壤以及水资源等方面得到了广泛的应用。在国内,绝大多数抽样调查都是基于经典抽样,王劲峰研究员及其所带领的研究团队是较早地开0 s; x, R7 m+ I; ^& ]( B
2016年5期
$ G" L: p4 Y6 O/ N* e% r8 [, k展空间抽样技术方面研究的学者,也有学者在土地调查抽样设计时考虑了空间结构。0 J, n# X6 d- M$ R$ B
传统抽样中,抽样对象一般不具有空间位置概念。在抽样时,每个对象被分配一个编号以便于区别不同的抽样对象。但是对换任意2 个编号对象,并不影响抽样结果。空间抽样和传统抽样技术最大的差别就在于,空间抽样调查对象具有地理空间坐标,并且如果改变空间对象的位置,则改变了抽样调查总体,影响抽样调查结果。空间抽样调查对象的地理空间坐标和属性值共同构成标识空间对象的二个特征属性。空间抽样理论对这二个属性之间关系进行研究。下面将介绍空间抽样涉及的几个问题。3.空间抽样的研究现状5 h. x) @; l: P" ~
3.1国内空间抽样方法研究/ p) g) c, v% I
李连发提出了空间抽样框架,以及如何在地理数据上进行抽样调查的一整套方法和理论,阐述了空间的抽样设计思想,同时充分利用之前的各种资料,结合空间特征,确定样本大小。其关键思想是在抽样中考虑了空间数据的相关性,并且利用公式量化相关性,提高了抽样的效率。牛文杰提出了基于先验信息的kriging 方法研究,这种方法利用了原有的目标相关信息,这种信息相对精度较低,但是能够反映目标的趋势变化。王劲峰提出“三明治” 空间抽样模型。这种: L7 e) Z0 y! r
模型利用了抽样对象在空间上的变异特征,考虑了自然和资源环境领域研究调查中数据具有相关性的特点。同时根据抽样对象特征进行分层,采用分层抽样。但是在最后结果表达时,通过均值和误差传递,能够在调查者感兴趣的区域内汇报结果。这种方法既利用了抽样对象的自然属性,也考虑到了实际工作中需要根据行政区域汇报统计结果的现状,为此类问题提供了一个很好的解决方案。
$ x- a" Z$ R1 B赵雪慧介绍了小区域估计方法及其发展现状[5],分析了实际调查抽样中如何设计和调查采用的方法,提出在抽样中,要注意整体考虑抽样误差,而不仅仅是抽样方法的误差。其提到的小区域抽样是一种新的估计方法,从本质来说,还是将类似的观测数据放到一起考虑,考虑某种程度上的一致性。赵宪文研究组从利用遥感进行林业调查的角度探讨了样本分布、样本大小与林业调查结果精度的关系[6]。
! J0 n @( X+ c- S) ^3 U9 F. ]' x3.2国外研究现状
- p5 q: Q1 v( t& y9 u* |随着地理空间事物普遍存在自相似性及其相关理论的深入研究,样点选择的研究已逐渐由专家知识主观指定过渡到通过优化决策模型自动选择。这可以有效保证其科学性,即对同一片调查区域的多次采样,其结果具有某一置信水平的可比性(专家的主观判断不具有这一特性),基于优化决策支持的样本设计可以有效避免基于主观判! G, y- G! K( u% P9 U
2016年5期8 j. F4 H) R0 a& H% M
断选择样点的偏误。样本优化布局的目的是合理选择并分配样本点,使所含信息量最大,样点具有最大的代表性,它需要充分挖掘所能提供的先验信息。Kriging 方法是地统计的核心内容,也是空间抽样的一个重要理论基础。
# u2 Y- P- I* }8 u0 P' K3 l3.2.1简单随机抽样/ Q2 t0 R3 L+ _/ n2 P, V8 f, v
简单随机抽样是三大经典抽样方法中最为基础且简单的抽样模型,它不考虑空间关联,是其他抽样模型的基础。简单随机抽样模型根据调查对象总体的变化情况和用户希望抽样调查误差控制在某个范围之内,计算出样本量,然后根据样本量,从总体中随机抽取样本。对样本值调查以后,按照求解均值和方差的公式对抽样总体进行统计推断。
+ l; y% y7 h, U适用情况:当样点在区域D上均匀分布,值变动不大,且方差较小,使用简单随机法可得精度较高的估计值。一般将其与其他方法结合起来使用。& Q+ X6 x$ ?% T2 n' C
取点方式:用随机数表产生随机数,用于决定抽样点,当抽样点在区域D上,均匀分布时,能取得较好的精度。在森林抽样调查中,依据随机数,在航空相片或地形图上确定各中心地,再进行实地测树调查,获取样本点的值(木材面积)。
4 H% _0 y, ]- N6 W7 ?3 r3.2.2系统抽样
- C8 g5 ~/ T- D& x% p" t) q* M, X系统抽样在空间平面图的格网抽样调查中(例如土地利用调查、遥感它对于样本图像处理等)有重要的应用。它对于样点之间波动较大与自相关总体,且相关关系为负相关的调查对象,系统法能取得较好的效果。2 j5 n/ X0 W! v! Z7 C
取点方式:在系统抽样中,随机选择起始点,之后每间隔k个点取一个样点值。对最后不能刚好取满的,可舍弃后几点,或从头开始循环取最后一点。 m! ^8 O! }3 i* v+ ]$ r
在二维连续平面中(常在地图中使用),采用布格网的方式,随机选择一个格网,随机布点,之后按一定的选点方式在其他格网内选点。选点方式有两种:排列和非排列。排列:点的选取按与行列方向间隔一个格网一样大小依次取点。非排列:点的选取随机与行列方向间隔格网大小依次选取—该方法精度较高(Cochran,1977)。
8 O7 c+ O3 K; J- f( s4 x- d适用情况:当样本之间波动较大,对空间关联的自然总体具有比简单随机法与分层法精度较大提高;而对样本总体呈线形趋势或周期性波动变化的总体,或呈负相关的总体,精度较低(方差V较大)。
2 l' k, W, k/ a5 T, B" O) Z7 b3.2.3分层抽样9 y' s; C( a8 b9 v9 z
分层随机抽样模型将总体划分成若干层,独立地在每层内抽样,分别计算各层的均值及方差,最后估算总体的值。各层内用简单随机抽样方法进行抽样计算。通过划类( O9 o. {6 e3 X2 X
2016年5期
, k" l# I6 b' n3 V6 w% |8 j5 Y分层,增大了各类型单位间的共同性,容易抽出具有代表性的调查样本。该方法适用于总体情况复杂,各单位之间差异较大和单位较多的情况。当层内变差较小而层差较大时,分层法可较大的提高精度(适用情况,分层时的原则)。
: ~& F& W5 R$ H4 \1 \分层抽样是面向地理空间对象普遍采用的一种方法,分层方式的优化选择是分层抽样设计的关键,由于海洋空间的相关性特征,经典抽样中追逐完全知识分层的优化分层原则已不再适用于空间的抽样调查。) z( L, k, e. G. K, H
海洋空间对象的分层抽样中,分层方式的选择有两类,一种是直接采用行政区分层,它也是实际中应用最多的一种分层方式,另外一种是花一些代价尽量获取抽样总体的先验知识,然后根据先验知识进行分层,这种分层方式一般能比行政分层取得更好的抽样估计精度。两种分层方式的优化选择需要整体权衡各方面的得失,若知识分层付出的代价能由精度提高得到的资源节省所补偿,则选择知识分层,否则,选择行政区分层,而知识分层对抽样精度的贡献又受抽样总体的空间相关性特征的制约,因此在对两类分层方式(或其他分层方式)的选择之前,需要对抽样总体的空间相关性特征进行分析,并评估它对知识分层的影响性。本文主要研究地理空间对象中分层抽样的分层方式的优化选择策略,具有很强的实际应用价值[5]。" e5 K. Z8 f7 Q; k" c% H0 F
3.2.4三明治空间抽样模型
! V) v" G* V; y, X如今很多专家学者在运用空间抽样方法时考虑到了空间抽样对象在空间上的自相关性,克服了传统抽样方法在处理空间相关对象时遇到的问题。空间异质性是空间对象的另一个特征,主要采用不同分层抽样方式及优化策略来解决空间异质性带来的问题。但是,在对空间异质对象调查时,如果最终抽样结果需要在多个报告单元进行统计推断,那么抽样费用将急剧增加。例如,要在多个因素中抽样,就需要更灵活的抽样调查和统计方法。
- I8 s7 {$ _: a4 u1 @2 M在三明治空间抽样模型中,首先,为了消除对象空间异质性质,将研究区域划分为多个分区,这些分区组成了知识层。其次,根据用户对抽样精度要求计算所有层总的抽样样本量,并按照分层抽样样本分配理论,将样本分配到每个知识层。在用户调查得到样本值以后,计算每个知识层的样本均值和方差。最后,将知识层的均值和方差传递到报告层中得到每个报告层的均值和方差。三明治空间抽样模型完成了样本曾、知识层、和报告层的信息和误差传递。既利用了抽样对象的自然属性,也考虑到了实际工作中需要根据行政区域汇报统计结果的现状,为此类问题提供了一个很好的解决方案。
\$ ?0 z/ |) d* B报告层:用户可以自定义报告单元。常见的报告单元有城市、省份、县等行政区域、
8 s6 q) T+ q- U! N& Y! S 2016年5期! U, n/ m! `7 [
邮政区域、调查统计区域,也可以是土壤或$ a, M0 f: Q: p% q" `& i' q- p* Q! Y" l
者生态调查中用到的歌王系统,还可以是流
4 R% i+ g" z! h$ i域或者根据高程划分的自然带等[8]。现有的1 n! p8 p+ m; k* P) ?" y3 H$ I$ v
抽样理论,无论是经典抽样理论还是空间抽& p n1 T+ p' d& c; ^& Q! U
样理论,均没有考虑多个报告单元,或者默, ]- i! n$ n0 L
认唯一的报告单元。当有多个报告单元时,2 [* m& I. t, \% v/ h
按照目前的抽样理论,在每个报告单元内均将不设样本,是的抽样费用非常昂贵。+ E# Y1 c; _% M0 r+ l
知识层:先验知识能够显著减少样本量。空间抽样理论利用抽样对象的空间相关性、离散方差等特性来提高抽样效率。但是,对于空间异质性如何帮助提高抽样效率的研究相对较少。先验知识用于分区通过聚类算法实现(Li et al.2008;Wang et al ,1997),得到的分区将作为三明治空间抽样模型的知识层。4 ~( _3 H7 n- a' F5 f
样本层:已有的抽样调查方法中,无论是简单随机、系统抽样、空间抽样或者分层抽样,其样本都分布在同一个报告单元内。在三明治空间抽样模型中,样本分布在知识层内,与报告单元的大小、形状没有关系。这种打破样本和报告单元之间联系的思想,是的报告单元随用户西药改变的同时,不需要改变样本布设方式,也不需要增加样本量。一旦知识层上布样确定以后,报告单元可以随用户需要设定或改变。
5 U; G9 [. J( L4 o/ e①求每5年估计净耕地面积
+ R' n0 I4 @$ c8 a3 B$ @* m1 u. R. P5 Y
。) \, O: k6 x6 f: J. k
2 U- T8 K- q' K: X" F) e1 C! R$ u6 v9 u% s! Y* N, A( \9 H
=2 M2 Z( A, n8 r k9 J
. s9 c8 H1 ]/ A" a3 m3 C# y! M= =(1-)×2 A4 x! l9 L" _: H$ _
被检测的区域每5年被详尽的测量,通过TM 影像获得总的耕地面积,航空照片用来估计。的值主要是一个函数,关于地貌、气候、农民的习俗和该地区的大力发展,这些往往被认为是慢慢改变的东西(Liu and Yu 1990)。这些会通过每5年的航空照片采样更新,并且详尽涵盖了10年。
; J2 o3 o: A8 s2 i! @" o②估计每年都会改变的耕地面积。
4 W5 \8 F7 k, I6 _! J b1 `' v D# d% \
=P -=(1-)×P4 W4 ~" Z: P! V' [
TM 影像采样被用来估计=/p .数值会每年通过TM影像采样更新,每5年详尽的报道。
8 _2 p: @, E# E( B; g
S# l$ M% B7 e3 z& M1 V4 f; p- P可以被估计每一年,使用每年
5 R+ h( O( |6 T的值和每5年的值。9 q, o- z% E# p* M# U
3 {& ]: Z% m ]3 E& j, s4 M
=(1-)×=(1-)×(1-)×P
# y l) W7 o' s1 Q( o因此,我们试图估算
# C4 H4 W2 f" u" H
8 q. B( S1 X+ l, v! R" a# T、、
( ~+ M9 I3 G; g& @6 y P
5 t" m9 H/ r! o$ j) ^9 q、8 @% J1 c; \3 T# t$ |: Q8 ~
% X- x' U' Z- A" }, r* A! e,以及它们的标准方差和相对方差,利用航空照片和TM 图像的采样。1 c9 [: r, p% s/ r0 q; c3 K
三明治空间抽样模型有以下优点:①模型打破了样点和报告曾的联系,在同等精度要求条件下,一般能够减少抽样点个数。知识分层是根据调查目标的空间异质性特征划分,一次一般情况下知识分层的个数少于报告单元个数。②报告单元可以由用户定义,不影响抽样点布设。报告单元可以是用户感兴趣的各自空间区域,并且不需要保证每个报告单元里必须包含抽样点。③三明治空间抽样模型引入了各种先验知识,提高了抽样精度。④在每个知识分层单元内部,样本布设可以按照简单随机、系统等多种方式。* e" b( \/ M, L: x, }
3.3其他抽样方法的研究与实践' x5 S9 |7 z! R. t
Tobler (1970)曾指出“地理学第一定律:任何东西与别的东西之间都是相关的,但近处的东西比远处的东西相关性更强”。空间数据由于受空间相互作用和空间扩散的影响,彼此之间不再相互独立。遥感数据是空间数据的一种,故此遥感影像上各像元之间存在空间自相关性(spatial autocorrelation ),即距离近的像元之间具有相似的* ?; H7 R* N, X1 ~" l# ]
光谱特征,具体表现相同地物类别之间有着相同或者相似的特征(边界、幅度、纹理、灰度值、统计系数等)。因此在进行空间抽样是需结合空间相关性进行合理分析。" o- i# c4 ^/ P
(1) 灰度共生矩阵
: o5 O5 r) K; n- t5 c' [) V0 `* I灰度共生矩阵定义为从灰度级i 的点离开按照某个固定位置关系(,)d θ。达到灰度级为j 的概率。其中d 表示两个像素间的距离,θ表示两个像素间的方向角,通常8 s! `/ n6 B# W6 ?
04590135d =????{,,,}。灰度共生矩阵的数
0 ^) @9 R' P. l1 K+ `/ O2 A学表达式为:* t& G8 e- V6 b! @3 ?7 `
()1122112211221122i,,,#{(,)(,)|(,),(,),|(,)(,)|,((,),(,))}
9 A: o% t6 A0 _- ?P j d x y x y f x y i f x y j x y x y d x y x y θθ===-=∠=) (16)/ u; \ P& ]% x& ~" s; [5 d: q7 t
其中,#表示按照式(16)中的限制条
. d! ^9 T H |$ H件,图像中11,x y ()位置灰度级为) {3 |! _ m: X$ v# x! ~' ~
i ,22,x y ()位置灰度级为j 的像素对的个数。/ }$ F0 v1 X1 G! _0 ~& A' x0 f$ g
+ h2 f+ p/ y- G" L E( h
为了便于提取灰度共生矩阵的二& C" Y3 z8 Q% i% Z) k
次统计特征,当计算产生灰度共生矩阵后,需用公式(17)对灰度共生矩阵进行归一化:
7 d/ o2 Y- J% ^, K) N7 v) M(,;,(,;,)(,;,)( V4 z* i( ^& _3 t v
,;,2#,,2#,,T S N x y x y P i j d P i j d P i j d P i j d L L d L L d θθθθθθ
1 a, n0 X) \# y7 r2 C+=
4 q4 {& t. M% L( S; Y1 ~7 F' T: \* d" ~=2 N I& K l; z5 k
??∑∑)()
. |6 l) N# V$ g! _(17)6 t2 ]# T9 x- x/ U! g: W$ e' a- j* n
其中,;,N
% S. s/ e! G8 Z1 `9 G6 C+ c5 N y. rP i j d θ()是归一化的灰度共" Z: H" q4 t( v; H5 m( H9 {
生矩阵,(,;,P i j d θ
" v( E# S2 }7 U3 `6 V( e)是未归一化的共生矩阵,(,;,)T- v4 |) N* M: ^ B/ _5 I& r
P i j d θ是为归一化的共生矩阵的
9 T1 Y( ?: `( l \& M转置,(,;,)S P i j d θ是未归一化矩阵与其转置的和,L 为行数或列数,
& a7 G# J$ y2 U7 Q) Y#,,x
7 _! O$ a( B, u" W# Yy& o/ b. Z7 w6 s) J: b
L L d θ, q- v$ f. f8 c% V! g
∑是未归一化的灰度共生矩阵具有特定空间0 w$ q3 f: I1 B$ o
关系的所有像素对的总和。4 y Q% G- Q# }# k0 U# p
(2)Correlation 相关性7 Y; i' R3 i2 j( C1 ]
Correlation 相关性表示行元素、列元素之间的相似程度,反映的是纹理的方向性,在某个方向相关性大则表示纹理指向该方向。
; h3 z' x7 v' F+ H# f11* ~3 }* k: Y! P2 R
((,))/L L- n! U3 G* v& t* B( ?! `& L* _
x y x y
5 v- E# {2 Z D( p* ?i j Correlation ijp i j μμσσ===-∑∑ (18)/ y% Z& `0 `! a) d8 n8 F
其中,(,)p i j 为灰度共生矩阵中的元素;,i j 分别为矩阵的行、列元素;5 a- p% L+ d7 {$ S& H4 C
11
6 }3 _0 R2 E# W) x8 E- O8 m, Q(,)L L x i j ip i j μ===∑∑;11+ ~0 h. l. k u* E
(,)L L
5 U3 A$ c5 D) ]1 h, z5 Z- R7 K5 Ly i j jp i j μ===∑∑;; f" S, F6 W! G6 a! [" ~' d
2
1 |) \- C" F2 s' Q11()(,)
% F" |1 R' p t# \ H8 Q9 {L L9 h; t5 U5 k. y7 G6 [" B3 ?
x x2 i( Z6 R; g7 s' t
i j i p i j σμ==-∑∑;* |* O8 U* p- j% c0 }
2* E; `* v7 G+ v g, Y0 Q4 L9 ~: T
11
, l/ A& [( l1 e! | y()(,)L
# E# d1 Z7 x: I- q% [7 n+ N/ T) QL$ ~7 I, {* y* \1 z7 ^
y& v* w0 G4 Y2 |* z+ M, S
y
$ D& B! t8 ^; _/ e) a+ p- m% r oi j i p i j σμ==-∑∑ 。! L; b5 C# I0 _
本文对某区域(分类结果如图(2)),基于灰度共生矩阵,计算得出了其各方向的
, X/ c/ d* \8 g* [空间相关性,如图(3)所示;为了简化检验步骤,本项目将上述的四个方向进行了合并,得出综合评价系数,如图(4)所示;表4 n, X- L3 x: \# p4 o, q4 k" o
(1)给出了用于该区域海岛遥感信息提取的样本像元的相关系数,样本量以及待, c2 f3 a' p% C! j, j
检验像元间距离等比较。
2 d0 F: W6 i' t! S( C3 H% g
5 P k9 m! U# g* F0 G4 y9 i; U1 P/ \5 j1 n6 }( r5 G
, L" O' {2 U. o$ a0 n w图1实验区域4个方向相关系数 图 2实验区域平均相关系数
$ e: T8 d7 M9 V t' `7 R" R" A8 n表1抽样统计表. e/ M4 n! i4 g6 l7 @. \
Correlation8 z. O! J6 F" }
Distance (px )
& w8 s' y) _) D) X3 Z) H; `* A7 T: vDistance (m )
. a5 N3 N5 k% lSample size
: D7 T! e, M" ?" m! r: {* a3 x5 A% W(Expected )5 ?5 M% ^9 Q4 x8 H! H7 m% v
Sample size (Practical )
$ x, B( Q! E8 J+ n, h9 b8 N0.7 7 105 8201 8265 0.6 17 225 1390 1404 0.56 Z& ?/ z' G7 r; `
42
& i( q3 }$ ] k. z1 @) E! ]% T3607 X& r' q3 Y7 \/ X9 E G/ j
227! `2 w% \) ^0 p" n# W o
240
6 |2 W0 _9 m. C3 T- c 0.4 71 1065 79 90
( ]* i* |% w' E/ w( M, I其中,预期样本量为计算数据,由行列各间隔相等步长抽样所得。实际样本量为实际抽样数据,因遥感影像范围影响样本像元的选择,故此在计算数据的基础上稍作调整。
7 H# `! Y! a$ N) b) Z# g. K4空间抽样问题7 ~) S# f" o5 H3 j" R
无论是在样本独立的假设条件下还是在样本不独立的空间相关假设条件下,抽样主要是解决下面四个问题[7]:5 u2 l. ~# _0 H& z" d4 I
1)确定样本量大小:选择样本的容量,即样本的个数;
! C( r4 s- y0 d$ i2)布样:样本如何分布,即从总体中采用什么样的方式,如何将样本从总体中选出;) u. I" e) s# F
3)抽样估计:对抽样目标的估计,例如:均值、总值等;( Q ~: A) J4 b: w, V
4)不确定性衡量:抽样估计的不确定性衡量,如方差;
! k, F# n. ^, X" T样本空间构造。样本空间是所有样本及其构成方式。例如,在湖泊调查中,调查湖泊污染,那么湖泊本身就是抽样的总体,样本空间构造是通过格网化得到离散对象,亦或直接以整个湖泊作为连续的样本空间,则估算均值和总值的方法是不同的[9]。在空间抽样中,核心内容之一就是样本的空间布局。样点位置选择的好坏不仅关系到资源的有效利用,而且会对后续研究结果产生重大影响,最优样点选择问题取决于抽样目标和抽样统计推断方式[14]。
) K( f9 l- B" K1 }5总结与讨论
; t& l* O9 ?. F' N @0 u, p4 x2 H本文综述了以下几个方面的内容:(1)空间抽样的发展和空间抽样问题(2)国内外空间抽样理论发展状况(3)三大经典抽样方法及三明治空间抽样模型的应用现状。
0 I+ {5 m) [. F3 f: {# E* x使用空间抽样方法检测海洋空间数据质量,在近年来出现了很多新的方法,这些方法基本上可以概括为三点:第一,样本布局法,充分挖掘先验信息,使所含信息量最大,从而合理选择并分配样本点。第二,样点选择法,组合样本点的选择在计算机学科里通常称之为完全N-P 难题,是一个世界性的难题,目前没有能针对大规模样本达到完全最优的行之有效的解决办法。目前常见的解决办法是启发式(序贯选择)或计算机演化算法(模拟退火、遗传算法等),得到的结果一般是近似最优。第三,以Kriging 相关理论为基础,以提高抽样精度为目标的
* U! `( u8 _: C! k 2016年5期
0 A% c* [- ~3 |. ]" K, t* a# L抽样理论;或者是以空间优化布局为基础,以样本的空间均衡布局为标准或者是按照某种空间布局为基础的抽样理论。
: l7 ^# g0 G, `# S* A) e$ g海洋自然资源的长期监测在国民经济生活以及科学研究领域中都具有重要意义,实际中一般采用抽样调查的方法快速获取其动态变化情况,在长期的监测中,海洋空间对象的空间
. M V( B' ?1 O9 {5 t相关性特征会发生变化,而实际中很多抽样方式一直沿袭最初设定的方案,这会产生很多问题,因为,早期设定的最优分层方式也许过了一段时间后已不再最优,需要重新对抽样总体进行评估并制定新的优化抽样方式。) b+ }/ a8 G0 b
参考文献:1 ~4 Z2 W( A, D+ N
[1] Matheron G. Principles of geostatistics. Economic Geology, 1963, 58: 1246-1266.
, g7 q2 d: A, O @1 t# E3 }[2] Matheron G. Kriging, or polynomial interpolation procedures. Canadian Mining and Metallurgical Bulletin, 1967, 60:1041-1045.
$ G8 |- _- ? M! G; T9 a% z1 D[3] Wang Jinfeng, Zhuang Dafang, Li Lianfa. Spatial sampling design for monitoring the area of cultivated land.
" E0 @0 h o% C/ H: ?International Journal of Remote Sensing, 2002, 13(2): 263-284.# u* J, I! F! F! |; m- y) ]
[4] 姜成晟,王劲峰,曹志冬.地理空间抽样理论研究综述[N].地理学报.2009,3.
1 w) t0 U/ X) w[5] 曹志冬,王劲峰,李连发, 姜成晟.地理空间中不同分层抽样方式的分层效率与优化策略[J].地理科学进展.2008,5.
+ z& m2 c4 n( z3 P0 m[6].冯士雍. 抽样调查应用与理论中的若干前沿问题[J].统计与信息论坛.2007,19 _$ C( D- C+ I. O
[7] Delmelle E. Optimization of second-phase spatial sampling using auxiliary information. In: Department of Geography,State University of New York at Buffalo, 2005. 108.. c$ ]+ k! `: ~7 k/ }- q7 N. D3 ]! g
[8] 姜成晟, 王劲峰, 曹志冬. 地理空间抽样理论研究综述[J]. ACTA GEOGRAPHICA SINICA, 2009, 64(3)." u3 P7 ]; a* m1 s$ x- ?) w0 n
[9] Li Chonggui, Zhao Xianwen. Determining the optimum sample plots for establishing canopy density estimating equation in monitoring area. Journal of Beijing Forestry University, 2005. 27(6): 24-27. [李崇贵, 赵宪文. 确定监测区域建立森林郁闭度估测方程最优样地的研究. 北京林业大学学报, 2005, 27(6): 24-27.]
7 {* m- n H8 {, P[10] 许丽娜, 王孝强. 我国海洋环境监测工作现状及发展对策[J]. 海洋环境科学, 2003, 22(1): 63-68.! B& Z3 h2 p; }; s: R+ @
[11] 曹志冬, 王劲峰, 李连发, 等. 地理空间中不同分层抽样方式的分层效率与优化策略[J]. 地理科学进展, 2008, 27(003): 152-160.' b2 U( u, v. S; s
[12] Matheron G. Principles of geostatistics. Economic Geology, 1963, 58: 1246-1266.: v4 O# n1 i8 `& Z4 g
[13] Matheron G. Kriging, or polynomial interpolation procedures. Canadian Mining and Metallurgical Bulletin, 1967, 60:1041-1045.
) b; a/ ?: p5 r& A[14] 姜成晟, 王劲峰, 曹志冬. 地理空间抽样理论研究综述[J]. ACTA GEOGRAPHICA SINICA, 2009, 64(3).
# z; M+ ?" z( P% a 第1卷第1期计算机学报Vol. 1 No. 1 2015年5月CHINESE JOURNAL OF COMPUTERS 5. 2015 |