2024年4月18日发(作者:)
维普资讯
第34卷 第9期
Vbl34
・
计算机工程
2008年5月
May 2008
Ⅳ0.9
Computer Engineering
软件技术与数据库・ 文章编号:1001)---3428(2008)09--0050--02 文献标识码:A 中图分类号:TP391
RSTT模型在空间数据检查软件中的应用
孙炎,罗晓沛
(中国科学院研究生院,北京100049)
摘要:针对如何保证大量测绘采集的图形数据能满足空间数据建库的要求,提出一套可以提供规范、通用、自动、高效的数据检查软件,
通过质检任务、质检方案、质检模板和质检规则的四要素质检模型,实现质检软件的可配置化和工程化解决思路,支持质检方案的动态定
制。结果证明该软件可实现大部分空间数据类型的质量检测。
关键诃:质检;空间数据;模型
Application of RSTT Model in Spatial Data Checking Software
SUN Yan,LUO Xiao—pei
(Graduate University of Chinese Academy of Sciences,Beijing 100049)
[Abstract]In order to assure the quality of vast survey data on geography data which must meet hte requirement of spatial database building,the
paper designs a normative,universal,automatic,eficientf software,through checking rule checking scheme,checking template,checking task and
RSTT mode1.A configurable and projectable resolution is carried out which support dynamic configuration of checking project,all of check type
will be supported in heo ̄.t
IKey words]qualiy checkting;spatial data;model
国内各行业大量的测绘数据、专题数据等数据成果正在
不断形成的过程中,传统的数据检测大部分是由手工完成,
效率低且准确度不高,而其他的质检工具往往针对特定的数
据做单一的检查,需求一旦发生变化很难进行维护修改,检
查也不够全面。如何保证这些大量的采集数据成果满足空间
如图2所示。其中,质检任务管理器负责创建质检维护任务;
质检方案设计器负责设计质检方案;质检模板设计器负责设
计质检模板;质检模板规则管理器负责管理所有的质检规则。
规则管理器
选
模板设计器 方案 任务
选 设计器 选 择 管理器
数据建库的要求,为将来数据成果的共享和交换奠定基础。
针对这个问题,本文以空间数据质检软件平台的设计实现过
程为基础阐述其中用到的一些关键技术,这些技术中最关键
图形长度检测规则
拓扑检测规则 择 基本农田不能跨行政界I 择 斗4方案1} 案
规 横 —' 任务1
则 用途分区满足剖分 l 板
属性唯—性 一检测规则
属性空值检测规则
基期地类满足剖分
基本农田与待置换地
_—— -1…卅一— ● … 『
-4方案 一 —' I任务
/
的是集任务、方案、模板、规则为一体的质检模型:RSTT;
将数据分类存储的面向对象的空间数据模型:Geodatabase 0。
不能重叠
1质检模型
1.1质检模型西要素的关系
质检模型由质检任务、质检方案、质检模板、质检规则
四要素构成,它们之问的关系如图1所示,其逻辑关系为:
(1)一个质检任务必须包含且仅包含一个质检方案;(2)一个质
检方案包含一个或多个质检模板;(3)一个质检模板包含一个
或多个质检规则。
l管理任务编号、任务名称’任务类型 数
l据生产单位、检测单位、检查人员、检测
-
图2质检模型要素维护对象
1.2质检模型四要素
1.2.1质检任务
质检任务用来维护一次完整的数据检测过程即一个完整
的数据检查,通过质检任务来进行管理和组织,因此质检任
务是一次完整数据检查的组织和管理的基本单元。
任务对检查过程的维护,主要内容包括:任务基本信息,
任务相关的日志,检查过程中生成的临时数据,检查的结果
数据,统计评价的结果,输出的报告等内容。
.
1日期’使用规范、等信息;选择供检查的
结
质检任务通过任务管理器进行,任务管理器管理所有的
任务,包括执行完成的任务、未完全执行的任务、未执行的
任务,能进行创建任务、删除任务、执行任务、打开任务查
看任务执行结果和修改任务属性等操作。
一
匝 二]
1.2.2质检方案
在系统数据检查流程中,自动检查是核心,其自动性取
作者简介:孙炎(1980一),男,工程师、在职硕士研究生,主研方
E—mail:sunydist@msn.con r
图1质检模型四要素的关系
质检任务、质检方案、质检模板和质检规则的维护对象
分别为任务管理器、方案设计器、模板设计器和规则管理器,
向:空间数据库技术及其应用;罗晓沛,教授
收稿日期:2007—11—10
维普资讯
决于质检任务建立时质检方案的确定。系统自动检查时,将
严格按照该方案所确立的流程和内容进行自动检查。
质检方案分为如下2种:
在创建方案时,用户可以同时从系统模板和自定义模板中选
择模板。
(3)质检类型的定义
质检类型是对质检模板的一个逻辑分类,例如可分为图
形检测、属性检测、属性结构和图层完整性检测、逻辑一致
(1)标准方案。标准方案的创建需要选择所使用的标准规
范的类型,在创建方案时,质检模板所使用的数据源的图层
和属性表结构,将从标准数据字典中读取,即使用标准的图
层和属性表结构定义。标准方案所使用的数据源,是标准结
构的图库;
性检测等,如图5所示。每种质检类型是质检模板的一个逻
辑组合,质检类型里可以包含相同类型的质检模板,如全部
都由检查图形的质检模板或者全部都由检查属性的质检模板
(2)任意方案。任意方案的创建,与标准无关,即它不进
行标准图层和属性字段等规范性的检查。任意方案所使用的
数据源,其图库中的图层及表结构是任意的。它主要针对临
时性的检查。
质检方案通过方案设计器进行维护。方案设计器管理所
组成,也可以是多种类型的检查模板组成。质检模板设置的
目的是使得逻辑结构清晰合理并为统计评价提供分类依据。
评价模型服务,可以为各质检类型设定百分比权重。
有的方案,包括标准方案和任意方案,能进行创建、删除、
修改方案等操作。任务和方案的关系如图3所示。
方案设计器 任务管理器
I方案l 锁定!J~ 选择方篓 -l 任务l J
I._. 1 任务2 I
J方知 l
l …
J 任务
1.2.4质检规则
图5质检类型分类
图3方案和任务的关系
规则是对可能出现的错误类型进行的一个抽象,具有普
1.2.3质检模板
质检模板是对质检规则的一个逻辑AND或OR的组合。
质检规则具有通用性,对于任何数据类型都适用,而质检模
板是针对特定的数据,对质检规则进行再组合,以达到特定
的质检目的,而不是对所有的数据类型都适用。
(1)质检模板和质检规则的关系
模板需要根据实际数据检测的内容进行创建,它具有实
遍适用性。它是质检模型的最小单元,是最有活力的质检元
素,也是质检功能承载的实体,所有的质检功能都由规则体
现。规则包括各种拓扑规则,如“不能重叠一一Must Not
Overlap”规则等,各种属性规则,如空值检测规则、唯一性
检测规则等。
由于数据检查的内容具有多变性的特点,如果现有规则
无法实现质检需求,则按照规定的标准接口 实现新的质检
规则,使用“DLL+标准接口(Interface)”的技术,即可将新
的规则添加到系统框架中。质检规则的扩展接口如图6所示。
际意义,所以它是针对某一特定数据类型的(如针对土地利用
规划数据),具有专业性,但不具有广泛适用性。如“地类图
斑面内无重叠无缝隙”这个模板,它是由“MUST NOT
OVERLAP”和“MUST NOT HAVE GAPS”两个规则通过逻
辑OR组成。又如“面积1【)(】且某某字段属性值为空”这个
模板,它是由“面积检测”和“空值检测”两个规则通过逻
辑AND组成 。以上两个模板都是针对特定的数据进行检
测,不具有普遍适用性。
(2)模板的分类
模板分类如图4所示。
.[ 避
一程序
Virtual HRESULT SetConnectionO=O:
Virtual HRES ̄T QueryInterface(、=O:
u
疋
) 义
图6质检规则的扩展接口
2 Geodatabase技术
Geodatabase是建立在DBMS之上的统一的、智能化的
空间数据库,Geodatabase按层次将地理数据组织成数据对
象并存储在要素类、对象类和要素集中,Geodatabase中还
包含几何网络、域和规则等 J。
本系统采用数据库存储方式,将图形数据、属性数据、
图4模板分类
检查结果数据和系统数据统一存储在Geodatabase中。数据
组织和管理方式使图属一致性检查、联合检查成为可能。检
查规则中涉及到的图形拓扑关系的检查通过Geodatabase提
供的4O多个内置拓扑关系检查即可完成。
(下转第54页)
质检模板分为系统模板和自定义模板。系统模板是系统
预先给用户定义好的模板,自定义模板用户针对特定的数据
数据检查而建立的模板。对系统模板不能进行创建、修改和
删除操作,对自定义模板可以进行创建、修改和删除操作。
维普资讯
4结束语
本体概念是本体工程的基石,对本体概念的深刻内涵和
归一化处理的研究可以使本体工程沿着更科学的方向快速发
展。在构建基于本体的知识库和基于本体的协同产品开发环
境时,提出了自己的见解(定义1~定义4),这些新定义的意
义在于:
(1)定义1明确地提出,任何一个本体都对应于一个论域,
这与逻辑理论相一致。本体就是在这个论域上建立的知识模
型,它构成一个(逻辑)理论。
(2)定义2用子本体统一了不规范的模块化思想。子本体
和父本体之问的关系体现在论域的包含关系上,具有严格的
数学意义。
(3)定义3和定义4说明可以对已有的本体通过一定的操
图5用扩展的UML语言创建的消息本体
作(运算)生成新的本体。
(4)这些本体定义使本体从无形趋于有形,从复杂变得简
单;从模糊的大一统到清晰的层次化。
在此基础上,应当重新审视本体的分类体系,对现有本
体的逻辑表示语言进行扩展和统一并进一步研究构成原子本
体的充要条件和本体运算的具体而精确的定义,这样才能在
定义4(本体的递归定义)
。=
其中,.表示定义在本体上的二元算子,如融合、对齐、组
合、集成、求交;0 和Df是原子本体或本体。
通过下例可以说明本体递归定义的意义。假设在创建木
材本体时,考虑到主要的应用是装修业和造纸业。装修关心
木材的强度、花纹、手感和香型等宏观特性;造纸关心木材
真正意义上实现本体创建、进化、操作和维护的自动化或半
自动化。
参考文献
[1]Bao Jie,Doina C,Vasant H.Towards Collaborative Environments
for Ontology Construction and Sharing[C]//Proceedings of the
International Symposium Oil Collaborative Technologies and
的纤维长度、强度、色质和柔性等微观特性。这样就可以针
对适合于装修的木材和适合于造纸的木材分别创建2个木材
的子本体。必要时这2个本体可以经过“集成”形成木材本
体(如图6)。
Systems.Washington D.C.,USA:IEEE Computer Society,2006.
[2]Batres R,West M.An Upper Ontology Based on ISO 15926[J].
Computers and Chemical Engineering,2007,3 1(5/6 ̄:519—534.
、,
‘
[31 Noy N F.McGuinness D L.Ontology Development 101:A Guide to
Creating Your First Ontology[DB/OL].(、2007—06—30,).http://
图6本体模块化的必要性和方法举例
ontoworld.org/wiki/OntologyEngineering#OTK
methodology.
通过概念和应用分析不难发现:装修材料和造纸是具有
交叉关系的2个本体。“壁纸”是装修的一种材料也是纸的一
类,壁纸是装修本体和造纸本体的“交”。这样就可以十分方
便地采用自下而上和自上而下相结合的方法(综合法)来建立
本体。
[4]Takeda H,Iino K.Ontology—supported Agent CommunicationfDB/
OL].(2 007—06—3O).http:Hwww—kasm.nii.ac.jp/papers/takeda/95/
aaai—syposl’um.pdf.
[51l G6mez—P6rez A,Fernfindez—L6pez M,Corcho O.Ontological
Engineering[M].London;UK:Springer Press,2002.
(上按第47页)
[5]Witkin A E Scale—space Filtering[C]//Proc.of he 8tth Int’1 Joint Conf.
on Artifical Intelligence.Karlsruhe,Germany:Is.n.],1983.
Speed.Algorithms Based on the。Hamilton—Jacobi Formulation[J]
J
of Comp.Physics.,1988.79(D:12—49.
.
[6]Weicken J・A“i。 opic Difusion in Image rocPessing[M]・Stuttgart,
Germany:Te b“。r。Verlag,1999・
[7]Osher S,Sethian J.Fronts Propagating wih Curvatture Dependent
……………………………………………………
[8]严家斌
刘贵忠.一种新的各向异性扩散时间尺度估计方法fJJ
计算机工程
2008:34(
2
,
,
、,
:43—45.
…………
………………………一………~
(上接第51页)
3结束语
本文从工程化的视角出发,以平台设计的思想审视整个
上进行且要对业务有准确的理解,才能配置出适合业务需求
质检过程,抽象出质检任务、质检方案、质检模板、质检规
的规则。同时Geodatabase数据模型的拓扑关系要根据需要
临时构建,这需要消耗一定的系统资源和时间。
则四要素构成质检模型,层次清晰,即能满足规则的灵活配
置和扩展,又能针对不同的数据做到全面自动或抽样检查;
作为一个质检软件平台,除了质检模块以外,还有标准构建
学出版社,2002.
参考文献
[1]吴秀芹.ArcGIS 9地理信息系统应用与实践fM].北京:清华大
[2]全国地理信息标准化技术委员会.地理信息国家标准手册fM].
北京:中国标准出版社,2005.
[3]Zeiler M.为我们的世界建模:ESRI地理数数据库设计指南fM].
北京:人民邮电出版社,2004.
模块、数据交换模块、错误查看模块、统计评价模块共5个
部分组成,它们层层关联,组成一个有机的整体。
本设计的不足之处在于,规则的配置必须在抽象的接EI
54一
发布评论