2023年11月30日发(作者:)

元数据格式汇总

1. DC(都柏林核心元数据)

2. CDWA(艺术作品描述目录)

3. VAR Core(可视资源委员会核心元数据)

4. CDF(频道定义格式)

5. ROADS元数据(主题信息服务的资源组织和发现)

6. IEEE LOMIEEE学习对象元数据)

7. BibTex(科技文献书目资源格式)

8. GEM(教育资源网关)

9. CIMI(博物馆信息计算机交换标准框架)

10. REACH元数据格式

11. EAD(编码文档描述)

12. ONIX(在线信息交换)

13. EELS(工程电子化图书馆)

14. EEVL(爱丁堡工程虚拟图书馆)

15. FGDC(联邦地理数据委员会)

16. GILS(政府信息定位服务)

17. MARC(机读目录格式)

18. MOA2(美国的创建II

19. MCF(元内容框架)

20. PICA+(荷兰图书馆自动化中心)

21. PICS(网络内容选择平台)

22. TEI Header(文本编码先导计划)

23. SOIF(概略对象交换格式)

24. IAFA/WHIOS++Templates(因特网匿名FTP文件库版式)

25. ICPSR SGML Codebook(政治和社会研究方面的校际联盟)

26. LDAP DIF(轻便型目录获取协议)

27. RFC 1807(书目记录格式)

28. URCs(统一资源特征)

29. SGML(通用标准标记语言)

30. Warwick Framework(Warwick框架)

31. Web Collections(网站集合)

32. XML(可扩展标记语言)

33. RDF(资源描述框架)

iii

1. DC(都柏林核心元数据)

名称:Dublin Core Metadata,DC

简介:都柏林核心元数据是一个由计算机专家、网络专家和图书馆专家等人员所组成的非正式小

组开发的,目的是要建立一个广泛的元数据元素集,可以描述任何网络信息资源,并足够的简单

以至任何作者无需专门的培训就可以创建自己文件的元数据。DC具有创建和维护简单、广为理

解的句法、系统互用性、可扩展性等特点。目前,DC已经拥有15个基本元素,并可以使用TYPE

SCHEME限定词以及LINK参照对元素进行扩展。

网址:

2. CDWA(艺术作品描述目录)

名称:The Categories for the Description of Works of Art

简介:艺术作品描述目录(CDWA)AITF(the Art Information Task Force)1996年开发,主

要为提供和使用艺术信息的团体(如博物馆和档案馆)描述艺术作品(包括其图像)提供结构化工

具。它的描述重点在于“可动”的对象及其图像,包括来自不同时期和地理范围的油画、雕刻、

陶艺、金属制品、家具、设计、表演艺术等等。该元数据有26个主要类目,每一个类目有其子

类目,包括主题、记录、管理等项目。

网址:/gii/cdwa/

3. VAR Core(可视资源委员会核心元数据)

名称:Visual Resources Association Core

简介:美国可视资源委员会(VAR)为了规范描述可视文化作品及其图像资源,颁布了此项标准,

20006月已经出版到第三版。可视作品主要指绘画、雕塑、表演、乐曲、文艺作品、建筑物、

建筑设计或其他含有文化含义的物品等,这些物品可以独立存在,也可以由多个部分组成。元数

据描述的对象可以是这些物品的复制品或代表物,可以是幻灯、照片、录相或各种数字化形式。

一个作品可以拥有多个数字化形式。该方案含有17个核心元素。

4. CDF(频道定义格式)

名称:Channel Definition Format

简介:频道定义格式由微软公司在1997年三月提出。作为一个开放的专门说明,CDF允许网页

出版商实现从任何自动传输的WEB服务器到相容的接受程序之间提供快速更新的信息集合或频

道。CDF使用XML,并对XMLWeb Collections进行了扩展,面向的用户是创建网页的个人或

机构。它使用一个简单句法创见频道,因而除了WEB服务器和CDF适应的浏览器之外,不需要任

何技术支持。

网址:/pub/WWW/TR/

5. ROADS元数据(主题信息服务的资源组织和发现)

名称:Resource Organisation And Discovery in Subject-based services

简介:是英国高等教育领域对互联网信息资源进行收集组织并提供检索服务的系统,其主要目标

是建立一个主题信息网关,帮助信息服务机构快速构建能够有效组织和检索专业领域信息的系

统。

ROADS系统利用一组元数据应用模版(Metadata Templates)来定义和组织描述不同类别资源所

需的元数据,并且有一套注册系统负责支持重用这些元数据模版、元素,并实现这些不同类别资

源在元数据语义方面的互操作。

6. IEEE LOMIEEE学习对象元数据)

名称:IEEE Learning Object Metadata

简介:IEEE学习技术标准委员会P1848.12学习对象元数据工作组建立,用以完整、充分地描

述一个学习对象的特征。定义了学习对象模型,学习对象元数据的语法和语义,目的在于使用最

小属性集完成对学习对象的管理、检索和评估,并且便于将来对其属性进行扩展。

7. BibTex(科技文献书目资源格式)

名称:

简介:BibTex是描述科技文献书目资源的格式,LaTeX的一部分(LaTeX是文件打印设置系统)

BibTex是一个单独的程序,通过从一个书目数据库获取信息从而产生文件的来源列表。主要用

在科学和学术界以及工业领域。

网址:ftp:///tex-archive/biblio/bibtext/distribs/doc/

8. GEM(教育资源网关)

名称:the Gateway to Educational Materials

简介:,美国教育部支持,致力于组织和整合美国各类网站上的教育资源,以便人们方便地检索

和获取。项目复用了DC15个元素,并扩展了8个新元素。

9. CIMI(博物馆信息计算机交换标准框架)

名称:A Standards Framework for the Computer Interchange of Museum Information

简介:CIMI是博物馆信息计算机交换标准框架,完整的框架包含交换协议、交换格式、低层网

络和通信以及内容数据标准。现阶段CIMI的主要计划是CHIO(Cultural Heritage Information

Online,文化遗产联机信息)主要目标是提供对各类博物馆信息的记录方式,包括展览目录的全

文本、展品文字解释(wall texts)、图象以及传统的文献类信息。CHIO包括两个部分:CHIO

(包括内容数据标准及其格式)CHIO存取(access)。前者使用SGML,后者使用Z39.50

网址:/pub/sgml/ead

10. REACH元数据格式

名称:RLG REACH Element Set

简介:1997年美国研究图书馆协会RLG(Research Library Group)为探索有效组织博物馆信息、

提供博物馆资源在线服务而提出了这个元数据格式,包含20个基本元素。

11. EAD(编码文档描述)

名称:Encoding Archival Description,EAD

简介:编码文档描述是SGML的一个专用数据类型(DTD)。美国国会图书馆网络开发/MARC标准办

公室是它的维护机构,美国档案管理员协会(SAAthe Society of American Archivists)是该

标准的所有者。EAD主要用于描述档案和手稿资源(manuscripts collections),并利用网络检索

和获取档案手稿类信息资源。相对于提供概括性描述和整体存取的MARC记录,EAD意在提供具

体细节的描述和存取。EAD还提供“发现辅助”(美国使用“发现辅助”-finding aids-英国使

用“详细目录”-detailed catalogues),力图提供一个完整、等级式的描述结构,并主要为具有

知识组织和档案实践的人们所设计。高层元素主要包括:头标;前面事项

mater>;档案描述。每一个高层元素又包括多个小项以及若干细项。

网址:ftp:///pub/sgml/ead

12. ONIX(在线信息交换)

名称:Online Information eXchange

简介:是一种描述、传递和交换出版物元数据的国际性标准,克服了MARC在支持电子贸易EDI

和电子商务方面的不足。由出版商、发行商、零售商、图书馆以及在这条供应链上其他环节的经

营者共同制定,参加者有许多出版发行行业的国际协会和巨头。目前的版本是20017月形成

ONIX2.0版。

13. EELS(工程电子化图书馆)

名称:the Engineering Electronic Library

简介:工程电子化图书馆是瑞典大学技术图书馆的一个合作计划,为网络信息资源的质量评价提

供一个信息系统。EELS使用的元数据是该计划所专有的。目前,该格式只由图书馆员与信息专

家使用。EELS格式包括11个属性.

网址:/eel/

14. EEVL(爱丁堡工程虚拟图书馆)

名称:EEVL,Edinburgh Engineering Virtual Library

简介:爱丁堡工程虚拟图书馆是欧洲电子图书馆计划(eLib, the Electronic Libraries

Programme)资助的计划,目的是为工程领域的高质量信息资源提供主题查询网关。它的元数据格

式为该计划专有,包括22个属性,用于专门描述网络资源。

网址:/

15. FGDC(联邦地理数据委员会)

名称:FGDCthe Federal Geographic Data Committee

简介:联邦地理数据委员会在1992年建立了一个地理数据文件的术语和定义集合,并在1994

年通过数字化地理元数据的内容标准(Content Standards for Digital Geospatial Metadata),

名为CSDGM,但通常仍叫做FGDCFGDC包括300多个元素,包括7个主要段和3个辅助段。国

家地理信息交换所(National Geospatial Data Clearinghouse)作为主题化信息网关利用FGDC

实现数字化地理数据的发现、评价和下载。

网址:/Metadata/

16. GILS(政府信息定位服务)

名称:the Government Information Locator Services, GILS

简介:政府信息定位服务由美国联邦政府建立,面向普通公众和政府用户提供如何定位和查找由

许多政府机构产生的有用信息,因此它的用户非常广泛,许多国家的政府机构,如加拿大、澳大

利亚等正密切注视美国的GILS计划。

网址:/public/gils/prof_

17. MARC(机读目录格式)

名称:MARC

简介:机读目录格式是图书馆描述、存储、交换、处理以及检索信息的基础,经过不断发展已被

图书馆用来描述和存取电子信息资源,例如扩展MARC格式的“电子位置及提取方式字段”(即

856字段,可重复)可利用MARC记录描述网络化电子资源(包括网页、电子期刊、telnet系统、

FTP站点等)的特征、连接方式和提取要求。最近,有关机构还开展了MARCSGML等元数据格

式互操作性的试验。

网址:/marc/

18. MOA2(美国的创建II

名称:the Making Of America II

简介:美国的创建项目起始于1995年,由美国Digital Library Federation支持,最初由米歇

根大学和康乃尔大学合作进行,对美国南北战争以前关于美国社会历史的珍贵书刊进行扫描,

供电子版本服务。因此这个元数据标准主要是关于数字图像的元数据,分结构性元数据、管理型

元数据等,对图像数字图书馆的资源加工、管理和元数据元素的选取、元数据方案的制定具有很

好的参考作用。

19. MCF(元内容框架)

名称:Meta Content Framework,MCF

简介:元内容框架,由网景公司于19976月提交给W3C。它是过去多项元数据工作(XML

CDFPICSWeb Collection)发展的结果,产生了一个“数据模型和相应的交换格式”,足够强

大以适应任何应用。MCF主要应用于:描述WEB站点或频道集合的结构;贯穿emailPIM功能;

分布式注解和创作;交换相关于商业的信息,如价格、存货清单、送货日期。

网址:/mcf/

20. PICA+(荷兰图书馆自动化中心)

名称:The Dutch Center for Library Automation,PICA

简介:荷兰图书馆自动化中心为荷兰图书馆以及许多德国图书馆网络提供共享编目、馆际互借以

及文件传送等服务,建有NCC/IBL系统,它提出了基于MARC的文献数据库和其他信息资源描述

格式。

网址:/metadata/desire

21. PICS(网络内容选择平台)

名称:Platform for Internet Content Selection,PICS

简介:网络内容选择平台始于19958月,最初用于帮助父母和老师控制儿童获取网络资源,

后来作为一项技术规范,使用户能够轻松找到合适的内容又避免那些对自己或儿童不适合、不需

要的内容。该规定易于创建和获取,标记各种系统以及相关的内容选择和过滤机制,从而允许不

同的人和机构以最适合各自观点的方式标记网页内容。PICS技术规范最终在1996年初完成,此

PICS被结合到一系列产品中,例如基于PICS的评级服务和过滤工具被大量地开发出来。

网址:/issue9/pics

22. TEI Header(文本编码先导计划)

名称:the Text Encoding Initiative,TEI

简介:文本编码计划开始于1987年,其目标是定义一个表现电子化文本资料的通用格式,使研

究者能交换和重复使用资源,不受软件、硬件和应用领域的限制。美欧的许多学术团体已加入到

该计划中,并组成多个委员会考虑编码的各个方面。TEI Header作为TEI格式中元素定义部分,

基于SGML/DTD,可作为TEI文件的一部分,或作为独立的元数据存在。

网址:ftp:///pub/ota/TEI/doc/

23. SOIF(概略对象交换格式)

名称:the Summary Object Interchange Format,SOIF

简介:概略对象交换格式,是科罗拉多大学Harvest体系的一部分。SOIF记录由Harvest搜集

器产生,并由Harvest代理使用,用于用户搜索,提供了由Harvest搜索器找到的资源的概况。

19963月,网景公司宣布在其目录服务器中使用SOIF,其它搜索引擎也准备支持SOIF

网址:/afs//public/tr

-g/Harvest/user-manual/

24. IAFA/WHIOS++Templates(因特网匿名FTP文件库版式)

名称:IAFA Templates,Internet Anonymous FTP Archive Templates

简介:因特网匿名FTP文件库版式是由IETE(Internet Engineering Taskforce)IAFA研讨班

设计的,目的是建立一个记录格式,可以被FTP文件库管理员用来描述来自这些文件库的各种资

源。IAFA版式通过描述FTP文件内容和服务实现对FTP文件库的有效获取。最初的打算是FTP

站点管理员能让每一个访问该站点的用户获得该版式描述的信息。如果FTP站点使用普通的索引

和目录指南,那么类似Harvest那样的软件就能自动检索记录。现在,IAFA版式已开发出使用

whois++协议实现FTP文件库的检索和获取,同时还具有在多个数据库之间搜索的能力。IAFA

支持者已经扩展了最初目标,立足设计一个足够简单的记录格式,能被参加创建网络资源的个人

和机构所使用。

网址:/mark/projects/iafa/

25. ICPSR SGML Codebook(政治和社会研究方面的校际联

)

名称:ICPSRInteruniversity Consortium for Political and Social Research

简介:政治和社会研究方面的校际联盟,在1995年建立了一个委员会,针对社会科学研究团体

对国际性Codebook标准的需要,开发描述社会科学数据集的结构化信息集。一个Codebook通常

包括结构、内容、数据文件或数据集的信息,该委员会力图覆盖社会科学中各类数据集和数据集

系统,其Codebook中的元素是从社会科学调查、研究、档案和技术团体中使用的一系列使用指

南和标准中选取的。

网址:/

26. LDAP DIF(轻便型目录获取协议)

名称:LDAPthe Lightweight Directory Access Protocol

简介:轻便型目录获取协议为那些在OSI低层中无法运行目录获取协议的机器提供获取X.500

目录服务的方式。LDIF,即LDAP数据交换格式(LDAP Data Interchange Format)已被网景公司

采用,它声明要将LDAP结合到它的网景导航器(Netscape Navigator),这意味着WWW的用户将

拥有一个被直接传送到用户桌面的目录搜索和检索协议,这相对于目前通过第三者进行搜索和检

索工作的现状,的确是一个进步。

网址:/~rsug

27. RFC 1807(书目记录格式)

名称:A Format for Bibliographic Records, 1995

简介:由R. LasherD. Cohen1995年提出的方案,用以描述计算机科学技术报告和以FTP

等网络资源形式存储在网络服务器中的文档。万维网协会(W3C)的许多技术标准文档均以RFC

开头,意为Request For Comment,从字面上看并不是标准,文档内容中也常常说明RFC文档不

是标准,然而许多RFC确实是实实在在的事实标准。RFC1807的具体版本格式被称为TR-v2.1

取代了1992年的RFC1357该格式被NCSTRL:Networked Computer Science Technical Reference

Library等项目应用,其优点在于文档的创建和阅读都很容易,可使用任何文本编辑器,不需要

专门的程序。

网址:/htbin/rfc/

28. URCs(统一资源特征)

名称:URCs,Uniform Resource Characteristics/Citation

简介:统一资源特征用于识别:关于联机资源编目信息的长术语;连接元数据或描述信息的标准

方式;作为将URN分解到URL的过程信息;选择资源时的应用信息。URC的目的在于全面确保电

子资源的机器可检索性。

网址:/URI

通用置标方案

29. SGML(通用标准标记语言)

名称:Standard Generalized Markup Language,SGML

简介:通用标准标记语言作为国际标准(ISO88791986),利用通用方式和元标识语言(meta

language)对文献内容和结构进行标记,实现对各类文献结构和内容的系统化标准化描述,从而

建立起通用数字化文献。SGML文献由SGML前言(SGML prolog)SGML例示(SGML Instance)

成,其中SGML前言包括SGML陈述(SGML Declaration)和文献类型定义(Document Type

Definition,DTD)DTD由描述标记的一系列标记定义组成,包括元素定义(element

declaration)、属性定义(attribute declaration)、实体定义(entity declaration)和注释定

(notation declaration),不同类别文献将有不同的DTD。目前,SGML广泛应用于文件及元数

据格式的编码,成为众多元数据格式的基础。

网址:/sgml/

30. Warwick Framework(Warwick框架)

名称:Warwick Framework

简介:Warwick框架是一个集合元数据对象的结合性结构。它是在由UKOLNOCLC联合举办的

第二届元数据研讨班上提出的,用于交换元数据包。一个包(package)是用于某专门目的的元数

据对象。一个基于DC的记录就可以是一个包,一个GILS记录也是一个包。这种结构是模型化的,

允许不同类型的元数据类型:是可扩展的,允许新的元数据类型;是分布式的,允许参考外部元

数据对象;是递归性的,允许元数据对象处理信息内容和有与之相联系的元数据对象。

网址::80/Dienst/Repository/2.0/B-

ody/l%2fTR96-1593/html

31. Web Collections(网站集合)

名称:Web Collections

简介:网站集合作为XML的应用之一,19973月向W3C提出,用于描述网页资源的性质,建

立一个标准元数据框架。它主要集中在传统的HTML页面,其具体描述在文本上类似于

Collections可有广泛用途,如网页、网页组、电子邮件提取、PIM功能、调度、内容标记以及分

布式创建等等.

网址:/TR/

32. XML(可扩展标记语言)

名称:eXtensible Markup Language,XML

简介:可扩展标记语言由Generic SGML编辑调查委员会(W3C赞助下)1996年开发出来的,

Sun MicrosystemJoe Bosak负责。XMLSGML的一个应用文档或限制格式,但不是一个

固定格式,因而是“可扩展”的。XML本身不仅仅是一个标记语言,还是一个元语言,允许用户

设计自己的标记语言。XML实际上定义了一个简单的SGML语言集,用现在在HTML中可能的方式

实现普通SGML文件的使用、接受和处理。作为标记语言的元语言,XML可以运用到广泛的领域,

MCFRDFWeb Collections都使用XML作为基本的句法。

网址:/pub/WWW/TR/

33. RDF(资源描述框架)

名称:Resource Description Framework,RDF

简介:资源描述框架,是一个基于组(group-based)的元数据计划,由W3C(World Wide Web

Consortium)开发,通过多个致力于元数据发展的组织的共同努力,开发出一个强大、灵活的元

数据框架,能运用于广泛领域,确保元数据之间互操作性。可以说,RDF是处理元数据的基础。

RDF可以用于资源发现,为搜索引擎提供更强大的功能;用于编目,描述内容以及内容之间的关

系;用于智能软件,实现知识共享和交流;用于内容分级,用于描述表示一个逻辑文件的“页面

集”;用于描述网页的“智力属性权利”;用于表现用户“秘密爱好”以及网站“秘密政策”等

等。RDF的“数字化标识”是为电子商务等应用建立“可信赖网页”的关键。元数据的用户,如

搜索引擎、目录编制以及浏览器可采用RDF以改善网络资源的组织状况。

网址:/TR/REC-rdf-syntax/

参考文献

i

202.114.9.3/lib//1ce930115fcd2e7048256c9a0006f537/45ba08f01d4d9b8248256c9f

000e24ac?OpenDocument

ii

张晓林 《元数据研究与应用》 北京图书馆出版社 20025