2023年11月28日发(作者:)
第六章 网络信息资源管理
本章提要】
本章主要讲解了网络信息资源这种重要而又独特的信息资源的管理。在介绍网络信息资源类型和特点
的基础上,从多个层次对网络信息资源的组织进行了探讨,并着重对网络信息资源的检索进行了详细论述。
介绍了网络信息检索的过程、网络信息检索的工具,并对搜索引擎这一众所周知的最常用网络检索工具进
行了多角度探讨。在此基础上,本章从检索技术的角度,对网络检索技术做了较大篇幅的讨论,并结合常
用的搜索引擎进行了案例分析。本章最后对网络信息资源的评价进行了研究。
【学习目标】
1、网络信息资源的类型及特点;
2、网络信息资源组织的方法;
3、网络信息检索的过程;
4、网络信息检索的工具;
5、搜索引擎的基本概念、类型及其作用;
6、网络信息资源的评价。
【学习指南】
本章的重点是第1节、第3节、第4节。
【预习思考题】
1、网络信息资源主要有哪些类型?
2、和传统信息资源相比,网络信息资源具有什么特点?
3、目前网络信息资源的组织主要有哪些方法?
4、请简述网络信息检索的过程。具体的网络信息检索技术主要有哪些?
5、网络信息检索的工具有哪些?
6、搜索引擎主要有哪些类型?各类搜索引擎各有什么特点?
7、网络信息资源评价主要从哪几个方面进行考虑?
第一节 网络信息资源概述
本节内容
一、网络信息资源类型 二、网络信息资源的特点
一、网络信息资源的类型
★ 网络信息资源的分类有多种标准,根据不同的分类标准,可以将网络信息资源分为不同
的类型。
第一,网络信息资源从内容范围上可以分为五个大类:学术信息,教育信息,政府信息,文
化信息,有害和违法信息等。
第二,按信息源提供信息的加工深度分,可分为一次信息源、二次信息源、三次信息源等。
第三,依据信息源的信息内容则可将网络信息资源分为以下类型:一是联机数据库,即各类
数据库是联机存储电子信息源的主体。二是联机馆藏目录。三是电子图书。四是电子期刊。五是
电子报纸。六是软件与娱乐游戏类。七是教育培训类。八是动态性信息。
第四,如果认为网络中的信息存取方式所要达到的功能是在简单地模拟和再生人类信息传播
方式的话,那么参照非网络环境中信息存取方式的方法对网络信息资源进行归类,主要有六种网
络信息资源的类型。一是邮件型,以电子邮件和电子邮件群体服务(mailinglist)为代表的。二是电话
型,代表性的手段有会话(talk)和交互网中继对话(IRC Internet Relay Chat)。三是揭示板型,比较具
有代表性的是网络新闻和匿名FTP。四是广播型,可以在网络上向特定的多数的利用者即时提供
图像和声音的信息的传播方式。五是图书馆型。六是书目型,主要用于检索网络信息资源的各种
检索工具,如查人物机构团体的finger和Whois,查FTP文件的提供者的Archie和WAIS,以及
在WWW上的Yahoo,Infoseek等。 这样的分类方法尽管考虑到了网络信息资源的特点,但是比
较粗糙,有的地方也不尽合理。
第五,如果从科学的正式交流渠道与非正式交流渠道的思想出发,网络信息资源可以分为稳
定的信息资源和不稳定的信息资源两类。
稳定性的信息资源的特点是:一是从信息来源上讲,由一定的机构运营,相对来说,信息资
源的提供比较稳定;二是从信息内容来讲,经过一定的加工和处理,相对来说,信息的精度和准
确度是可以信赖的;三是从信息存取的方式来讲,有比较稳定的存取途
径和手续,可以重复进行操作。
二、网络信息资源的特点
第一、以网络为传播媒体。
第二,以多媒体为内容特征。
第三,以超文本形式组织信息。
第四,传播方式的多样性、交互性。
第五,变化更新快。
第二节 网络信息资源的组织
本节内容
一、网络信息资源组织的概念与组织的必要性 二、网络信息资源类型 三、网络
信息资源的特点
一、网络信息资源组织的概念与组织的必要性
★ 是指对网上的各种概念、数据(包括声音、图像、软件等)、事实、文献等,
网络信息资源的组织
通过分析、标引(分类的和语词的)、著录(信息特征的描述)、链接(把相关的信息加以联系)、排序、
存储等手段,形成一个有序的、便于用户理解和查询的信息系统的过程。
★
组织网络信息资源的必要性:
主要表现在以下三个方面:
一是在Intemet上存在着大量可获得的有价值、可利用的信息。
二是为了检索的便易,这些资源需要组织。人们希望能够方便快捷地检索到他们所需要的网
络信息资源,这时,组织这些资源就十分必要了。
三是为了方便人们对网络信息资源进行管理与控制。利用一定的数据格式将这些资源组织起
来不仅是获得它们的最有效的方式,也是管理与控制它们的有效方式。
从宏观角度来看,网络信息资源的组织通常是由Internet、局域网上的各种网站来实现的,而
网站信息资源的组织则是通过各个网页来完成的。和传统的印刷型文献相比,一个网站就相当于
一本书籍,而构成网站的各个网页则相当于构成书籍的各个页面。网页承载着具体的信息内容,
并通过相互之间的各种链接关系达到对网络信息资源的组织,因此,网页链接结构的组织就显得
相当重要。
二、网页的组织
★主要是指各网页间的链接形式,反映的是网页彼此间的关联状况,网站中各
网页的链接结构
网页的链接形式决定了用户在访问该网站时的浏览次序和效率。在实际的网页制作中,网页结构
的设计直接影响到网页的版面布局。
★网页的链接结构通常可以分为:(层级结构)和(平级结构)。
两种基本形式树状结构网状结构
●类似于目录结构,网页按内部逻辑分为不同层次,一个上级网页指向一个或多个
树状结构
下级网页,层层进入,层层退出。这种结构的优点是条理清晰,用户可以很容易地知道自己所处
的位置,但是这种层次分明的结构使得用户浏览时,必须按部就班、逐步进行,因而浏览效率较
低。
●是一种很少具有或者根本不具有总体结构的文档结构,网页之间也无所谓等级,
网状结构
只要有相互关系的任何两个网页都可以建立超链接。网状结构有利于用户对所需信息的快速定位,
从而提高浏览速度,但是由于这种结构的无序性,容易使用户迷路,而且随着网站信息量的增加,
会使得网站的维护工作日益困难。
★在实际的设计中,通常采用树状结构和网状结构混合使用的方式来组织网页之间的链接。
三、文件的组织
★则是网页在服务器上的存放状况;文件的目录结构影响的则是管理者对网
文件的目录结构
站的日常维护。文件目录结构合理与否,将直接影响到文件的增加、删除、修改、更新、上传等。
一是将文件分级存放,这样在寻找某一特定文件时可以减少搜
文件的组织通常有以下方法:
索时间;二是按文件所属的栏目进行存放,如可以将一级网页存放在一级子目录下,二级网页存
放在二级子目录下,依此类推。
网页的链接结构和目录结构不存在一一对应的关系,但如果按照链接结构所划分的栏目内容
设立相应的目录,存放相应的文件,将会给维护管理工作带来极大的便利。
★目前Internet上最为通用的组织方法有以下几种。
1.主题树方式
主题树方式(subject Tree)是一种可供检索和查询的等级式主题目录。以超文本链接的方式将不
同学科、专业、行业和区域的信息按照分类或主题目录的方式组织起来,也有人把它称为“基于目
录的搜索引擎”,如Yahoo!,Medweb等。
目前主题树系统与关键词检索系统相结合,是大型网络搜索引擎普遍采用的一种形式,以弥补各
自的不足。
2.文件组织方式
以文件方式组织网络信息资源简单方便,但随着网络信息资源利用的不断普及和信息量的不
断增多,以文件为单位共享和传输信息会使网络负载越来越大;而且当信息结构较为复杂时,文
件系统难以实现有效的控制和管理。因此,文件方式只能是组织网络信息资源的辅助形式。
3.数据库组织方式
就是将所有获得的信息资源按照固定的记录格式存储组织,用户通过关键词及其组配查询就
可以找到所需要的信息线索,再通过信息线索连接到相应的网络信息资源。
数据库技术是对大量的规范化数据进行管理的技术,它可以大大提高信息管理的效率。因为
数据库的最小存取单位是字段,所以可根据用户需求灵活地改变查询结果集的大小,从而大大降
低网络数据传输的负载。数据库方式是当前普遍使用的网络信息资源的组织方式之一。
4.网络信息指引库
所谓指引库是指所建立的数据库,从物理上讲并不存储各种实际的信息资源,它存放的是有
关主题的数据库或服务器的地址等信息,可指引用户到特定的地址获取所需的信息。
专业指引库类似于网上专业搜索引擎,它将因特网上与某主题相关的站点进行集中,按照方
便用户检索的原则,用用户熟悉的方法组织起来,向用户提供这些资源的分布情况,指导用户查
找。如图书馆的网页,它们以字母顺序、时间顺序、地理区域、主题或混合方式排列资源。。
5.超媒体组织方式
就是将超文本与多媒体技术结合起来。它将文字、表格、声音、图像、视频等多媒体信息以
超文本方式组织起来,使人们可以通过高度链接的网络结构在各种信息库中自由航行,找到所需
要的信息。超媒体的组织方式通过节点和链来实现其对信息的组织。
是某一信息的片段,它存储的是信息本身以及被链接对象的地址。
节点
用来连接节点,以描述信息之间的关系,链的一般结构可以分为三个部分:
链链源、链宿和
链的属性
。
(1)链源。一个链的起点称为链源。
(2)链宿。链宿是链的目的所在。
(3)链的属性。链的属性决定链的类型,这是链的主要特征。
★ ,这也是网络信息资
现代网络信息资源组织的方式最好是数据库方式和超媒体方式的结合
源组织的未来发展趋势。
第三节 网络信息资源的检索
本节内容
一、网络信息检索过程 二、网络信息检索工具 三、搜索引擎 四、网络信息检索技
术
网络信息资源是极其丰富的,网络信息源的浏览与检索必须遵循一定的方法,并借助一定的
搜索工具,如搜索目录、搜索引擎等。
一、网络信息检索的过程
★ 与传统的信息检索,如手工检索、联机检索等相比,网络信息检索有其自身的特点,主要
表现在:
第一,必须借助网络检索工具。
第二,基于超文本结构。
第三,检索方法的多样性。
第四,多媒体检索。
★ 网络信息检索的过程
第一,搜索引擎通过巡视软件自动搜集各种网络信息或者由人工搜集信息;然后由专门的
标引软件或专业人员对所搜集到的信息进行分类标引等处理,并把结果存入索引数据库。这是网
络信息检索的前提条件。
第二,搜索引擎通过WWW服务器软件为用户提供浏览器界面下的信息查询。用户根据需
要,按照搜索引擎的检索规则,构造合适的检索表达式,并把检索要求输入检索界面中的检索输
入框(通常是Form的形式)。检索界面为用户与搜索引擎的交互提供了条件。
第三,搜索引擎对用户的检索提问进行适当的处理,如发现语法错误就返回用户进行更改,
有的搜索引擎还能对检索提问进行智能化处理,如加入一些同义词等。然后搜索引擎将提问式与
索引数据库进行匹配,并进行必要的逻辑运算。
第四,搜索引擎将符合用户需要的信息以超文本链接的方式返回,并以Web页的形式显示
给用户。用户浏览该Web页,查找感兴趣的相关信息,然后通过搜索引擎提供的链接直接访问相
关信息。
二、网络信息检索工具
信息检索工具是影响信息检索效率的关键因素。网络检索工具大致可分为以下三大类型:
(一)字典型查询工具
字典型查询工具用于查询网上用户名、E—mail、URL、服务器地址等。这类工具有White Pages
Directory,Internet Yellow Pages,whois,DejaNews,FAQ Archive等。
(二)索引型查询工具
索引型查询工具为网上信息资源建立索引,这类工具有FTP资源的索引Archie,Gopher资源
的索引Verronica,Jughead,网上服务器的索引Wais等。
(三)交互式查询工具
交互式查询工具提供类似商用联机检索的网络信息查询服务。这类工具基本可分为Gopher和
WWW两类。 Gopher是一种嵌套菜单式查询工具, WWW是Internet上发展最快、信息最丰富
的一种检索服务程序。目前大多数WWW检索工具可检索FTP,Gopher等信息,大布成为Internet
标准检索工具的趋势。
。
★ WWW检索工具按其性质可分为两大类——搜索索引和搜索目录
,它利用一种被称为„„蜘蛛(Spider),,的软件工具在Web上搜索,
搜索索引又称为搜索引擎
采集必要的信息并将其编入自己的数据库中。用户检索时直接输入关键词,搜索引擎根据一定的
规则将检索式与其数据库中的文献进行匹配,从而生成结果清单。
又称主题指南或主题目录。它将各站点按主题内容组织成等级结构。检索者依照这
搜索目录
个目录逐层深入,直到找到所需文献。
目前许多网站上流行的检索工具都不是单纯的搜索引擎或搜索目录,而是这两者的结合,如
Infoseek,Lycos等。它们不仅可以按关键词查询,还可以按目录查询。因此搜索引擎的含义也变
得更加宽泛,很多情况下,搜索索引和搜索目录统称为搜索引擎。
另外还有一种被称为元搜索引擎(meta search engine)的检索工具。它可以同时检索多个搜索引擎的
数据库,并将结果列在一份清单上。
三、搜索引擎
搜索引擎(Search Engine)是最重要的网络信息检索工具之一,使用它可以快速地从铺天盖地的
网络信息中检索到自己所需要的信息。
目前Internet上的搜索引擎很多。按不同的分类标准,可以将它们分为不同的类型。如果按搜
索引擎的内容分,可以分为综合类搜索引擎和专业类搜索引擎。如果按其信息的组织方式分,则
可以分为目录式搜索引擎、索引式搜索引擎和元搜索引擎。
(一)按内容划分
1.综合类搜索引擎
目前Internet上使用的搜索引擎大多数是综合类搜索引擎。这类搜索引擎涉及的内容极其广泛,
涵盖了各学科各专业的各种各样的信息,因此这类搜索引擎的规模通常比较大,适合于各个主题
的信息查询,能满足各类用户的检索要求,尤其是对于查询跨学科主题有较好的查全率。但是,
在检索某一特定领域、特定专业的信息时,效率比较低,查准率不太理想。如著名的Yahoo。Excite,
Google,InfoSeek以及国内的Sohu、百度、天网、新浪等都是综合类搜索引擎。
2.专业类搜索引擎
专业类搜索引擎只涉及本领域、本学科专业的信息,因此规模通常比较小。由于这类搜索引
擎通常由专业人员编制而成,而且某一学科专业的信息相对集中,因此它具有“小而精”的特点。在
查询特定领域的信息时,使用专业类搜索引擎不但可以提高检索速度,还可以提高专指度,加大
检索的深度和力度,最终提高查全率和查准率。
(二)按信息的组织方式分
1.目录式搜索引擎
目录式搜索引擎主要通过人工发现信息,并依靠标引人员的知识进行甄别和分类,由专业人
员手工建立关键字索引,建立目录分类体系。用户在利用目录式搜索引擎时,可进行浏览查询,
从最高层目录开始,逐层深入,直到找到所需的信息为止;也可以进行关键词检索。由于这类搜
索引擎主要依靠人工编制,所以通常数据库的规模比较小。也正因为人工编制,这类搜索引擎的
质量通常比较高,检索效率较好。如果用户不能详细确定查询的关键词或者用户只想全面了解某
一方面的信息,使用目录式搜索引擎的效果比较理想。目录式搜索引擎最著名的代表是Yahoo!,
www.yahoo,com。
2.索引式搜索引擎
索引式搜索引擎主要依靠一种被称为“蜘蛛”、“机器人”等的计算机程序有规律地遍历整个网络
空间,根据网络协议和程序自身的有关约定,记录网上的信息,并对其进行加工、整理,将信息
加入到索引数据库。根据一定的规则,及时地对数据库进行补充与修改。用户在使用索引式搜索
引擎时,只需输入检索主题的关键词,该搜索引擎就自动将用户输入的关键词与索引数据库进行
匹配,然后将符合用户需要的信息以用户希望的方式显示出来。这类搜索引擎主要依靠计算机程
序,所以在信息的采集上比较及时,采集信息的范围也比较广泛,但是由于其中的人工干预很少,
所以信息的质量不如目录式搜索引擎。索引式搜索引擎一般由四个部分组成:信息搜集模块(也称
蜘蛛程序Spider),蠕虫、爬虫或巡视软件、索引模块,查询模块和用户界面模块。著名的索引式
搜索引擎如:
AltaVista:
Excite:http://
HotBot:http://
InfoSeek:http://
网络指南针:http://:8010
台湾番薯藤:http://
Google:http://
百度:等。
目录式搜索引擎和索引式搜索引擎之间的界限越来越模糊,大多数的网络检索工具同时提供
两种方式的检索,从而使目录式搜索引擎的组织、引导功能与索引式搜索引擎的检索功能很好地
结合起来,如著名的目录式搜索引擎Yahoo!曾经与索引式搜索引擎Excite挂接,Excite,Lycos,
WebCrawler等索引式搜索引擎也分别增设了各种形式的分类目录。这种担负了网络资源主题指南
和索引双重责任的混合型搜索引擎代表了搜索引擎的发展
趋势。
3.元搜索引擎
元搜索引擎又称集合式搜索引擎,它将多个搜索引擎集成在一起,并提供一个统一的检索界
面。这样省去了用户记忆多个搜索引擎的不便,使用户的检索要求能同时通过多个搜索引擎来实
现,从而获得全面的检索效果。元搜索引擎又可分为并行式元搜索引擎和串行式元搜索引擎。
四、网络信息检索技术
网络检索必须借助于搜索引擎等工具,这是网络检索的前提。要想达到良好的网络检索效果,
还必须掌握一定的检索技术。
(一)网络信息资源的检索步骤
网络信息检索的一般步骤有七个主要过程。
在开始一个检索之前,应该首先仔细分析检索需求,明确所要检索的
第一,明确检索需求。
是什么样的信息,这是一个成功的信息检索的前提。
。网络信息纷繁复杂,因此,要想检索出相关信息。就必须对网络信息
第二,确定检索范围
资源进行选择。合适的检索范围在很大程度上影响着检索的结果。检索范围过于宽泛或过于狭窄,
对检索效果都会产生影响。
。根据检索系统所允许的规则,将检索需求转化成具体的检索词。
第三,确定有效的检索词
句子、段落通常而言是不能直接作为检索词的,必须将它们转化成检索系统可以接受、认可的检
索词。检索词的正确与否,决定了检索系统是否能够返回有效的检索结果。
检索表达式是用户检索需求的计算机可识别形式,它由检索
第四,构造合适的检索表达式。
词和操作符根据一定的语法规则组合而成;检索词应该是可以用于检索的正式词;操作符包括逻
辑操作符、位置操作符、截词操作符、字段操作符等。检索表达式的构造是否能充分反映用户需
求决定了检索结果的质量。
通常都不是用户的手工检索,所以,选择合适的检索工具对网
第五,由于网络检索过程中,
络检索来说就成为了极其重要的一环。选择检索工具主要从检索工具的收录范围、索引方式、更
新程度、查全率、查准率等方面进行衡量。
。这一步通常不用用户亲自执行,用户只需按“检索”或“开始”等按钮即可,
第六,正式检索
计算机检索系统会根据用户提供的检索表达式自动搜索数据库,并把匹配结果显示给用户。
。对检索所得的结果进行评价,看是否能够满足自己的检索要求,如果
第七,评价检索结果
已满足检索要求,则利用该检索结果,不再对其他检索过程进行任何处理;否则,再回到以上各
个步骤,重新分析检索需求,确定检索范围重新选择检索工具,必要时修改检索词以及检索表达
式,重新进行检索。
(二)具体的网络信息检索技术
常见的网络信息检索技术主要有以下几种。
1.布尔逻辑检索
2.位置检索
3.截词检索
4.字段检索
针对网络信息内容的评价,主要可以从以下几个方面考虑。
一、准 确 性
对于网络信息内容的准确性,我们主要可以通过以下途径进行检查。
(一)是否有编辑审查
(二)多个信息源的比较
另外,个人经验也是评价网络信息准确性的重要因素。经常浏览使用网络信息的人,对一些
网络信息资源会形成自己的经验评价,尤其是对常用的网络信息资源会有比较清晰的认识,从而
对其信息内容大致上有比较清楚的评价。
当你确定信息内容是准确的之后,第二步要做的可能就是验证其是否具有权威性。权威性较
高的信息通常会有更好的说服力。
二、权 威 性
确定信息的权威性,首先要明确信息的来源。信息来源很大程度上决定了信息的准确性和可
靠性。有些网络媒体具有较高的可信度和权威性。
权威性通常可以分成个人的(individual)以及团体的(collective)两类
三、时 效 性
时效性也是评价信息的一个重要因素。
★ 对于网络信息内容的评价,除了以上三个基本的指标外,我们还可以根据信息提供的预期对
象进行判断。
★ 另外。还可以从信息内容是否独特、是否符合自己需要这方面对网络信息内容进行评价。
对于具体的用户来说,适用性可以说是评价网络信息内容的最重要的因素。人们总是出于某
种目的浏览或者使用网络信息,如果某信息根本不是用户所需要的,那么,该信息即使具有绝对
的准确性、权威性、时效性,对该用户来说也是枉然。网络信息资源无穷无尽,如何找到自己所
需要的信息对用户来说是十分重要的事情。
第六章 网络信息资源管理
章节小结
●1、首先讲解了网络信息资源的类型,特点;
●2、 在介绍网络信息资源类型和特点的基础上,从多个层次对网络信息资源的组织进行了探
讨,讨论了网页的组织,文件的组织;
●3、着重对网络信息资源的检索进行了详细论述,介绍了网络信息检索的过程、网络信息检索
的工具,并对搜索引擎这一众所周知●的最常用网络检索工具进行了多角度探讨。
●4、从检索技术的角度,对网络检索技术做了较大篇幅的讨论,并结合常用的搜索引擎进行了
案例分析。
●5、如何对网络信息资源的评价进行了研究。
本章练习题
一、填空题 二、判断题 三、问答题 <
参考答案>
一、填空题
1、网络信息资源从内容范围上可以分为五个大类,分别是学术信息、( )、( )、( )、有
害和违法信息等。
2、网页的链接结构通常可以分为两种基本形式,树状结构和( )结构。
3、链用来连接节点,描述信息之间的联系,是超媒体灵魂,链的一般结构可以分为三个部分:( )、
链宿、( )。
4、网络信息检索工具大致可以分为三类:一为( )查询工具,二为( )查询工具,三为( )
查询工具。
5、按搜索引擎对信息的组织方式分类,按搜索引擎可分为( )搜索引擎、( )搜索引擎、元搜
索引擎。
6、针对网络信息内容的评价,主要可从( )、( )和时效性等三个方面去考虑。
二、判断题
1、按搜索引擎的内容来分类,可分为综合类搜索引擎和专业类搜索引擎。( )
三、问答题
1、简述网络信息资源的特点。
2、简述网络信息资源组织的必要性。
3、简述网络信息检索的特点。
4、简述网络信息资源检索的基本步骤。
<参考答案>
第六章 网络信息资源管理
参考答案
一、填空题
1、教育信息、政府信息、文化信息
2、网状
3、链源、链的属性
4、字典型、索引型、交互式
5、目录、索引
6、准确性、权威性
二、判断题
1、T
三、问答题
1、答:网络信息资源的特点:
(1) 以网络为传播媒体;
(2) 以多媒体为内容特征;
(3) 以超文本形式组织信息;
(4) 传播方式的多样性、交互性;
(5) 变化更新快。
2、答:网络信息资源组织的必要性主要表现在以下三个方面:
(1) 在Internet上存在着大量可获得的有价值、可利用的信息;
(2) 为了检索的便易,这些资源需要组织;
(3) 为发方便人们对网络信息资源进行管理与控制。
3、答:网络信息检索的特点主要表现在:
(1) 必须借助网络检索工具;
(2) 基于超文本结构;
(3) 检索方法的多样性;
(4) 多媒体检索;
4、答:网络信息检索的一般步骤有七个主要过程:
(1) 明确检索需求;
(2) 确定检索范围;
(3) 确定有效的检索词;
(4) 构造合适的检索表达式;
(5) 由于网络检索过程中,通常都不是用户的手工检索,所以,选择合适的检索工具对网络检索来说就
成为了极其重要的一环。
(6) 正式检索;
(7) 评价检索结果。
发布评论