2024年6月12日发(作者:)
1.检索工具的分类
(1)按照信息搜集方法分类
按照信息搜集方法的不同,搜索引擎系统可以分为三大类:
1)目录式搜索引擎(Directory Search Engine)
以人工方式或半自动方式搜集信息,由编辑员查看信息之后,人工形成信息摘要,并
将信息置于事先确定的分类框架中。信息大多面向网站,提供目录浏览服务和直接检索服
务。该类搜索引擎因为加入了人的智能,所以信息准确、导航质量高,缺点是需要人工介
入(维护工作量大)、信息量少、信息更新不及时。这类搜索引擎的代表是:Yahoo!、
LookSmart、Ask Jeeves、Snap、Open Directory.
2)机器人搜索引擎(Crawler-Based Search Engine)
由一个称为蜘蛛(Spider)的机器人程序以某种策略自动地在Internet中搜集和发现
信息,由索引器为搜集到的信息建立索引,由检索器根据用户的查询输入检索索引库,并
将查询结果返回给用户。服务方式是面向网页的全文检索服务。该类搜索引擎的优点是信
息量大、更新及时、毋需人工干预,缺点是返回信息过多,有很多无关信息,用户必须从
结果中筛选。这类搜索引擎的代表是:AltaVista、Northern Light、Excite、Infoseek、
Inktomi、FAST、Lycos、Google.
3)元搜索引擎(Meta Search Engine)
这类搜索引擎没有自己的数据,而是将用户的查询请求同时向多个搜索引擎递交,将
返回的结果进行重复排除、重新排序等处理后,作为自己的结果返回给用户。服务方式为
面向网页的全文检索。这类搜索引擎的优点是返回结果的信息量大,缺点是不能够充分使
用元搜索引擎的功能,用户需要做更多的筛选。这类搜索引擎的代表是WebCrawler、
InfoMarket.
目前,商业的搜索引擎站点正在结合各种搜索引擎的优点,在类型上有逐渐融合的趋
势。例如,Yahoo!在保持人工分类的同时,使用Inktomi的机器人搜索引擎,用户查询
时,如果选?quot;网站搜索"便搜索人工分类库,选择"网页搜索"便搜索机器人搜索引擎
的索引库。一些传统的机器人搜索引擎也增加了人工分类的内容,以提供高精度的导航信
息。另外搜索引擎站点有"门户化"的倾向,在提供搜索服务的同时,提供多样的网络服务,
如新闻、股票、天气预报、虚拟社区、游戏、电子商务等等,成为名副其实的"网络门户".
(2)按照检索软件分类
按照服务提供方式的不同,检索软件也可以分为三大类:全文数据库检索软件、非全
文数据库检索软件、主题指南类检索软件。
全文数据库检索软件正常运作的前提是网站拥有大量的信息,因此必须依靠强大的数
据库作为后盾。它能够提供完整的文献和信息检索,查全率很高。但由于信息量非常大,
检索起来比较困难,对检索技术的要求很高。
非全文数据库检索软件具有速度快、使用简便、索引量大的特点,但仅提供部分全文
检索,有时需要二次检索,感到不太方便。
主题指南类检索软件是目前网络检索中最常用的检索软件。这种软件查准率高、速度
快、使用方便。现大部分网站都具备主题指南类检索功能。
(3)按照检索语言分类
目前,因特网几乎使用了世界所有语言。每一种语言都形成了自己独特的检索体系。
比较常用的语言有英文、法文、德文、日文、俄文、中文等。
2.全文数据库的检索软件
(1)Alta Vista 检索引擎
Alta Vista检索引擎为数字设备公司(DEC)开发,号称是目前最大的Web索引数据
库,Alta Vista检索引擎提供两种检索方法:简单检索和高级检索。高级检索包括了简单
检索的所有特性,还允许使用布尔运算符和接近操作符、括号等,查找的结果按关键词排
序。Alta Vista总能返回有用的信息,但由于没有对内容进行选择,它的"信噪比"也是最大
的。
使用Alta Vista检索引擎时应注意:
要进行有效的检索,最好尽可能多而精确地输入描述所感兴趣的主题的词或词组。提
供的词组越精确,检索结果就越好。
如果你输入的词包含大写字母,则检索对大小写就比较敏感。如输入Telephone则只
检索含有这个词的内容,而输入telephone 则不论大小写都检索。如果要把一些词作为词
组或一个整体来查询时,最好把它们加上双引号。如果要求特定单词包含在索引的文档中,
可以在它前面加一个" "号,如: Telephone,并且在" "号和单词之间不能有空格。相应
的,如果要排除含有特定单词的文档,可以在它前面加一个"-"号,如-cool.
进行简单查找的时候,可以在单词的末尾加一个通配符来代替任意的字母组合(最多
可代替5个小写的字母)。Alta Vista的通配符是"*"号,星号不能用在单词的开始或中间。
Alta Vista高级检索包含了简单检索的所有特性,还可以有布尔和接近操作符、括起
来的逻辑组合等。Alta Vista支持的布尔和接近检索二元操作符有AND(&)、 OR(|)、
NEAR(~)和一元操作符NOT(!)。AND连接的若干词在文件中要同时出现;OR 确保
检索式中至少有一个词出现在文件中;NOT 将某一个词从检索中排除出去。它们的优先级
是递减的,另外要注意,如果把检索的表达式写成sports NOT swimming,则语法上是
不合逻辑的,正确的写法应该是sports AND NOT swimming. NEAR 确保查询的两个词
在10个字节内出现,它的优先级是最低的。如果将上述符号用在检索表达式中,最好给
检索表达式加上引号以减少检索表达式的混乱。
Alta Vista的优点是:在所有的检索软件中,它的功能最全面,查全率和查准率最高,
全文标引系统质量可靠;在检索语句上与传统的联机检索语言类似,更容易掌握;系统反
应速度快;网页链接可靠。缺点是文件相关性评估的质量一般。
(2)Excite检索引擎
Excite检索引擎是Architext软件公司的产品,该数据库界面友好,用户可以利用关
键词、词组和自然语言检索,自然语言检索越详细越好。
Excite检索引擎有基本检索和高级检索两种检索方式。其中,Excite中要求的单词和
排除的单词的使用方法同Alta Vista一样,使用" "号和"-"号。Excite支持二元操作符
AND、OR、AND NOT 和一元操作符 NOT.它也支持用括号来构成逻辑组。缺省的关键
词使用的是隐式的OR ,即它检索含有指定的任意的单词。
Excite的优点是采用了概念检索的技术。概念检索是指在检索文件的过程中,不仅能
够检索到含有用户提出的关键词的文件,还能检索到与用户的检索主题密切相关、但并没
有包括这些主题词的文件。在所有的检索软件中,它的更新速度最快,且其数据库的规模
也最大。另外,它在提供相关信息方面表现颇佳。Excite的缺点是它的相关性排序质量一
般,检索结果也显得不尽人意。
随着世界华人对因特网商业价值的认同,越来越多的华人开始利用因特网传递商业信
息,中文网站内容也不断丰富。面对巨大的市场利益的诱惑,出现了越来越多的中文检索
工具,一些原来的英文搜索网站也纷纷推出自己的中文网站。
(3)非全文数据库的检索软件
Lycos 是最早出现的检索引擎之一,它是以巡视软件为主的非全文数据库检索工具,
由美国卡内基梅隆大学的机器翻译中心开发研制。它利用巡视软件自动搜集网页,对其进
行分类,并建立数据库,提供关键词和主题查询(主题查询叫做目录服务)的检索服务。
用Lycos查询带符号或数字的词时,最好使用说明性的语言,如用"programming
languages C ",而不要用"C ";用"convenience stores 7~11",而不要用"7~11".Lycos
用" "表示所选择的是与某一主题高度相关的文件,如用"telecommunication TV"选择远
程通信中与电视密切相关的文件;排除不必要的文件用"-",如用
"telecommunication-radio"选择远程通信不包括无线电。Lycos用". "表示准确匹配该词;
用"$"表示自动截词符号,查询以该词为词根的所有文件。
Lycos的优点在于它的速度快、使用简便、索引量大,它的弱点则是它不支持布尔检
索和其他如Alta Vista或Excite能提供的一些高级检索。
转自:电子商务师考试网
主要特点
网上市场调查的实施可以充分利用Internet作为信息沟通渠道的开放性、自由性、平
等性、广泛性和直接性的特性,使得网上市场调查具有传统的一些市场调查手段和方法所
不具备的一些独特的特点和优势。
(1)及时性和共享性
网上调查是开放的,任何网民都可以进行投票和查看结果,而且在投票信息经过统计
分析软件初步自动处理后,可以马上查看到阶段性的调查结果。
(2)便捷性和低费用
实施网上调查节省了传统调查中耗费的大量人力和物力。
(3)交互性和充分性
网络的最大好处是交互性,因此在网上调查时,被调查对象可以及时就问卷相关问题
提出自己更多看法和建议,可减少因问卷设计不合理导致调查结论偏差。
(4)可靠性和客观性
实施网上调查,被调查者是在完全自愿的原则下参与调查,调查的针对性更强,因此
问卷填写信息可靠、调查结论客观。
(5)无时空、地域限制
网上市场调查是24 小时全天候的调查,这就与受区域制约和时间制约的传统调研方
式有很大不同。
(6)可检验性和可控制性
利用Internet进行网上调查收集信息,可以有效地对采集信息的质量实施系统的检验
和控制。
调查步骤
网上直接调查是企业主动利用Internet获取信息的重要手段。与传统调查类似,网上
直接调查必须遵循一定的步骤进行。
确定网上直接调查目标
Internet作为企业与顾客有效的沟通渠道,企业可以充分利用该渠道直接与顾客进行
沟通,了解企业的产品和服务是否满足顾客的需求,同时了解顾客对企业潜在的期望和改
进的建议。在确定网上直接调查目标时,需要考虑的是被调查对象是否上网,网民中是否
存在着被调查群体,规模有多大。只有网民中的有效调查对象足够多时,网上调查才可能
得出有效结论。
确定调查方法和设计问卷
网上直接调查方法主要是问卷调查法,因此设计网上调查问卷是网上直接调查的关键。
由于因特网交互机制的特点,网上调查可以采用调查问卷分层设计。这种方式适合过滤性
的调查活动,因为有些特定问题只限于一部分调查者,所以可以借助层次的过滤寻找适合
的回答者。
选择调查方式
网上直接调查时采取较多的方法是被动调查方法,将调查问卷放到网站等待被调查对
象自行访问和接受调查。因此,吸引访问者参与调查是关键,为提高受众参与的积极性可
提供免费礼品、调查报告等。另外,必须向被调查者承诺并且做到有关个人隐私的任何信
息不会被泄露和传播。
分析调查结果
这一步骤是市场调查能否发挥作用的关键,可以说与传统调查的结果分析类似,也要
尽量排除不合格的问卷,这就需要对大量回收的问卷进行综合分析和论证。
撰写调查报告
撰写调查报告是网上调查的最后一步,也是调查成果的体现。撰写调查报告主要是在
分析调查结果基础上对调查的数据和结论进行系统的说明,并对有关结论进行探讨性的说
明。


发布评论