2024年3月23日发(作者:)
CiteSeer使用指南
CiteSeer(/)是NEC研究院在自动引文索引(Autonomous
Citation Indexing,ACI)机制基础上建设的一个学术论文数字图书馆,提供一种通过引
文链接检索文献的方式,目标是从多个方面促进学术文献的传播与反馈。CiteSeer主要用
于检索Postscript和PDF文件格式的学术论文。目前在其数据库中可检索到超过500,000
篇论文,涉及的主题包括:互联网分析与检索、数字图书馆与引文索引、机器学习、神经
网络、语音识别、人脸识别、元搜索引擎、音频/音乐等。CiteSeer在网上提供完全免费的
服务(包括下载PS或PDF格式的全文),系统已实现全天24小时实时更新。
CiteSeer支持布尔检索,如检索式“mcilraith and ebxml”返回结果为“作者mcilraith
发表的关键词包括ebxml”的文献。系统的最大特点是支持查看某一具体文献的“引用”与
“被引”情况,可以列出该文献的主要参考文献,包括每条参考文献的被引频次、参考文
献在来源文献中的上下文及参考文献的全文;同时还可以获得该文献被其它后继文献引用
的信息,包括的内容同上;查看某一文献的相关文献,应用特殊算法计算文献相关度;图
表显示某一主题文献(或某一作者、机构所发表文献)的时间分布,可依此推测学科热点
和发展趋势,避免重复劳动。
现以一个具体的检索过程为例,介绍CiteSeer的使用方法。
(1)进入CiteSeer的主界面,输入检索词“ebxml”,点击“Search Documents”开
始查询(也可以点击“Search Citations”查询引文信息,两种查询都使用全文检索技术)。
(2)检索返回
165篇命中文献,默认的检索结果排序方式为命中文献的被引频次。点
击排在返回结果第一位的论文“RQL: A Declarative Query Language for RDF -
Karvounarakis, Alexaki.. (2002) (38 citations)” 的链接(被引38次),进入下
一检索页面(见下图)。
(3)在图的右上角可以浏览并下载该论文的多种格式的全文。在abstract上面的
“Context”或下面的“Cited by:More”,是论文的被引情况。点击“Context”或“Cited
by: More”,通过这些引文链接可以了解有哪些后继文献引用了该论文。在“Context of
citations to this paper”下面,可以直接看到引文的背景联系。所有引文都可以进一步
查看其引用与被引情况,绝大部分可得到全文;“Active bibliography”列出了按照相关
系数排序的该论文的相关文献。
(4)图的页面下方“Citations (may not include all citations)”列出了该论文
主要的参考文献,每条参考文献前方的数字代表该参考文献的被引次数。绝大部分可得到
全文。参考文献下方的图表直观地显示该篇学术论文参考文献的时间分布,但是只有当著
录的参考文献中给出论文发表年时,才会在图表中显示出来。
(5) 点击主页的“Citations”进入“Search Citations”,以步骤二中提到的论文
“RQL: A Declarative Query Language for RDF - Karvounarakis, Alexaki.. (2002)
(38 citations)”的作者Gregory Karvounarakis为检索词进行引文检索,会得到所有与
检索词匹配的引文信息。点击每条引文左侧的“Context”会得到进一步的引文背景与全文
信息。
几点注意:
1、CiteSeer在进行引文统计时,通常单独考虑作者自引的情况。
2、当两个或多个相连的词作为检索词输入时,如果没有“and”、“or”等布尔算符出
现,系统将其近似当成一个词处理,即检索词出现的顺序必须严格匹配。如检索词为“speech
recognition”,则“……Music vs Speech [4]Isolated sounds [5, 6] and Instruments
[7]been evaluated by training statistical pattern recognition classi……”为非
命中文献。
3、若以作者为检索词,尽量只使用作者的last name。或列出在引文中所有可能出现
的该作者的著录形式,中间用“or”连接。如 m jordan or michael jordan or m i jordan
or michael i Jordan等。
发布评论