当前位置:

2018年出版资格考试《初级理论与实务》第一章第三节

发表时间:2017/11/30 14:55:06 来源:互联网 点击关注微信:关注中大网校微信
关注公众号

第三节计算机信息检索

随着计算机技术的出现与发展,传统的靠“手翻、眼看、大脑判断”的检索方式已难以全面适应信息量增长的需要,计算机信息检索应运而生并普及开来。

一、计算机信息检索的特点、类型与方法

计算机信息检索已成为检索文献信息的重要手段,与传统的手工检索相比,它表现出明显不同的特点。

(一)计算机信息检索的概念与特点

计算机信息检索是指用计算机或其他终端,使用特定的检索指令、检索词和检索策略,从计算机检索系统的数据库中检索所需要的信息资料的过程。这些信息资料可在计算机上阅读,也可下载、存储到各种存储设备中,或打印在纸上,有的还可以通过电子邮件发送。

计算机检索不仅能够跨越时空,在短时问内查阅大型数据库,快速地对以前的文献资料进行检索,而且大多数联机或网络检索系统数据库中的数据更新速度非常快,用户通过计算机信息检索可以随时得到更新的信息。计算机检索已成为检索文献信息的重要手段。因此,与手工检索一样,计算机信息检索应成为出版专业技术人员的一项基本功。这一能力的训练和培

养对出版专业技术人员适应信息社会的发展极其重要。一个善于从电子信息系统中获取信息的专业技术人员,必定拥有更多的成功机会。

(二)计算机信息检索的类型

根据产生时间先后及检索设备特征、检索方法的不同,计算机信息检索一般分为联机检索、光盘检索和网络信息检索。

使用联机检索系统可利用国内外大量规范化的专业数据库进行科技信息、经济信息及商业信息的检索,迅速地检索到相关的信息。联机检索分辨率高,有较高的查全率和查准率,但联机检索需要专门设备,费用较高,需要较熟练地掌握检索技术。联机检索面向检索专家或中介机构,需要专业的检索人员,在出版单位的日常工作中使用很少。光盘检索具有信息更新不及时等缺点,而且随着计算机信息网络的发展,Dialog等著名的国际联机检索系统和《中国学术期刊》等原先的光盘版数据库,也纷纷推出了基于网络的信息检索系统。因此,本章

主要介绍网络信息检索。

(三)计算机信息检索的基本方法

计算机信息检索主要有如下几种方法。

1.布尔逻辑检索

布尔逻辑检索是一种比较成熟、较为流行的检索技术,现代的信息检索多采用这种技术。

布尔逻辑检索的基础是逻辑运算,逻辑运算中最常用的是布尔逻辑运算符(BooleanLogicOperator),主要的运算符有以下几种。

(1)逻辑“与”

逻辑“与”用and(或*)表示。检索词A、B若用逻辑“与”相连,即AandB(或A*B),则表示同时含有这两个检索词的文献才能被命中。例如,要检索“儿童教育”的文献,检索逻辑可表示为:儿童and教育。

(2)逻辑“或”

逻辑“或”用or(或+)表示。检索词A、B若用逻辑“或”相连,即AorB(或A+B),则表示只要含有其中一个检索词或同时含有这两个检索词的文献都可以被命中。例如,要检索“数字出版”和“电子出版”方面的文献,检索逻辑可表示为:数字出版0r电子出版。

(3)逻辑“非”

逻辑“非”用not(或andnot,或butnot,或)表示。检索词A、B若用逻辑“非”相连,即AnotB(或A—B),则表示被检索文献在含有检索词A而不含有检索词B时能被命中。例如,要检索有关“能源”方面的英文文献,但涉及“核能”方面的文章不要,逻辑表达式可表示为:enengynotnuclear(或energy-nuclear)。

not可以缩小检索范围,但须谨慎从事,只有当确信要从检索结果中排除一个术语或短语时才用。

布尔逻辑运算的次序为:逻辑“非”一逻辑“与”逻辑“或”,若有括号,则括号优先,这同算术中的四则运算相似。

2.短语检索

短语用双引号(“”)括起表示,可检索出与引号内形式完全相同的短语。例如,要检索期刊《出版发行研究》,输入置于引号内的“出版发行研究”,就只会检索到这六个字紧挨在一起的记录;如果不加双引号,有的搜索引擎会把出版、发行、研究这三个词作布尔逻辑“与”的运算,它们之间可能相隔很远,顺序也可能改变。

3.截词检索

截词检索是在检索标志中保留相同的部分,用相应的截词符代替可变化部分。检索中,计算机会将所有含有相同部分标志的记录全部检索出来。截词检索主要用于英文检索。对于词干相同而词尾不同的词(如publish,publisher,publishers,publishing)和一些不同拼法的词(如defence,defense),如果检索时将这类词全部输进去,会增加检索时间和费用,采用截词法可解决这一问题。

截词符多用“?”或“*”表示,如:输入publish*,会检索出publish,publisher,publishers和publishing等所有以Dublish这七个字母开头的单词,不管它后面还有多少个字母。

二、光盘版工具书的使用

光盘版工具书可分为单独发行的光盘和随书光盘。与印刷型工具书相比,光盘版工具书具有体积小且收藏和利用方便,检索途径多且检索方便等优点。

光盘版电子工具书只需购置磁盘阵列等硬件设备及磁盘发布系统等软件,就能将光盘版电子工具书链接在本单位局域网内,供本单位的人员利用。对光盘版工具书的检索,上述的计算机信息检索方式一般都可以使用。

三、互联网信息检索的工具——搜索引擎

互联网上的信息资源十分丰富,其数据库内容几乎涉及所有领域,已成为人类的资源宝库。搜索引擎是最流行的网络信息检索工具。

搜索引擎是一种应用的软件系统,它以一定的策略搜集和发现信息,在对信息进行处理和组织后,为用户提供信息查询服务。从使用者的角度看,这种软件系统提供一个网页界面,让它通过浏览器提交一个词语或者短语,然后很快返回一个可能和用户输人内容相关的信息列表。这个列表中的每一条目代表一篇网页,每一个网页包含的元素有:标题、网址、关键词

和摘要。有的搜索引擎提供的信息更为丰富,如时间、文件类型、文件大小和网页快照等。

搜索引擎多种多样,按照不同的标准可以划分出不同的类别。一般根据搜索引擎采集与加工信息的机制,将其分为目录式搜索引擎和关键词搜索引擎两大类。目录式搜索引擎是将互联网上的资源进行分类,提供用户浏览数据的方式,雅虎等属于这种类型。关键词搜索引擎是用户将特定的数据输人后,在数据库中寻找符合需要的相关信息,谷歌、百度等属于这种类

型。许多搜索引擎同时提供以上两种检索功能。

搜索引擎发展迅速,数量众多,重要的中英文综合性搜索引擎有百度、谷歌、必应、中国雅虎、搜狗、搜搜、Google、Yahoo!、Bing、Ask、A1lthe-,web、Altavista、Gigablast、Lycos等。

以下介绍几个使用频率较高的搜索引擎。

(一)百度

百度是目前全球最大的中文搜索引擎和重要的中文信息检索与传递技术供应商,现为我国网民最常用的搜索引擎。其产品与服务项目有:网页搜索、新闻搜索、百度贴吧、百度地图、桌面搜索、百度知道、MP3搜索、图片搜索、百度国学、硬盘搜索、百度百科、百度空间和词典等。

百度支持布尔逻辑检索、字段限制检索、短语检索、在检索结果中精练检索、相关搜索、拼音提示和繁简中文查询等。还提供丰富的专项搜索,包括图书搜索、百度国学、专利搜索和法律搜索等学术资源搜索,专门针对特定对象开发的少儿搜索和老年搜索,以及MP3搜索、视频搜索和图片搜索等多类型资源搜索。

检索结果依据相关度进行排序。通过超链接分析技术、词频统计和竞价排名相结合的方式对网页进行相关度评价。每一条检索结果显示网页标题、摘要、网址和百度快照等。摘要中显示检索词出现的上下文,并以红色字体着重显示检索词。显示“百度快照”和相关搜索的关键词检索提示。

百度国学通过互联网免费提供中国古代文化典籍在线搜索及阅读服务,收录上起先秦、下至清末两千多年的以汉字记载的历代典籍,内容涉及经、史、子、集各部。百度国学提供目录浏览和关键词检索,支持通过“全文”“书名”或“作者”进行关键词检索。在目录浏览页面,用户可通过字母顺序和“经、史、子、集”分类系统等浏览百度国学的资源,并查看书目搜索和人名搜索的最新排行。检索结果按相关度排序。每条结果显示标题、摘要和网址。点击标题可进入全文阅读界面。该页面显示书名、篇章名、作者,并可查看书籍的详细介绍和作者的其他作品。

百度百科是百度公司推出的一部内容开放、自由的网络百科全书,其测试版于2006年4月20日上线,正式版在2008年4月21日发布。百度百科旨在创造一个涵盖各领域知识的中文信息收集平台,强调用户的参与和奉献精神,充分调动互联网用户的力量,汇聚上亿用户的头脑智慧,积极进行交流和分享。

(二)谷歌

谷歌(Google)为全球使用最广泛的搜索引擎。其产品与服务有:网页搜索、博客搜索、图片搜索、学术搜索、新闻搜索、谷歌地图、音乐搜索、生活信息搜索、网页翻译、桌面搜索和邮箱,并提供输入法、浏览器、照片管理软件和工具条等工具。

谷歌支持布尔逻辑检索、字段限制检索、短语检索、文件类型限定检索、容错检索、拼音自动转换、模糊拼音搜索和简繁中文转换功能等。

谷歌的检索结果按相关性排序,相关性的评判以网页评级为基础,在全面考察检索词的频率、位置和网页内容(以及该网页所链接的内容)的基础上,评定该网页与用户需求的匹配程度,并确定排序优先级,将其独创的网页评级系统作为网络搜索的基础。

谷歌的每条检索结果显示标题、摘要、网址和网页大小,有的还提供“网页快照”、“相关阿页”、“标记该网页”及网页翻译等链接。提示可能存在安全风险(如可能含有恶意软件)的网站。同时,系统自动对关键词的相关词进行分析并给出相关链接,便于用户查看相关词语的搜索结果。

谷歌学术搜索为全球用户提供丰富的学术资源搜索服务,囊括来自学术出版机构、专业学会、高等院校、图书馆与其他学术机构的涉及各学科领域的图书、同行评议的期刊论文、学位论文、论文预印本和技术报告等学术资源。

(三)雅虎

雅虎(Yahoo!)主要提供一个由专家筛选加工而成的主题分类索引体系。目前,雅虎提供13种语言的版本,为全球用户提供网页、图片、音频、视频、新闻、类目搜索、本地搜索等多种服务。

雅虎支持布尔逻辑检索、字段限制检索、短语检索、二次检索和相关搜索等,特色功能有类目检索、雅虎捷径、全能检索、开放资源检索和雅虎统计等。其中,分类目录分为14个大类,每个大类下又分小类,最深可达6级,支持逐级浏览和检索。

雅虎的检索结果按相关度进行排序,并实现网页、图片和博客等多资源的整合检索。在综合考虑网页文本内容、标题和描述的准确性、来源、相关链接和其他重要属性的基础上给出相关度评级。每条检索记录显示标题、摘要、发布日期和快照等。

(四)搜狗

搜狗主要以网页搜索为核心,还可搜索新闻、网页、图片、地图和音乐等资料。

搜狗支持布尔逻辑“与’’(默认值,或用空格)、“非”的检索和短语检索。不区分英文字母大小写。可以把搜索范围限定在某一个或某几个指定站点,多个站点之间用“1”隔开。检索结果可选择“按相关性排序”和“按时间排序”。

四、网络信息检索的技巧

网络信息资源数量庞大、增长迅速、动态性强,要想在很短的时间内得到满意的检索效果,需要掌握一定的检索技巧。具体地说,要完成一次快捷、准确的搜索,可从以下几个方面着手。

(一)选择合适的检索词

选择合适的检索词是用户需要掌握的最基本、也是最有效的搜索技巧。检索词要与拟查的主题相关,表述宜准确、简练,避免使用太泛的词。如果所用检索词检索到的结果太少,可选用其同义词或近义词以提高查全率。相反,如果检索结果太多,可用布尔逻辑“与”连接多个关键词作一些限制。如果不能准确地确定检索词应是什么或搜索的主题范围很广,可以先利用雅虎等目录式搜索引擎,而不必先用关键词搜索引擎。

(二)利用布尔逻辑运算符

绝大多数搜索引擎都支持布尔逻辑运算,以便用户进行不同的组配从而获取最佳搜索结果。要善于利用逻辑“非”尽量排除不相关的检索结果。

(三)使用短语检索进行精确匹配

绝大多数搜索引擎具有短语检索功能,尤其适合于搜索人名、地名、机构名、书名、刊名等专有名词和专业术语。

(四)充分利用搜索引擎提供的高级检索功能

利用高级检索功能,既可使检索结果更准确,又便于表达检索要求,使许多功能的实现更容易。如要查找某一主题的pdf文件,只需要在搜索引擎提供的“文件类型”下拉选单(菜单)中进行点选,而不需要输入filetype:pdf。谷歌、百度和雅虎等重要搜索引擎的“高级检索”界面都提供了布尔逻辑运算符的选择,但是,不同的搜索引擎采用的表述方式略有区别。如谷歌、百度使用的是“包含以下全部的关键词”(逻辑“与”)、“包含以下的完整关键词”(短语)、“包含以下任意一个关键词”(逻辑“或”)和“不包括以下关键词”(逻辑“非”),雅虎使用的是“在结果中包含”(逻辑“与”)、“在结果中完整包含”(短语)和“在结果中不包含”(逻辑“非”)。

搜索引擎提供的高级检索功能还有助于用户进行多种限定,包括限定要搜索网页的时间、网页所在地区、网页使用的语言、网页的格式、关键词在网页中所处的位置(限制在网页标题中可使检索结果的相关度更高)、将检索限定在某一个站点等。尤其值得一提的是文件格式限定。很多有价值的资料,在互联网上并非以普通的html网页形式存在,而是以word、PowerPoint、pdf等格式存在,如许多期刊论文、研究报告、公司的年报和产品手册等多以pdf格式出现。文件格式限定的搜索语法为“查询词”+空格+fiIetype:格式。如要查找“市

场营销”的pdf文件,可输入:“市场营销”filetype:pdf。

更多关注

2018年出版资格考试《初级理论与实务》第一章知识点

>>>2018年出版专业资格考试报考指南

历年出版专业资格资格考试真题大汇总

报名条件 考试科目 考试题型 考试时间



(责任编辑:gnn)

2页,当前第1页  第一页  前一页  下一页
最近更新 考试动态 更多>

近期直播

免费章节课

课程推荐

      • 出版资格

        [VIP通关班-协议退费]

        7大课程模块 2大研发资料 准题库高端服务

        3980起

        初级 中级

        345人正在学习

      • 出版资格

        [VIP通关班-畅学]

        6大课程模块 2大研发资料 准题库高端服务

        3980

        初级 中级

        545人正在学习

      • 出版资格

        [零基础通关班]

        3大课程模块 准题库高端资料 校方服务

        1680

        初级 中级

        465人正在学习