级别: 副教授
UID: 15
精华: 1
发帖: 261
威望: 225 点
积分转换
愚愚币: 223 YYB
在线充值
贡献值: 0 点
在线时间: 619(小时)
注册时间: 2006-06-14
最后登录: 2007-08-20
楼主  发表于: 2006-06-15 19:20

 搜索者容易犯的七个低级错误

这里描述了菜鸟们搜索时容易犯的七个低级错误,正是因为你经常犯这些错误,所以你总是得到无用的、荒谬的或者完全没有意义的搜索结果。而一旦你认识到这些错误,将很容易把这些小鬼从你的搜索工具箱中永远驱逐出去。



1:停用词Sputtering on "Stop Words"

==========================

一些搜索引擎会忽略这些词,当你把停用词输入搜索框时,不管网上有多少数量的相关文件,它们一个都不会找回来给你。

这些被叫做“停用词”(stop words),因为搜索引擎在它的数据库里碰到这些词时不会搜索。

为什么不搜么?因为停用词可能太常见了以至于无法搜索出有意义的结果,或者是语言中的副词、连词、介词,或者是"be" 的变体如is、are、were、been等无意义的词,除非它们在一个短语中且有重要的名词和动词相伴。



如果你在一个搜索请求中使用了停用词,那么你得到大量毫不相关的搜索结果。比如,短语"searching the Web" 包含了两个停用词,"the" 和 "Web"。虽然这还不算特别常见的词汇,但Web 在网络上实在是太常见了,使它事实上不能帮你搜索到什么有用的内容。



如果去掉停用词,"searching the Web" 变成 "searching",这个关键词带给你的搜索结果会从搜索一个逃犯直到寻求启蒙。(quests for enlightenment)—如果你够*********,当然也会得到一些关于“searching the Web”的搜索结果。



怎样辨别停用词呢?300个最常用的英文词汇基本上都是停用词,搜索引擎google在你的搜索关键词中含有停用词时,会把它忽略的每个停用词告诉你,就显示在搜索结果页最上边。你可以用一个含停用词 "web" 的关键词试一下。



2:布尔操作符Bungling with Boolean

========================

布尔操作符,象and、or 和not,能够使你的搜索结果更精确——如果使用正确的话。

问题在于布尔操作符看上去太简单了,似乎非常容易使用,这真的可能是一种误解。



按《The Extreme Searcher's Guide to Web Search Engines》的作者Ran Hock的说法, 各种搜索引擎对布尔符都有自己的支持方法,并非完全相同。比如,同样一种效果,有的搜索引擎只要用"not",有的搜索引擎却要用"and not"才能达到。而且,有些搜索引擎要求布尔符必须是大写的,另一些就没有这种要求。



如果你真的想使用布尔符,请认真学习它的使用方法。





3:普通词Being Ever So Vulgar

=====================

Vulgar来自拉丁语vulgus, 意思是普通。象一些有教养的诡辩家,搜索引擎对普通词的搜索存在缺陷。不是因为它们妄自尊大或自命不凡。而是因为这些词太常见了,以至于出现在成百万上千万的网页中,使得它们事实上不能被用来帮你找到什么有用的内容。



比如说“weather”, 有成千上万的网站提供跟“weather”相关的信息,从地方天气预报到学术论文到气象学,

所以使用更多的关键词或更明确的关键词来搜索要比单单搜索"weather"好得多。 设计一个类似 "Cicely Alaska annual snowfall"这样特殊的搜索关键词,会给你真正有用的结果。





4:寻找玫瑰,Looking for a Rose, By Any Other Name

======================================

要小心使用多义词。 Kris Carpenter是Excite 的搜索服务主管,举了"bond" 作为例子。我们不得不问自己,他们在找的信息是关于金融公债的、化学粘合剂的、还是大名鼎鼎的007邦德的?

最好的解决办法是,在搜索引擎之前先问自己这个问题,然后用短语代替多义单词作为关键词。



搜索引擎也很容易被同拼法异音异义的词迷惑,比如 "lead" ,发音LEED的时候, 意思是领导,发音LED的时候指的是一种金属元素。



如果可以,尽可能使用意义明确的同义词代替同拼法异音异义的字。例子可以看The Heteronym Home Page.





5:大写字母Committing Capital Offenses

===========================

搜索者的另一个问题是要不要在关键词中使用大写字母。

有的搜索引擎是区分大小写的,但也有搜索引擎是不分大小写的。

凭经验来说,总是使用小写字母搜索是个好主意。

这样搜索,会得到所有包含你的搜索关键词的网页,不管其中的关键词首字母大写还是小写。



如果你在搜索关键词中使用大写字母,那么搜索引擎返回的结果将只有一种,其网页中含有大小写跟你的搜索关键词完全相同的单词。

象人名和地名之类关键词使用大写字母是个好选择,但是其它对大小写没那么敏感的单词,如果也使用大写字母,可能使你错过很多有用的网页。



如果想知道哪个搜索引擎对大写敏感,以及如何处理大小写字母,就对Danny Sullivan的网站“Search Engine Watch”上的Search Engines And Capitalization花点时间吧。





6:Close, But No Cigar

=====================

多数搜索引擎对于 "Kosovo refugees" 或 "space shuttle missions" 这样的短语搜索效果很好。然而,当你使用类似这一节的标题的短语“Close, But No Cigar”进行搜索时,就遇到问题了。 在一个主流搜索引擎中搜索"close but no cigar",得到的第二条结果是:The Common Cold: Relief But No Cure. Definitely no cigar!



两个关键词之间的距离称为接近程度。 当你的搜索关键词们分散在一个网页的不同位置时,有些搜索引擎会给你一个积极的结果,不管它们是否彼此靠近,还是位于同一个短语中。



如果你希望你用的搜索关键词们在搜索到的内容里互相靠近,那么你的最好选择是AltaVista 和Lycos, AltaVista 它允许你使用 NEAR 这个操作符号,而 Lycos 的高级搜索提供了多种设置关键词接近程度的可能。





好,现在说最容易犯的那个搜索错误



7:在错误的地方搜索Searching for Hits in all the Wrong Places

===========================================

在你决定找某种内容之前,先确认你对这次搜索任务使用了正确的工具。各种搜索引擎在搜索范围、功能和质量方面大相径庭,如果没有为你的每次搜索分别选择正确的搜索工具,你将浪费自己大量的时间。



你应该使用Excite 还是HotBot? AltaVista 还是 InfoSpace? 分析你的需求,比较不同搜索引擎的强项和弱点,然后选择最适合这次搜索任务的搜索工具。



如果你真的遇到怎么也搜索不到,那也不要太过苛求自己。我所听过的最荒谬可笑的说法是:“你能在ingternet上找到任何东西”。这就象在说,你能在每一个煤矿里都找到钻石。



也许听上去有点异端邪说的味道,但是有个网络搜索指南确实说过,有时你能选择的最好搜索方法是放弃搜索,跑一趟附近的图书馆。图书馆里网上找不到的成吨的信息资源。而且图书馆员一般是受过训练的的专家,它们通常会很乐意帮你找东西。当你在网上无处可去的时候,试一下真正的“人工智能搜索引擎”吧,你会发现它们真的非常优秀 。





让错误走开Begone, Mistakes!

====================

在你逐渐获得网络搜索经验的过程中,避免这七个常见的搜索错误将成为一种自然而然的习惯。无论何时,当你得到意料之外和怪异的搜索结果时,记得检查一下你用的搜索关键词,弄明白发生了什么事。你可能发现又一个自己需要避免的搜索错误。
“Once you start studying medicine, you never get through with it”

——Charles H. Mayo (1865–1939)

分享:

愚愚学园属于纯学术、非经营性专业网站,无任何商业性质,大家出于学习和科研目的进行交流讨论。

如有涉侵犯著作权人的版权等信息,请及时来信告知,我们将立刻从网站上删除,并向所有持版权者致最深歉意,谢谢。