级别: 博士生
UID: 385
精华: 0
发帖: 94
威望: 110 点
积分转换
愚愚币: 82 YYB
在线充值
贡献值: 0 点
在线时间: 370(小时)
注册时间: 2006-06-20
最后登录: 2009-05-27
楼主  发表于: 2006-07-06 13:19

 搜索的三要素

搜索的三要素

借用生产力三要素的理论,对搜索进行分析一下。在搜索过程中,相对应于劳动者、劳动对象、劳动工具的分别是搜索者、搜索词和搜索引擎。只是这里,无论是劳动对象——搜索词,还是劳动产品——信息,都不再是以前那种实在的物品了。

可以这样理解搜索:由搜索者对试图查询的信息的部分已知特征进行描述,把这些特征通过搜索引擎能接受的方式进行提交,在返还的信息中进行辨别和判断,有时需要反馈以及重复提交,最终确认获得信息整体或者信息特定的未知特征的过程。可以用一个图表示,还没想好画出来,呵呵。

进行搜索的时候,搜索词的设定会影响到查准率、查全率等一些概念,其实,在搜索引擎和搜索者中同样存在这些问题,是从不同的角度对搜索的三要素提出的更高要求而已。

于搜索词而言,搜索词的正确设立是非常重要的,准确、专业的搜索词可以使搜索结果的查准率升高,而选用搜索词数目的多少,会使得搜索的限制条件发生变化,进而影响到搜索的查全率,搜索词越多,意味着提交的特征越多,越有可能搜到所需要的特定信息,查全率降低的同时,提升查准率。但搜索词不是越多越好,要避免选用了错误或者有偏倚的搜索词,结果筛除掉太多正确的信息,或者对搜索者进行误导,最终同时损害查准率和查全率。针对不同的搜索目的,对搜索范围进行调整,特定不变的信息只需要查准即可,信息或者事物的全面特征就需要查全了。

采用不同搜索引擎,得到的结果是不一样的。查全率在这里是指搜索引擎收录的网页数目,收录的越多,能查到的就越多。查准率则是指搜索引擎的搜索能力,即采用怎样的搜索技术(算法)。google采用pagerank,,雅虎采用YST(Yahoo Search Technology)技术百度采用超链分析技术。人工干涉搜索排名(如竞价搜索,谁出的钱多,搜索时它的信息就能排在搜索页面的前面)会影响查准率,影响到搜索者的判断和搜索体验,这其实是一种短视行为,但目前至少google还没有这么做。有时针对一些罕见信息,为了搜索得到它们,或者比较判断获得信息的可靠性,在可能的情况下,去几家搜索引擎同时搜索,方能达到上述目的,可以说是查全和查准的极端情况。但记住最好是采用不同搜索技术的搜索引擎,采用同一技术的引擎很可能返回相同的搜索结果。元搜索引擎(meta search engine)基于上面的理论诞生,但它不一定能得到你所需要的内容,个人建议还是自己逐个去尝试比较。

对于搜索者来说,需要两方面的训练,一方面在平时生活学习中积累经验,熟悉所研究的信息的基本特征;另一方面,熟悉搜索的思路,熟悉在搜索引擎中表达信息特征的过程,熟悉搜索引擎的特点和专长,熟悉在搜索页面中快速学习,将补充特征反馈给搜索引擎重复搜索的思路。那么,无论想提高查准率还是想提高查全率,都将是一件轻而易举的事情。只是要记住,搜索的结束不是学习的结束,往往是学习的开始,搜索的目的是为了更好的学习,而不是当这些信息资料的仓管员。千万别把时间精力浪费在穷及搜索和疯狂下载收集上面。

欢迎探讨和质疑,呵呵。
分享:

愚愚学园属于纯学术、非经营性专业网站,无任何商业性质,大家出于学习和科研目的进行交流讨论。

如有涉侵犯著作权人的版权等信息,请及时来信告知,我们将立刻从网站上删除,并向所有持版权者致最深歉意,谢谢。