您现在的位置: 365建站网 > 365文章 > 2.5 搜索引擎之关键字查询

2.5 搜索引擎之关键字查询

文章来源:365jz.com     点击数:861    更新时间:2009-07-14 12:48   参与评论

搜索引擎在计算完所有页面的权重后,搜索引擎就可以向用户提供信息查询服务。搜索引擎查询功能的实现非常复杂,用户对返回结果的时间要求也非常高(通常是秒级),要在这么短的时间内进行这么复杂的计算是不现实的。所以,搜索引擎需要通过一套高效的机制处理来自用户的查询。
主要包括:
a:在用户发出查询请求前就完成被查询关键字的反向索引,相关页面权重计算等工作;
b:为那些查询的反向索引,页面权重分配等工作已经在前面进行了详细的说明。接下来,向读者介绍搜索引擎如何建立信息查询的缓存机制。
1.查询流程
首先,介绍搜索引擎处理用户查询的流程。如图所示(www.365jz.com)

 


(1)先对用户提供的查询条件进行切词,并删除查询条件中没有意义的字或词,例如的,得等停用词;
(2)再以切词结果作为条件在关键字反向索引列表中进行匹配;
(3)如果存在匹配结果,则把所有与关键字相匹配的页面组成一个列表;
(4)最后,把匹配的页面按照权重值从高到低进行排序,并返回给用户。

说明:其中午(3)和(4)两个步骤在用户查询之前已经完成.

2.用户行为
用户在搜索引擎中的行为主要包括搜索及点击。搜索是用户获取信息的过程,点击是用户得到需要信息后的表现。
用户的搜索及点击行为中蕴含着非常丰富和重要的信息。例如,在用户搜索行为中包含了“提交的关键字”,“提交时间”,“用户IP地址”等信息,而在点击行为中则包含了“每个结果的点击次数”等信息.搜索引擎通过对用户行为的分析可以进一步发掘用户的需求,提高搜索结果的精准度。
众所周知,搜索结果中越靠前的链接得到点击几率就会越高。按照这样的逻辑,那么第二,第三甚至第四的页面被点击的要会就变得的越来越小,但这并不代表这些页面就不比排在前面的页面重要,只是在目前的排序中,用户还没机会发现它们而已。所以,对于不同位置上链接的点击,搜索引擎会对其权重进行相应的补偿。假设排在第一位的结果每被点击一次,会产生1分的补偿,而排在100名的结果被点击一次,则产生10分甚至更多的补偿。

3.缓存机制
为了能在极短的时间内响应用户的查询请求,搜索引擎除了在用户提交查询信息前就生成关键字的页面排序列表外,还需要为那些查询最频繁的关键字对应的页面排序列表建立缓存机制。
经过统计,搜索引擎发现关键字查询的集中现象非常明显。查询次数最多的前20%的关键字大约占了总查询次数的80%(这就是著名的80/20法则)。因此,只要对20%左右的关键字建立缓存就可以满足80%的查询需求.
(seo入门专题教程不断更新中:https://www.365jz.com/Special/seo/)

如对本文有疑问,请提交到交流论坛,广大热心网友会为你解答!! 点击进入论坛

发表评论 (861人查看0条评论)
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
昵称:
最新评论
------分隔线----------------------------

快速入口

· 365软件
· 杰创官网
· 建站工具
· 网站大全

其它栏目

· 建站教程
· 365学习

业务咨询

· 技术支持
· 服务时间:9:00-18:00
365建站网二维码

Powered by 365建站网 RSS地图 HTML地图

copyright © 2013-2024 版权所有 鄂ICP备17013400号