3.6 关键字分布及表现形式 搜索引擎对网页的分析是在网页的HTML源代码上进行的,网页的源代码从一定程度上反映了搜索引擎分析网页内容的先后顺序。本节将结合页面布局及HTML源代码对关键字分布规律进行说明。 3.6.1 关键字分布 搜索引擎分析网页时,在HTML源...
3.4 关键字词频与密度的关系 尽管关键字密度与关键字词频都是表达页面中某个关键字的多寡,但是两者的含义却存在很大差别。关键字词频表达的是关键字出现的次数,而关键字密度表达的是该关键字的词频与页面总词汇量的比例。两者的关系如下。 l 关键字密度是...
下面介绍两大中文搜索引擎:google及百度 Google Google是基于全文索引的搜索引擎,起源于斯坦福大学BackRub项目,由Larry Page及Sergey Brin 主要负责.到1998年,BackRub更名Google,并成立公司,发展至今。 Google是目前世界上最大的搜索引擎,先进的算法被...
搜索引擎在计算完所有页面的权重后,搜索引擎就可以向用户提供信息查询服务。搜索引擎查询功能的实现非常复杂,用户对返回结果的时间要求也非常高(通常是秒级),要在这么短的时间内进行这么复杂的计算是不现实的。所以,搜索引擎需要通过一套高效的机制处...
用户想搜索引擎提交关键词查询信息后,搜索引擎就在结果页面返回与该关键词相关的页面,这些页面按照与关键词的相近程度对网页进行排序,决定网页关键词排名的因素有很多,在此我介绍三种最重要的因素。 一、页面的相关性 搜索引擎在对页面相关性判断的时候...
搜索引擎按其工作方式主要可分为三种,分别是全文搜索引擎(Full Text Search Engine)、目录索引类搜索引擎(Search Index/Directory)和元搜索引擎(Meta Search Engine)。 全文搜索引擎 全文搜索引擎是名副其实的搜索引擎,国外具代表性的有Google、Fast...