您现在的位置: 365建站网 > 365文章 > 3.3 关键字密度

3.3 关键字密度

文章来源:365jz.com     点击数:1092    更新时间:2009-07-15 10:12   参与评论

3.3 关键字密度

在实际中,常用关键字密度来衡量页面中关键字的词频是否合理。关键字密度主要是由“关键字词频”及“网页总词汇量”两个因素决定,这三者关系如下:

关键字密度=关键字词频/网页总词汇量

式中,总词汇量是指页面程序标签(如HTML标签及ASP、JSP、PHP等)以外的所有词汇的数量。

而以下对关键字密度的理解是不正确的:关键字密度=关键字总字节数/页面总字节数。

要了解关键字密度,我们先来认识搜索引擎对页面的分词方法。(本书将从中英文这两种我们平常接触得最多的语言出发介绍关键字密度。)

3.3.1 英文关键字密度

要了解英文关键字密度,关键是要认识在英文语言环境中,搜索引擎是怎样对页面进行分词的。

1.英文分词

分词指把网页中的正文内容划分为若干个具有实际意义的词汇。在英文书面表达里,空格是单词间的自然分隔符,而句点就是一个句子或者段落结束的标记。根据这个特征,搜索引擎就可以轻易地对网页正文内容进行准确的划分。

如图3-1所示,camcorder battery 间的空格就单词camcorder与单词battery间的分隔符;而句点“.”则是该句子结束的标记。

图3-1 英文句子

2.英文关键字密度

在英文中,同一单词的不同形式会被认为是两个不同的单词(大小写除外)。例如,battery与其复数形式batteries,会被认为是两个不同的单词。在图3-1的句子中,battery与batteries各在页面中出现了1次,则battery与batteries的关键字密度都是1/17。

而对于词组,通常通过计算组成词组的单词的密度去衡量该词组的密度是否合理。例如图3-1中,词组关键字camcorder battery中camcorder与battery都出现了一次,则它们的关键字密度都为1/17。下面来介绍一个计算英文页面中关键字密度的工具——关键字密度检查器。

3. 英文关键字密度工具

(工具地址:http://www.webconfs.com/keyword-density-checker.php

“关键字密度检查器”只适用于英文网站。这款工具通过统计页面中每个单词的词频,计算出每个单词占页面总单词量的比例,如图3-2所示。

我们只需要在文本框中输入要查询的页面URL即可,例如输入http://www.pcb-prototype.net,点击submit按钮即可查询该页面中关键字的密度,结果如图3-3所示。

图3-2 关键字密度检查器界面

图3-3 页面中部分关键字的密度

3.3.2 中文关键字密度

1.中文分词

在中文里,字或者词之间并不存在自然分隔符,而且中文里的词通常由两个或两个以上的中文字符组成。因此,搜索引擎不能借助分隔符对页面正文内容进行分词,而是按照某种算法把页面正文内容划分为若干个中文词汇(请参考2.3.2节)。(www.365jz.com

2.中文关键字密度

为了让读者可以更加容易理解中文关键字密度,下面举一个简单的例子进行说明。

例如网页内容为“我的笔记本”,搜索引擎将其切分为“我”、“的”、“笔记本”,则关键字“笔记本”在这个文档中的密度就是“1/3”。

对于短语关键字,通常通过计算组成短语里的每个词的密度去衡量该短语的密度。例如,“智能手机走进大众市场”可以切分为“智能”、“手机”、“走进”、“大众”、“市场”。其中的“智能”及“手机”各出现了一次,则它们的关键字密度都是“1/5”。

3.3.3 关键字密度范围

通过以上内容,我们知道搜索引擎对页面的分词方法,以及如何计算中英文页面中的关键字密度。但是,页面中关键字密度在什么范围才算合理呢?这在不同的搜索引擎中会有所差别。一般认为,关键字密度在6%~8%是比较合理的。

为什么关键字密度在6%~8%的范围内较为合理呢?搜索引擎会把对传统事物的分析、统计结果作为制定算法的一个参考指标。例如,对N个网页进行分析、统计后确定这个范围。加强对传统事物的观察,对开展搜索引擎优化也是有一定帮助的。

3.3.4 关键字密度与页面相关性

关键字密度是衡量页面相关性的重要指标之一。搜索引擎会根据页面中每个关键字的密度对页面的主题进行定位。也就是说,如果我们的页面要出现在某个关键字K的搜索结果中,最基本的是页面中K的关键字密度要在某个特定的范围内(如6%~8%)。

例如,要想让你的网站中的某个页面出现在“手机”的搜索结果中,则首要条件就是该页面上“手机”这个词的密度要在某一个特定的范围内。否则,就会被排除在“手机”的搜索结果以外。

对于短语关键字,除了评估组成短语的每个词的密度是否合理外,还要统计该短语出现的频率。例如,要评估页面与“搜索引擎优化”的相关性,搜索引擎首先会计算页面中“搜索引擎”及“优化”这两个词的密度,再统计该短词出现的频率,最后用这两个数据进行综合衡量。

(seo入门专题教程不断更新中:https://www.365jz.com/Special/seo/)

如对本文有疑问,请提交到交流论坛,广大热心网友会为你解答!! 点击进入论坛

发表评论 (1092人查看0条评论)
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
昵称:
最新评论
------分隔线----------------------------

快速入口

· 365软件
· 杰创官网
· 建站工具
· 网站大全

其它栏目

· 建站教程
· 365学习

业务咨询

· 技术支持
· 服务时间:9:00-18:00
365建站网二维码

Powered by 365建站网 RSS地图 HTML地图

copyright © 2013-2024 版权所有 鄂ICP备17013400号