百度原创星火计划是在,百度搜索团队首次表示,正在设计一套较完善的原创识别算法,并提出了互联网生态的项目课题,是为了解决原创内容的搜索排名问题。2013年2月,百度搜索团队在发布的2013年中国网站发展趋势报告中更是明确表明,2013年百度将推出原创星火计划,建设原创联盟,给予原创、优质站点更高的发展空间。
原创星火计划算法是什么
是指一套较完善的原创识别算法,并提出了互联网生态的项目课题,是为了解决原创内容的搜索排名问题。互联网鼓励原创,尤其是对于搜索引擎,更希望将优质的原创内容推荐给用户,百度站长平台lee发表了一篇名为:谈谈原创项目那点事。其主要目的,就是鼓励所有的站长支持原创。
算法内容:
百度原创星火计划:百度一直致力于原创内容的识别和排序算法调整,但在当前互联网环境下,快速识别原创解决原创问题确实面临着很大的挑战,计算数据规模庞大,面对的采集方式层出不穷,不同站点的建站方式和模版差异巨大,内容提取复杂等等问题。这些因素都会影响原创算法识别,甚至导致判断出错。这时候就需要百度和站长共同努力来维护互联网的生态环境,站长推荐原创内容,搜索引擎通过一定的判断后优待原创内容,共同推进生态的改善,鼓励原创,这就是"原创星火计划"。
已经覆盖了如下资讯类站点:
cctv新闻网、财新网、21世纪经济报道、国际在线、环球企业家、财经网、搜狐、网易、人民网、三联生活周刊、腾讯、新浪、新华网、凤凰网、环球网、中国新闻网、36氪、果壳等。
一、覆盖的站点及量级
原创星火计划一期采用邀请制,目前覆盖了如下偏新闻资讯类站点的约百万级url:cctv新闻网、人民网、新华网、财经网、凤凰网、环球网、中国新闻网、财新网、21世纪经济报道、国际在线、环球企业家、三联生活周刊、腾讯、新浪、搜狐、网易、36氪、果壳等站点。
二、原创内容所获得的优待
1、排序上:满足用户需求的前提下原创url给予优先展示;
2、展现上:给予原创内容富摘要的展现形式(如下图)标记原创以引导更多的用户达到原创优质站点
三、原创星火计划一期实验效果
1、原创星火计划上线前后的同期流量对比显示,原创url流量增长明显。
2、原创星火计划上线后一段时间内原创url流量增长明显并逐渐趋于平稳。
四、原创星火计划二期进行中
原创星火计划一期主要侧重于新闻资讯类内容。在二期中,一方面,我们将继续扩大覆盖范围;另一方面,在各个垂直领域内我们将邀请部分优质原创内容较多的网站加入,近段时间将有站长陆续收到我们的邀请。同时,原创“起源”算法的升级将于近期进行,对大量的个人优质原创型内容将有较明显的效果提升。
原创星火计划算法有什么优势
1、展示:展示原始内容的丰富摘要,以引导更多的用户访问原始质量站点。
2、排序:满足用户需求的前提下原创URL给予优先展示。
当你做到了百度原创星火计划算法以后
1、百度原创星火计划算法上线后,原创URL流量增长明显,比起同期高很多。
2、百度原创星火计划算法上线后一段时间,原创URL流量增长明显,并逐渐趋于稳定。
根据百度安排,以上内容是第一阶段。
第二阶段:重点支持原有联盟网站,并开放高级站长工具,为这些网站提供更好的发展环境。
第三阶段:支持所有原始站点,同时添加协议标签,实现站点与搜索引擎之间的生态关系。
同时百度会在各个垂直领域内邀请优质原创内容较多的网站加入,一起促进百度原创星火计划算法的发展。
如果你也想参加百度原创星火计划算法的原创计划,在文章上要注意这些哦:
1、转载及简单二次加工内容的网站不允许申请。
2、网站首创,具有社会共识价值的资源,符合国家有关规定可以申请。
3、网站首创,非剽窃的、内容和形式都有独特个性的可以申请。
如何加入百度原创星火计划算法
为了确保百度能够首次发现原创内容,网站需要在发布后使用百度站长平台提供的链接提交-主动推送模式提交原创内容页面。
1、已在百度站长平台验证站点。
2、进入百度站长平台,登录账号。
3、点击工具——链接提交——自动提交——主动推送。
重视原创的目的:
1、采集泛滥
分析:互联网上,采集泛滥的地区主要分布在,新闻、咨询、小说等领域,由于现在采集器越来越复杂,一般一个网站是很难防止不被采集的。
做网站做内容,我们经常会发现的一个问题,就是,自己在网站上,原创更新了一篇内容,但是过几天去百度查询排名的时候,会发现,由于网站权重等因素,那些转载了该篇文章的网站,却排在了前列。
对于大多数的中小型网站来说,搜索流量在总流量中,占有很重要的位置,如果长期原创,却不能获得应有的排名和流量,站长就会失去原创的兴趣,从而减少原创的比例。
2、提高用户体验
分析:大家都知道,原创文章对于网站的重要性,但是创造原创内容是一件很困难、很费时间的事情,有市场就会机会,所以市场了出现了大量的伪原创工具,原理就是将文章章节打乱,通过重新组合、添加关键词等方式,努力将原来的文章变成一篇新的。
这些文章有一个共同点就是,可读性较差,从而导致用户体验度不高,另一方面,对搜索引擎的搜索质量也会产生一定的影响。
提高用户体验,这是一个永远的话题,对于搜索引擎来说,虽然现在很多方面都做的还不够尽如人意,但是至少一直是在朝这个方向努力。
3、鼓励原创作者和原创内容
分析:就像第一点说的那样,只有对坚持原创的网站、原创的内容,给予适当的权重、排名,只有原创作者享受到了,原创所带来的巨大利益,作者才会坚持原创下去。
判断原创内容有哪些困难:
1、冒充原创,篡改关键信息
分析:其实很多坚持原创的网站,都是那些中小型网站,但是由于蜘蛛爬行频率、搜索引擎重视程度等原因,在原创文章发表以后,经过其他网站的转载,篡改文章中涉及到的版权、关键词等信息,冒充原创。
由于转载网站在权重等方面的优势,搜索引擎蜘蛛很难去判断,这篇文章是哪一个网站抄袭了哪一个网站。
2、使用伪原创工具,对文章改头换面,批量生产“原创文章”。
分析:不管如何判断文章是否为原创,由于网络上数以亿计的海量文章,判断的主体,都是程序来检验的。是程序就会有漏洞,是程序就可以摸索其中的规律,很多伪原创工具,可以通过这些工具和漏洞,将文章重新组合以后,变成“原创”。
由于制造原创的工具也是随着算法的变化而变化的,在判断过程中,也会拥有一定的难度。
从百度的描述中,可以看到,由于通过工具生产的所谓“原创文章”,具有语句不通顺,用户可读性差等原因,这些内容,是这段时间,百度重点整治的对象。Q猪提醒,如果你也在使用这些工具,就赶紧停止吧。
3、结构差异化
分析:我们知道,每个网站的结构都具有差异化,搜索引擎在抓取内容时,一般是通过分析,同一个网站中,哪些内容是通用的、哪些内容是真正具有价值的,然后分析这些有价值的内容,再索引至数据库中。
但是,不同的站点结构化差异比较大,html标签的含义和分布也不同,因此提取关键信息如标题、作者和时间的难易程度差别也比较大。所以,每个网站都需要一个合理的网站结构,简单、清晰、明确,不仅让搜索引擎可以很清楚的抓取网站内容,也可以让用户更流畅的浏览网站内容。
如对本文有疑问,请提交到交流论坛,广大热心网友会为你解答!! 点击进入论坛