您的位置:SEM营销 > SEO随笔 > 百度谷歌动态

百度对网站评级优质站点劣质站点

编辑:郭留存 标签:

互联网海量Web数据的产生,给搜索引擎技术带来了严峻的挑战,但同时也带来了新的机遇。从网页抓取的角度来看,同一站点往往包含质量相似的资源,对一个优质网站进行爬取,往往可以找到更多的优质资源。因此,我们希望对网站的质量进行评级,来反映资源的质量水平,从而影响spider的调度和收录。

在以往的实践中,网站评级大体思路是根据人工调研出的经验构造出规则和阈值。发现问题后逐个打补丁、调阈值,来适应变化。这种方式最大的问题在于扩展性不强、维护代价高,而且不利于国际化多语言的支持。因此,百度希望采用更智能的方法,在站点数据中自动发现规律,来完成质量的评级。

区分优质站点和劣质站点就是要挖掘一批质量优异的站点,将其作为系统的基本集合,减少反垃圾反作弊的代价,提高系统检索结果的稳定性和权威性,减少用户的不良反应;同时使整个互联网生态趋于正常,鼓励为互联网创造有价值的资源。

百度分别在优质站点和劣质站点内部再细分成若干等级。用这些级别区分出站点质量的差距,从而会影响spider的调度和收录控制,同时也会影响低质网页的筛选。

百度的目标是使优质的资源在整个系统中占绝对优势,而劣质的资源排斥在外,仅作为系统策略不完善时的必要补充。

百度站点质量智能评级框架:在任务层面上,首先,百度先将站点划分为优质站点和劣质站点。其次,分别在优质站点和劣质站点内部再细分成若干等级。在策略层面上,百度采用了一系列机器学习方法,对人工标注的样本进行学习,建立模型,并将学习到的知识应用到未知站点数据中,来完成质量评级的任务。

——东莞SEO

文章原载:SEM营销管理柳村客栈,转载请注明出处。
本文网址:http://www.guoliucun.com/news/se/363.html
共有:条评论信息

评论信息

对此文您有什么高见?柳村期待阁下犀利的见解,一针见血的点评!
姓名(必填): 网址(可空): ( 网址形式:http://www.guoliucun.com )
验证码:
友情提示:柳村客栈已向各大搜索引擎申请'留言评论不作为外链接',请勿灌水,谢谢合作。