百度这样抓取我们的网站

评论(4)

百度抓取我们网站的原理很简单,其实就是根据你网站的页面权重来决定多长时间来访问一次该页面,页面越高获得的访问次数也就越高,访问时如果页面内容发生变化,百度会根据内容的变化、网站内部链接的指向去将你新增的网页进行索引。

抓取原理

需要讲一下的是,最近百度发布站长平台,并大喊着愿与 SEO 直接对话,可以直接提交 SiteMap 到百度索引,这里我们不做探讨, SiteMap 只是搜索引擎的一种辅助手段。
原理:百度每天会访问你权重较高的页面数次(如首页),通过页面内容的前后对比决定要不要将你的新建的文章进行收录。

实例

前两天做了一个草根金融的小专题页面,将整个草根金融分类的文章退出我的首页索引,可能是因为我网站权重较低的缘故吧,
因为文章没有发在首页上,所以导致文章在发布3天后才陆续被收录,当该分类稳定每天发文获得一定权重后,百度才开始每天定期收录该分类的文章。

增快收录的策略

之前我一直喜欢将文章分来开发布,经过这阵子的经验证明,分开来发布其实对文章页面的收录不太有利,如果我们的首页已经获得一定的权重,我们可以将文章在 WordPress 中先保存为草稿,等将今天要发的文章都编辑好后,设定一个时间一起进行发布。

注意事项

当然,这里有一点需要注意,就是你首页文章的数量,也就是链接数量,在这我的建议是不要一下子发布N篇文章将首页内容全部改变,要有一定的更新比例,比如我首页的总文章链接输出(搜索引擎能识别的)大概有15个左右,我每次更新文章的比例一般控制在3-5篇。





转载请注明转自: 百度这样抓取我们的网站

  1. 学习了!~

  2. 哦 原来是这样!

  3. @115q
    我是说我的网站首页输出的链接数量。

  4. “在这我的建议是不要一下子发布N篇文章将首页内容全部改变,要有一定的更新比例,比如我首页的总文章链接输出(搜索引擎能识别的)大概有15个左右,我每次更新文章的比例一般控制在3-5篇。” 百度 能识别的“首页链接输出”确信只有15个吗?加入把网站首页做成上千的链接,会不会增加百度的收录呢?