Baiduspider抓了多少页面并不是最重要的,重要的是有多少页面被建索引库,即我们常说的“建库”。众所周知,搜索引擎的索引库是分层级的,优质的网页会被分配到重要索引库,普通网页会待在普通库,再差一些的网页会被分配到低级库去当补充材料。目前60%的检索需求只调用重要索引库即可满足,这也就解释了为什么有些网站的收录量超高流量却一直不理想。 那么,哪些网页可以进入优质索引库呢。其实总的原则就是一个:对用户的价值。包括却不仅于: 1、有时效性且有价值的页面:在这里,时效性和价值是并列关系,缺一不可。有些站点为了产生时效性内容页面做了大量采集工作,产生了一堆无价值面页,也是百度不愿看到的.
2.安装百度分享按钮这个插件,把写完的文章第一时间分享到权重高的社交平台比如人人网,网易,新浪等,分享上去是不会显示文章全部内容的相当于是一个预告,蜘蛛是经常会守在这些高权重社交平台的入口的,这样一来蜘蛛就会顺着分享链接来到你的网站进行抓取。
3、高价值原创内容页面:百度把原创定义为花费一定成本、大量经验积累提取后形成的文章。千万不要再问我们伪原创是不是原创。
4、重要个人页面:这里仅举一个例子,易建联在新浪微博开户了,即使他不经常更新,但对于百度来说,它仍然是一个极重要的页面。
|