制蜘蛛的抓取量 而不影响seo效果
2017/11/16 15:19:41来源:德道网络
网站假如采用的是虚拟空间,那么都会有 定的流量 制,如果大部分的流量都被蜘蛛所占据,那么我们就需要额外花费 些钱去购 流量了。那么假如 个网站很多流量都是蜘蛛抓取所浪费的,有哪些技巧和方法可以 制而不影响seo效果呢?焦大认为,我们可以采用以下几种方式:
1,找出虚假蜘蛛进行IP屏蔽。通过网站日志分析,我们可以知道其实很多所谓的 度spider或谷歌spider其实都是假的,我们可以通过解析出这些虚假蜘蛛的IP进行屏蔽,这样不 可以节 流量也可以减少网站被采集的风险。具体操作中需要反查出IP是不是真蜘蛛,操作方法为:点击左下角的开始-运行-CMD-输入命令nslookup ip 回车就可以看到结果了。如果是真的搜索蜘蛛都有 个蜘蛛标记,而假的蜘蛛却没有标记。
2,屏蔽 效的蜘蛛或对seo效果小的搜索蜘蛛。 如我们知道谷歌蜘蛛是抓取量 大,但是对于很多行业来说谷歌的流量很低,seo效果并不 ,因此可以进行屏蔽谷歌蜘蛛的抓取而节 大量的流量,例如美丽说网站就屏蔽了谷歌蜘蛛的抓取。除了谷歌之外,还有 些蜘蛛 如的盘古搜索、bing蜘蛛等,这些流量都 低的,或者几乎没有太大作用的蜘蛛其实都可以屏蔽掉。
3,用robots 制 效页面或重复页面的抓取。有 些页面可能以 存在但是现在没有了,或者是存在动态与静态的URL 起存在,由于存在反向链接或数据库内有这样的链接,蜘蛛仍旧会不时进行抓取,我们可以找出返回404页面的URL,把这些URL都给屏蔽掉,这样既提 了抓取屏蔽也减少了流量浪费。
4, 制页面的抓取内容来提 抓取效率与抓取速度,减少抓取流量。对于任何 个页面来说,都有很多 效的噪音区, 如 个网站的登录、注册部分、 下面的版权 息和 些帮助性的链接导航等,或 些模板 存在 些 法被蜘蛛识别的展示模块等,这些我们都可以采用加Noffollow标签或ajax、JS等方法进行 制或屏蔽抓取,减少抓取量。
5,外部调用或cdn加速来提 蜘蛛的抓取,减少服务器的响应和流量浪费。目 的网站大多采用大量的图片、视频等多媒体来展示,而这些图片缺需要较多的下载流量,如果我们把图片采用外部调用的方式,那么就可以节 大量的蜘蛛抓取流量。目 较 的方法有把图片放在其他的服务器或 传到 些网盘 都可以。
6, 用站长工具 制或提 蜘蛛的抓取,或者 制蜘蛛抓取的时间。目 度站长平台和谷歌站长平台都有站长抓取的工具,可以用来 制蜘蛛抓取的时间和抓取量,我们可以根据需要进行合理调配,达到 的效果。