赞
踩
1、dns异常
当百度蜘蛛(Baiduspider)无法解析您网站的IP时,会出现DNS异常。可能是您的网站IP地址错误,或者域名服务商把Baiduspider封禁了。
可以用WHOIS或者host查询自己网站IP地址是否正确而且可以解析,如果不正确或无法解析,与域名注册商联系,更新网站IP地址。
2、连接超时
抓取请求连接超时,可能原因是:服务器过载或网络不稳定。
3、抓取超时
抓取请求连接建立后,下载页面速度过慢,导致超时。可能原因服务器过载,带宽不足。
4、连接错误
无法连接或者连接建立后对方服务器拒绝。
链接异常原因:
1、访问被拒绝
爬虫发起抓取,httpcode返回码是403。
2、找不到页面
爬虫发起抓取,httpcode返回码是404。
3、服务器错误
爬虫发起抓取,httpcode返回码是5XX
4、其他错误
爬虫发起抓取,httpcode返回码是4XX,不包括403和404。
关于上面提到的403、404、4XX、5XX等,其实都是网站HTTP状态码,如果不清楚同学,可以看这一篇:SEO入门学习之搜索引擎(百度)蜘蛛与网站HTTP状态码,再学习一下。
网站抓取异常的原因有哪些? 网站抓取异常的原因主要有以下五个方面: 1、服务器异常 服务器连接异常最大的可能是网站服务器过大,超负荷运转,通过检查浏览器输入你的域名是否正常访问。服务器异常会导致蜘蛛无法连接网站服务器,导致出现抓取失败。 2、域名过期 域名过期网站肯定不能访问,域名解析就会失效了。如果存在这类情况,你可以与你域名注册商联系解决,看是否被抢注,还是可以续费回来。 3、网络运营商异常 电信和联通这两种都是属于网络运营商,蜘蛛无法访问的网站。 如果是因为电信或联通网络运营商出现问题,与网络服务运营商联系或者购买CDN服务。 3、robots.txt文件设置问题 robots.txt的功效主要是一些不重要的文件屏蔽掉告诉搜索引擎这些些页面可以不抓取,但也可能会存在把重要的页面也给屏蔽了,可以检查下robots文件设置。 关于ROBOTS.TXT,可以看我之前写的这篇里面有写到: 白杨SEO:新人学习SEO常遇到的15个SEO术语,建议收藏 4、死链接因素 原本正常的链接后来失效了就是死链接,死链接发送请求时,服务器返回404错误页面。 死链的处理方案可以通过百度站长平台提交死链文件。END
编辑整理:王小贱 公众号:输赢(lizhishare)资深SEO揭秘SEO到底是个啥?
SEO大全|让你网站快速被蜘蛛抓取的十三个方法
三种SEO优化作弊行为,千万不要模仿!
技巧|9个影响你网站的隐藏SEO问题
天天发外链做百度/谷歌SEO,为什么长期没效果呢?
网站建设要注意哪些SEO推广细节?一文读懂SEO优化
来源自网络;如涉及版权请告知,对文中观点保持中立,仅供参考、交流。(侵删)
白杨SEO简介: 白杨SEO,专注SEO研究十年,SEO实战派。个人微信:baiyang2047 对互联网精准引流有深入研究。前杰恩西运营总监(COO),现自由职业。 白杨SEO付费群 199元/年 。如需加好友,验证:公众号;如需进群,验证:进群。如果想加入白杨SEO付费星球学习提问,回复关键词“优惠券”即可,数量有限!Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。