1、网站权限,如果网站打开需要权限那么搜索引擎就无法收录了
2、网站URL结构层次过深路径过长
3、通过模拟抓取,诊断是否可以抓取的到。
4、Robots文件屏蔽 robots.txt文件设置错误
5、是否存在大量404死链
6、服务器响应速度
网站不收录原因一览
7、网站被黑存安全隐患,网站被黑,存在安全隐患。网站被挂了黑链,植入了恶意代码,严重影响了安全,搜索引擎会做出判断,导致网站不收录或者收录减少。
8、网站内容质量低
9、少点广告,蜘蛛对于广告是非常厌恶的
10、复杂冗长的代码,干净利落的代码才会是蜘蛛的最爱。
11、网站缺乏高质量外链
12、新站整体权重低影响收录
13、域名是否被K
14、网站内容质量问题
15、网站域名是否是有不良历史记录?
16、网页结构不合理。网站使用大量的js、flash、ifrmae等内容。
17、网站带有敏感词汇:第一类是带有极限描述的词语,如“最,第一,最好”等;第二类是违反广告法的词汇,可以网上查阅相关文档;第三类是含有违法的词汇。
18、tdk是否存在关键词堆砌
19、网站内容排版格式混乱,界面无美感
20、网站原创内容被其他站点大量采集使用
21、网站优化过度,被降权造成的网站不收录
22、网站改版造成的收录问题
23、搜索引擎算法的改变,会误伤到正常的网站
24、文章格式不乱、层次不分明
25、html标签使用错误,例如:一个页面存在多个H1标签等...
26、网站内容更新不规范(建议每天定时更新文章内容)
27、蜘蛛无抓取,长时间更新文章且未被搜索引擎抓取过(建议将搜索引擎提供的链接提交方式都操作一下)
28、整站都调用的同一个标题
29、网站还处于新站考核期
30、网站大改版过了,搜索引擎在重新评估(尤其是url地址改版,会造成大量的404页面)
31、空白无意义页面