老网站不收录,多为内页新增加的页面不被搜索,多为页面质量问题。
1、网站服务器稳定性。可通百度资源网站管理信息中,抓取异常,看出服务器的稳定性。
2、检查robots.txt文件是否允许抓取。网站制作的策划很重要,网站设计的时候要考虑到如:网站首页、及各栏目页面是否被屏蔽抓取。
3、检查网站各个页面路径是否良好。如:调用查数非常多并不是利于收灵,及site:网站检查是否有动静态共存路径
4、重要的页面不能写在JS标签内。如:首页导航、版块样式,各栏目页块型模、内页版块都不能写JS标签里,不会看代码的用户,可以使用谷歌浏览器,设置成不允许javascript抓取,刷新之后看页面效果,JS部分不能展示及显示出效果
5、页面稳定质量良好。网站页面版块链接合理,内容质量良好,并没有频繁改动页面,并非大量内容来自于采集,且无用户搜索需求。
如果以上都没有问题,分析人为改动因素,分析近三个月有没有人为操作改动,及内页内容是不内大量采集。大量删除页面、修改页面标题,程序及网站模块频繁的变更,以至网站被搜索引擎降权引发很多内页内容不收录。又大量的改调内容,内容中植入大量的广告链接弹窗都会引发新增页面不收录。