LOADING

加载过慢请开启缓存 浏览器默认开启

Google Search Console 站点地图sitemap 状态-无法抓取 问题分析+解决方法

图片

B站视频教学(视频开头有省流,比看文章方便,但更详细的还在文章):

声明:
图片
本文章主要适用于通过XML-Sitemaps生成的sitemap站点地图在Google Search Console状态-无法抓取相关问题
(部分图片来源于公开文章/博客,比如上图来源于Google Search Console帮助)

你遇到的是上图的情况,那么首先

确诊问题,对号入座

请确认你遇到的问题是否为上图的情况/你已进行了基础问题排查

主要症状为:

1.已完成网站搜索引擎收录(完成验证至最后一步添加sitemap站点地图)
2.网站地址正确
3.sitemap网址正确且能正常访问( https://你的网站网址/sitemap 如下图)
图片


问题分析

如果你确定为该问题,那么:
为什么会导致 状态-无法抓取 呢?
原因真的很简单!

那就是!!!网址错误!!!

你要知道,即使你的地址完全正确!sitemap网址正确且能正常访问!但是!Google可能不认!
例如:本博客使用GitHub制作,我得到的初始网址为:torae233.github.io
/我使用了Cloudflare进行CDN加速(你们可能使用Cloudflare制作博客)得到的网址为:torae233-github-io.pages.dev

你可以使用这种格式的域名在Google Search Console添加网站,看似一切正常,但请注意:
该格式所提交的sitemap站点地图(例如:https://torae233.github.io/sitemap.xml)无法正常抓取!
Cloudflare的.pages.dev格式同理!

解决方法

解决方法十分简单,那就是使用购买注册的域名(例如我的 torae.top)
你想使用Google Search Console必须要用购买的域名,所以这题不花钱就无解(悲
图片
请添加网域,使用你购买的域名,重新走一遍你先前添加网站的流程
(教程就不赘述了,网上一搜一大把)

最后再次添加正确的sitemap即可(例如:https://torae.top/sitemap.xml)
此时你就发现可以正常抓取了(状态-正常)
图片

若上文并没有帮你解决问题,最后附上几个我在上网查找解决该问题时看到的一些其它解决方法:
1.在你的网站域名之后放置两个正斜杠 /,并在 .xml 之后放置另一个正斜杠,比如我的网站地图就是:https://torae.top//sitemap.xml/(你会发现你的地图可以抓取了)
2.还有不行的可以试着提交 www 和不带 www 的两种域名的谷歌站点地图
3.一些 wordpress 用插件生成的网站地图,是站点地图索引的,您可以使用站点地图索引文件同时提交多个谷歌站点地图,也可以提交成功。

我推测上述方法成功的主要原因是反复提交,因为Google的原因,有时候提交就是会失败,重新提交几遍估计就好了(多加/之类的,加了和没加一样)