
B站视频教学(视频开头有省流,比看文章方便,但更详细的还在文章):
声明:
本文章主要适用于通过XML-Sitemaps生成的sitemap站点地图在Google Search Console状态-无法抓取相关问题
(部分图片来源于公开文章/博客,比如上图来源于Google Search Console帮助)
你遇到的是上图的情况,那么首先
确诊问题,对号入座
请确认你遇到的问题是否为上图的情况/你已进行了基础问题排查
主要症状为:
1.已完成网站搜索引擎收录(完成验证至最后一步添加sitemap站点地图)
2.网站地址正确
3.sitemap网址正确且能正常访问( https://你的网站网址/sitemap 如下图)
问题分析
如果你确定为该问题,那么:
为什么会导致 状态-无法抓取 呢?
原因真的很简单!
那就是!!!网址错误!!!
你要知道,即使你的地址完全正确!sitemap网址正确且能正常访问!但是!Google可能不认!
例如:本博客使用GitHub制作,我得到的初始网址为:torae233.github.io
/我使用了Cloudflare进行CDN加速(你们可能使用Cloudflare制作博客)得到的网址为:torae233-github-io.pages.dev
你可以使用这种格式的域名在Google Search Console添加网站,看似一切正常,但请注意:
该格式所提交的sitemap站点地图(例如:https://torae233.github.io/sitemap.xml)无法正常抓取!
Cloudflare的.pages.dev格式同理!
解决方法
解决方法十分简单,那就是使用购买注册的域名(例如我的 torae.top)
你想使用Google Search Console必须要用购买的域名,所以这题不花钱就无解(悲
请添加网域,使用你购买的域名,重新走一遍你先前添加网站的流程
(教程就不赘述了,网上一搜一大把)
最后再次添加正确的sitemap即可(例如:https://torae.top/sitemap.xml)
此时你就发现可以正常抓取了(状态-正常)
若上文并没有帮你解决问题,最后附上几个我在上网查找解决该问题时看到的一些其它解决方法:
1.在你的网站域名之后放置两个正斜杠 /,并在 .xml 之后放置另一个正斜杠,比如我的网站地图就是:https://torae.top//sitemap.xml/(你会发现你的地图可以抓取了)
2.还有不行的可以试着提交 www 和不带 www 的两种域名的谷歌站点地图
3.一些 wordpress 用插件生成的网站地图,是站点地图索引的,您可以使用站点地图索引文件同时提交多个谷歌站点地图,也可以提交成功。
我推测上述方法成功的主要原因是反复提交,因为Google的原因,有时候提交就是会失败,重新提交几遍估计就好了(多加/之类的,加了和没加一样)

