这个 sitemap validator 检查什么
工具先确认 XML 能否作为 sitemap urlset 或 sitemap index 解析,再检查那些最容易造成抓取浪费和报表噪音的 SEO 卫生信号。
- 验证 sitemap 类型和子 sitemap 解析行为。
- 统计重复 URL 和跨域 URL。
- 检查缺失或无效的 lastmod。
- 可选择抽样检查 URL 状态,提前发现明显坏链。
检查 sitemap 格式、重复条目、跨域 URL、lastmod 质量、抽样状态和下一步抓取动作,避免把错误文件当作 SEO 输入。

运行工具后,这里会显示分析结果、导出和下一步动作。
工具先确认 XML 能否作为 sitemap urlset 或 sitemap index 解析,再检查那些最容易造成抓取浪费和报表噪音的 SEO 卫生信号。
在提交新 sitemap、网站迁移、CMS 模板变化,或 Search Console 发现的 URL 与团队预期不一致时,都应该先验证。
通过代表 sitemap 是可用的发现输入;警告代表文件可读,但作为严肃抓取规划信号还不够干净。
最昂贵的误区是把“XML 有效”当作“SEO sitemap 健康”。搜索引擎能解析一个文件,不代表其中 URL 都有价值。
如果验证通过,就把 sitemap 作为干净抓取种子;如果出现警告,先修生成器,或者先隔离有风险的 URL 组再深入审计。
围绕抓取规划、元数据检查和 SEO 交接的快速解答。
不够。有效 sitemap 仍可能包含不可索引、重定向、重复或低价值 URL。验证只是深度抓取前的质量门禁。
当 lastmod 代表真实内容变化时很有用;如果每次部署都刷新所有日期,反而会削弱信号可信度。
它会混合所有权并产生混乱发现信号。生产 sitemap 通常应该列出与该 host 对应的 canonical URL。
迁移、CMS 变化、本地化上线、大量内容导入或 Search Console 数量异常时都应该验证。