如何使用 XML 站点地图来提升谷歌SEO优化效果
By: 全球搜 2021年08月09日

如何使用 XML 站点地图来提升谷歌SEO优化效果

这是有关生成和优化 XML 站点地图所需了解的所有内容的指南,包括最佳实践清单。

随着网络的发展,谷歌和搜索引擎优化也在发展。

这意味着被认为是最佳实践的往往是不断变化的。昨天可能是好的建议,今天却不是这样。

对于站点地图来说尤其如此,它几乎与 SEO 本身一样古老。

问题是,当每个男人和他们的狗都在论坛上发布答案、在博客上发布建议并在社交媒体上发表意见时,从错误信息中筛选出有价值的建议需要时间。

因此,虽然我们大多数人都普遍认为向 Google Search Console 提交站点地图很重要,但您可能不知道如何以推动 SEO 关键性能指标 (KPI) 的方式实施它们的复杂性。

今天,让我们消除对站点地图最佳实践的困惑。

在本文中,我们将介绍:

  • 什么是 XML 站点地图
  • XML 站点地图格式
  • 站点地图的类型
  • XML站点地图索引优化
  • XML 站点地图最佳实践清单

什么是 XML 站点地图

简单来说,XML 站点地图是您网站 URL 的列表。

它充当路线图,告诉搜索引擎哪些内容可用以及如何访问它。

站点地图与网站抓取

在上面的示例中,搜索引擎将通过对 XML 站点地图文件的一次访问找到站点地图中的所有九个页面。

在网站上,它必须跳过五个内部链接才能找到第 9 页。

XML 站点地图帮助爬虫更快地建立索引的能力对于以下网站尤为重要:

  • 拥有数千个页面和/或深度的网站架构。
  • 经常添加新页面。
  • 经常更改现有页面的内容。
  • 受到内部链接薄弱和孤立页面的影响。
  • 缺乏强大的外部链接配置文件。

旁注:提交带有 noindex URL 的站点地图也可以加速去索引。如果您有许多网址需要取消索引,这比在 Google Search Console 中删除网址更有效。但请谨慎使用,并确保仅将此类 URL 临时添加到站点地图中。

关键要点

尽管从技术上讲,搜索引擎可以在没有它的情况下找到您的 URL,但通过在 XML 站点地图中包含页面,您表明您认为它们是高质量的目标网页。

虽然不能保证 XML 站点地图会让您的页面被抓取,更不用说索引或排名,但提交一个肯定会增加您的机会。

XML 站点地图格式

使用所有可用标签的单页站点将具有以下 XML 站点地图:

xml站点地图格式和标签

但是 谷歌SEO 应该如何使用这些标签呢?所有元数据都有价值吗?

Loc(又名位置)标签

此强制标记包含 URL 位置的绝对规范版本。

它应准确反映您的站点协议(http 或 https),以及您是否选择包含或排除 www。

对于国际网站,这也是您可以实施 hreflang 处理的地方

通过使用 xhtml:link 属性来指示每个 URL 的语言和区域变体,您可以减少页面加载时间,这是 <head> 或 HTTP 标头中的链接元素的其他实现无法提供的。

Yoast在 hreflang 上有一篇史诗般的帖子,供想要了解更多信息的人使用。

Lastmod(又名上次修改)标签

一个可选但强烈推荐的标签,用于传达文件的上次修改日期和时间。

John Mueller 承认 Google 确实使用 lastmod 元数据来了解页面上次更改的时间以及是否应该对其进行抓取。 2015 年Illyes 的建议相反

最后修改时间对于内容网站尤其重要,因为它有助于 Google 了解您是原始发布者。

传达新鲜度也很强大,但请确保仅在您进行了有意义的更改时才更新修改日期。

试图欺骗搜索引擎您的内容是新鲜的,如果不是,则可能会导致 Google 处罚。

Changefreq(又名更改频率)标签

曾几何时,这个可选标签暗示了 URL 上的内容预计更改为搜索引擎的频率。

但 穆勒曾表示 “更改频率对站点地图并没有真正发挥多大作用”,并且“直接指定时间戳要好得多”。

优先标签

这个可选标签表面上告诉搜索引擎一个页面相对于你的其他 URL 的重要性,范围在 0.0 到 1.0 之间。

充其量,它只是对搜索引擎的一个提示,穆勒和 伊利斯都明确表示他们忽略了它。

关键要点

您的网站需要 XML 站点地图,但不一定需要优先级和更改频率元数据。

准确使用 lastmod 标签,并将注意力集中在确保提交正确的 URL 上。

站点地图的类型

有许多不同类型的站点地图。让我们看看你真正需要的那些。

XML 站点地图索引

XML 站点地图有几个限制:

  • 最多 50,000 个 URL。
  • 未压缩文件大小限制为 50MB。

可以使用 gzip 压缩站点地图(文件名将类似于 sitemap.xml.gz)以节省服务器的带宽。但是一旦解压缩,站点地图仍然不能超过任何一个限制。

无论何时超过任一限制,您都需要将 URL 拆分到多个 XML 站点地图中。

然后可以将这些站点地图组合成一个 XML 站点地图索引文件,通常命名为 sitemap-index.xml。本质上,站点地图的站点地图。

对于想要采用更精细方法的超大网站,您还可以创建多个站点地图索引文件。例如:

  • 站点地图-index-articles.xml
  • 站点地图索引products.xml
  • 站点地图索引categories.xml

但请注意,您不能嵌套站点地图索引文件。

为了让搜索引擎一次轻松找到您的每个站点地图文件,您需要:

  • 将您的站点地图索引提交到 Google Search Console 和 Bing 网站管理员工具。
  • 在 robots.txt 文件中指定站点地图索引 URL。当您欢迎搜索引擎抓取时,将它们直接指向您的站点地图。

robots.txt 中的 xml 站点地图

您还可以通过将站点地图 ping 到 Google 来提交站点地图。

但要注意:

Google 不再关注“未经验证的站点地图”中的 hreflang 条目,Tom Anthony认为是指通过 ping URL 提交的条目

XML 图像站点地图

图像站点地图旨在改进图像内容的索引。

然而,在现代 SEO 中,图像嵌入在页面内容中,因此将与页面 URL 一起被抓取。

此外,最佳实践是利用 JSON-LD schema.org/ImageObject标记向搜索引擎调用图像属性,因为它提供的属性比图像 XML 站点地图更多。

因此,大多数网站都不需要 XML 图像站点地图。包含图像站点地图只会浪费抓取预算。

例外情况是图像有助于推动您的业务,例如库存照片网站或电子商务网站从 Google 图像搜索中获得产品页面会话。

要知道,要在站点地图中提交,图像不必与您的网站位于同一域中。只要 CDN 在 Search Console 中得到验证,您就可以使用它。

XML 视频站点地图

与图片类似,如果视频对您的业务至关重要,请提交 XML 视频站点地图。如果没有,则不需要视频站点地图。

为视频嵌入的页面保存抓取预算,确保使用 JSON-LD 将所有视频标记为schema.org/VideoObject

Google 新闻站点地图

只有在 Google 新闻中注册的网站才能使用此站点地图。

如果是,请包含最近两天发布的文章,每个站点地图最多包含 1,000 个 URL,并在文章发布后立即更新。

与一些在线建议相反,Google 新闻站点地图不支持图片 URL。

Google 建议使用 schema.org 图片或 og:image 为 Google 新闻指定文章缩略图。

移动站点地图

对于大多数网站来说,这不是必需的。

为什么?因为穆勒确认移动站点地图仅适用于功能手机页面。不是为了智能手机兼容性。

因此,除非您有专门为特色手机设计的唯一网址,否则移动站点地图将毫无用处。

HTML 站点地图

XML 站点地图满足搜索引擎的需求。HTML 站点地图旨在帮助人类用户查找内容。

问题变成了,如果您有良好的用户体验和精心制作的内部链接,您是否需要 HTML 站点地图?

在 Google Analytics 中检查 HTML 站点地图的页面浏览量。机会是,它非常低。如果没有,则表明您需要改进网站导航。

HTML 站点地图通常链接在网站页脚中。从您网站的每个页面中获取链接权益。

问你自己。这是对链接资产的最佳利用吗?或者您是否包含 HTML 站点地图作为对旧网站最佳实践的认可?

如果很少有人使用它。搜索引擎不需要它,因为您拥有强大的内部链接和 XML 站点地图。那个 HTML 站点地图有存在的理由吗?我会争辩说不。

动态 XML 站点地图

使用 Screaming Frog 等工具可以轻松创建静态站点地图。

问题是,一旦您创建或删除页面,您的站点地图就会过时。如果您修改页面的内容,站点地图将不会自动更新 lastmod 标签。

因此,除非您喜欢为每次更改手动创建和上传站点地图,否则最好避免使用静态站点地图。

另一方面,动态 XML 站点地图由您的服务器自动更新,以反映发生的相关网站更改。

创建动态 XML 站点地图:

  • 请您的开发人员编写自定义脚本,确保提供明确的规范
  • 使用动态站点地图生成器工具
  • 为您的 CMS 安装插件,例如 WordPress 的 Yoast SEO 插件

关键要点

动态 XML 站点地图和站点地图索引是现代最佳实践。移动和 HTML 站点地图不是。

仅当这些内容类型的改进索引可推动您的 KPI 时,才使用图像、视频和 Google 新闻站点地图。

XML站点地图索引优化

现在是有趣的部分。您如何使用 XML 站点地图来驱动 SEO KPI。

仅在 XML 站点地图中包含 SEO 相关页面

XML 站点地图是您建议抓取的页面列表,不一定是您网站的每个页面。

搜索蜘蛛到达您的网站时,会“允许”抓取多少页面。

XML 站点地图表明您认为包含的 URL 比未阻止但不在站点地图中的 URL 更重要。

你用它来告诉搜索引擎“如果你特别关注这些 URL,我真的很感激。”

从本质上讲,它可以帮助您有效地使用抓取预算。

通过仅包含 SEO 相关页面,您可以帮助搜索引擎更智能地抓取您的网站,以便从更好的索引编制中获益。

您应该排除:

  • 非规范页面。
  • 重复的页面。
  • 分页页面。
  • 基于参数或会话 ID 的 URL。
  • 站点搜索结果页。
  • 回复评论 URL。
  • 通过电子邮件 URL 共享。
  • 通过过滤创建的 SEO 不需要的 URL。
  • 存档页面。
  • 任何重定向 (3xx)、丢失页面 (4xx) 或服务器错误页面 (5xx)。
  • 被 robots.txt 阻止的页面。
  • 没有索引的页面。
  • 可通过潜在客户表单(例如,白皮书 PDF)访问的资源页面。
  • 对用户有用但不打算作为登录页面的实用程序页面(登录页面、联系我们、隐私政策、帐户页面等)。

我想分享Michael Cottam 的一个关于页面优先级排序的例子

假设您的网站有 1,000 页。这 1,000 页中有 475 页是 SEO 相关内容。您在 XML 站点地图中突出显示了这 475 个页面,实质上是要求 Google 将索引其余部分的优先级降低。

现在,假设 Google 抓取了这 475 个页面,并通过算法确定 175 个为“A”级,200 个为“B+”,100 个为“B”或“B-”。这是一个很高的平均成绩,并且可能表明将用户发送到的优质网站。

对比通过 XML 站点地图提交所有 1,000 个页面。现在,Google 会查看您所说的 1,000 个与 SEO 相关的页面,并且发现超过 50% 是“D”或“F”页面。您的平均成绩看起来不再那么好,这可能会损害您的自然会话。

但请记住,Google 只会将您的 XML 站点地图用作您站点上重要内容的线索。

仅仅因为它不在您的 XML 站点地图中并不一定意味着 Google 不会索引这些页面。

在 SEO 方面,整体网站质量是一个关键因素。

要评估您网站的质量,请参阅 Google Search Console (GSC) 中与站点地图相关的报告。

关键外卖

通过将 XML 站点地图 URL 限制为 SEO 相关页面来管理抓取预算,并投入时间减少网站上低质量页面的数量。

充分利用站点地图报告

gsc-sitemap-report-new-old

新 Google Search Console 中的站点地图部分没有以前提供的数据丰富。

它现在的主要用途是确认您的站点地图索引已成功提交。

站点地图命名

如果您选择使用描述性命名约定,而不是数字,您还可以了解已“发现”的不同类型 SEO 页面的数量——也就是谷歌通过站点地图以及其他方法找到的所有 URL如以下链接。

在新的 GSC 中,对于 SEO 来说,在站点地图方面更有价值的领域是索引覆盖率报告。

如何使用 XML 站点地图来提升 SEO

该报告将默认为“所有已知页面”。在这里你可以:

  • 解决任何“错误”或“有效但有警告”的问题。这些通常源于相互矛盾的机器人指令解决后,请务必通过覆盖率报告验证您的修复。
  • 查看指数化趋势。大多数网站都在不断添加有价值的内容,因此“有效”页面(也就是被 Google 索引的页面)应该会稳步增加。了解任何戏剧性变化的原因。
  • 选择“有效”并查看“已索引,未在站点地图中提交”类型的详细信息。这些是您和 Google 对其价值存在分歧的页面。例如,您可能尚未提交隐私政策 URL,但 Google 已将该页面编入索引。在这种情况下,无需采取任何措施。您需要注意的是索引 URL 源于糟糕的分页处理糟糕的参数处理、重复的内容或页面意外地被排除在站点地图之外。

然后,通过将下拉列表更改为“所有提交的页面”,将报告限制为您已包含在站点地图中的 SEO 相关 URL。然后检查所有“排除”页面的详细信息。

排除站点地图 URL 的原因可以分为四个操作组:

  1. 快速取胜:对于重复的内容、规范、机器人指令、40X HTTP 状态代码、重定向或合法性排除,采取适当的修复。
  2. 调查页面:对于“提交的 URL 丢失”和“抓取异常”排除项,请使用 Google 抓取工具进一步调查。
  3. 改进页面:对于“已抓取 – 当前未编入索引”页面,查看页面(或页面类型,因为通常会有许多类似类型的 URL)内容和内部链接。很有可能,它的内容很单薄,内容非原创,或者是孤立的。
  4. 改进域:对于“已发现 – 当前未编入索引”页面,谷歌指出了排除的典型原因,因为他们“试图抓取 URL,但网站过载”。不要被愚弄。由于内部链接不良或从域中看到的内容质量低下,Google 更有可能认为“不值得付出努力”进行爬网。如果您看到大量此类排除项,请查看您通过站点地图提交的页面(或页面类型)的 SEO 值,重点优化爬网预算并从链接和内容查看您的信息架构,包括参数看法。

无论您的行动计划如何,请务必记下基准 KPI。

评估站点地图优化工作影响的最有用的指标是“所有提交的页面”索引率——通过从发现的 URL 总数中取出有效页面的百分比来计算。

努力将其提高到 80% 以上。为什么不是100%?因为如果您将所有精力都集中在确保您当前拥有的每个与 SEO 相关的 URL 都被编入索引上,您可能会错过扩大内容覆盖范围的机会。

注意:如果您是一个较大的网站,并且选择将其站点分解为多个站点地图索引,您将能够按这些索引进行过滤。这不仅可以让您:

  1. 查看更细粒度的概览图表。
  2. 在调查排除类型时,请参阅更多相关示例。
  3. 逐节解决索引率优化问题。

关键要点

除了识别警告和错误之外,您还可以使用索引覆盖率报告作为 XML 站点地图侦查工具来隔离索引问题。

XML 站点地图最佳实践清单

一定要花时间:

✓ 在 XML 站点地图中包含 hreflang 标签

✓ 包括 <loc> 和 <lastmod> 标签

✓ 使用 gzip 压缩站点地图文件

✓ 使用站点地图索引文件

✓ 仅当索引驱动您的 KPI 时才使用图像、视频和 Google 新闻站点地图

✓ 动态生成 XML 站点地图

✓ 确保 URL 仅包含在单个站点地图中

✓ 在 robots.txt 中引用站点地图索引 URL

✓ 向 Google Search Console 和 Bing 网站管理员工具提交站点地图索引

✓ 在 XML 站点地图中仅包含 SEO 相关页面

✓ 修复所有错误和警告

✓ 分析有效页面的趋势和类型

✓ 计算提交的页面索引率

✓ 解决提交页面被排除的原因

现在,去检查你自己的站点地图并确保你做对了。如果有相关问题,欢迎咨询我们深圳全球搜—方伟15387728807,专业做谷歌seo优化、独立站推广服务。

在线客服

全球搜在线客服

服务号
播放
全球搜视频