谷歌、百度等搜索引擎如何对页面进行排名
By: 全球搜 2021年08月18日

谷歌、百度等搜索引擎如何对页面进行排名

了解搜索引擎如何对网页进行排名——从查询分类到分配上下文,以及确定哪些信号最重要。

          作为 SEO 专业人士,我们通常关注的问题是“我如何对我的页面进行排名?”实际上,我们应该问的一个同样重要的问题是:“搜索引擎如何对页面进行排名?”

为什么搜索引擎对网页进行排名

        在我们深入研究搜索引擎如何对网页进行排名之前,让我们停下来想一想它们为什么要对网页进行排名。毕竟,对他们来说,简单地随机显示页面、按字数、按新鲜度或各种简单分类系统中的任何一种显示页面会更方便也更容易。他们不这样做的原因是显而易见的。如果谷歌、百度等搜索引擎都是这样,那你肯定不会使用它。所以当我们问排名的问题时,我们需要时刻记住的是,我们想要满足的用户不是我们的,他们属于搜索引擎的,搜索引擎是暂借给我们的。如果我们滥用这些用户,他们可能不会再返回使用搜索引擎,因此搜索引擎的用户将会越来越少,他们的广告收入也会下降。

        我喜欢把这个场景想象成我们自己网站上的一些资源页面。如果我们推荐一种工具或服务,那是基于我们对他们的认可,我们相信它们也会为我们的访客服务。如果我们听说它们实际上不太好,那么我们将从我们的网站中删除它们。这就是引擎正在做的事情。

免责声明

        我在 Google 或 Baidu没有安装窃听设备。开个玩笑,我声明这一点是为了明确以下大纲是基于大约 20 年来观察搜索引擎的发展、阅读专利(或更频繁地 对专利的分析),并通过审查进展情况开始了几十年如一日的研究- 行业内从SERP布局变化到收购再到算法更新。

        我所说的很多都是有根据的内容,预估大约 90% 是正确的。如果你想知道为什么我认为 90% – 我从 Bing 的Frédéric Dubut那里了解到,  90%是一个很好的数字,可以在猜测时使用。

这只是一个简单的 5 个步骤——简单

         对页面进行排名的完整过程有五个步骤。我不包括像负载平衡这样的技术挑战,我也不是在谈论每个不同的信号计算。我只是在谈论每个查询需要经历的核心过程,它以信息请求的形式开始它的生命,并以埋在广告海洋下的一组 10 个蓝色链接结束。

        了解这个过程,了解它是为谁设计的,你就会开始正确思考如何向他们的用户排列你的页面。我也觉得有必要注意,这些步骤所用的词是我自己编的,而不是某种官方名称。这只是我随意使用的,但不要指望任何一个搜索引擎使用相同的术语。

第 1 步:分类

        该过程的第一步是对传入的搜索进行分类。搜索的分类为引擎提供了执行以下所有步骤所需的信息。在进行复杂的分类之前(当引擎依赖关键字而不是实体时),引擎基本上必须将相同的信号应用于所有搜索。

         正如我们将在下面进一步探讨的那样,情况不再如此。在第一阶段,引擎会将这样的标签(同样,不是技术术语,而是一种简单的思考方式)应用于查询,例如:

                             1、YMYL
                             2、当地的
                             3、看不见
                             4、成人
                             5、问题

我不知道有多少不同的分类,但搜索引擎需要做的第一步是确定哪些页面适用于对应给定的搜索。

第 2 步:上下文

         排名过程的第二步是分配上下文。在可能的情况下,引擎需要考虑他们拥有的关于输入查询的用户的任何相关信息。我们经常在查询中看到这一点,即使是那些我们不问的问题。我们在这里看到它们:

搜索引擎如何对页面进行排名

我们在这里看到它们:

搜索引擎如何对页面进行排名

         当然,后者是我没有专门输入查询的一个例子。本质上,该过程的第二阶段是引擎确定哪些环境和历史因素起作用。他们知道查询的类别,在这里他们应用、确定或提取与被认为与该查询类别和类型相关的元素相关的数据。列举可能考虑的环境和历史信息的一些示例如下:

                                         1、地点
                                         2、时间
                                         3、查询是否是问题
                                         4、用于查询的设备
                                         5、用于查询的格式
                                         6、查询是否与之前的查询相关
                                         7、他们之前是否见过该查询

第 3 步:权重

        在我们深入探讨之前,让我问你,你对RankBrain 的了解有多反感?好吧,系好安全带,因为我们将再次提起它,但这只是作为第三步的一个例子。在引擎确定哪些页面应该排名之前,谷歌等搜索引擎首先需要确定哪些信号最重要。对于像 [civil war] 这样的查询,我们得到的结果如下:

搜索引擎如何对页面进行排名

结实的结果。但是,如果新鲜度发挥了重要作用,会发生什么?我们最终得到的结果更像是:

搜索引擎如何对页面进行排名

         但我们不能排除新鲜度。如果查询是 [netflix 上的最佳节目],我会不太关心权威,而更关心它最近发布的时间。我几乎不想要一个 2008 年的紧密联系的文章,概述最好的 DVD 以在他们的服务上订购。因此,有了查询类型以及提取的上下文元素,引擎现在可以依靠他们对应用哪些信号以及给定组合的权重的理解。

         其中一些当然可以由雇用的许多才华横溢的工程师和计算机科学家手动完成,其中一部分将由 RankBrain 等系统处理,RankBrain 是(第 100 次)一种机器学习算法,旨在调整以前看不见的查询的信号权重但后来作为一个整体引入到谷歌的算法中。声明大约 90% 的排名算法依赖于机器学习,可以合理地假设 Baidu有类似的系统。

第 4 步:布局

         我们都见过。实际上,您可以在上面的civil war示例中看到它。对于不同的查询,搜索结果页面布局会发生变化。引擎将确定哪些可能的格式适用于查询意图、运行查询的用户以及可用资源。

[civil war] SERP 的完整页面如下所示:

搜索引擎如何对页面进行排名

         我对用于确定每个元素何时出现的核心因素进行了有根据的猜测。事实是,它是一个移动的目标,依赖于实体的知识 、它们如何连接以及它们如何加权。这是一个非常复杂的主题,所以我们不会在这里深入探讨。在这篇文章的上下文中理解的重要一点是,任何给定搜索结果页面的不同元素都需要或多或少地即时确定。

          这就是说,当运行查询并完成前三个步骤时,引擎将引用包含要插入到页面的各种可能元素、可能的位置的数据库,然后确定哪些将应用于特定查询。虽然这对于不频繁的查询是正确的,但对于常见的查询,引擎更有可能保留一个数据库,其中包含他们已经计算出的元素以符合可能的用户意图,以便不必每次都进行处理。

          我想它有一个时间限制,之后它会刷新,我怀疑它会在低使用率时刷新完整条目。但是继续前进,引擎现在知道查询的分类、请求信息的上下文、应用于此类查询的信号权重以及最有可能满足查询的各种可能意图的布局。最后,是时候进行排名了。

第 5 步:排名

      有趣的是,这可能是整个过程中最简单的一步,尽管并不像人们想象的那么单一。当我们想到有机排名时,我们会想到 10 个蓝色链接。所以让我们从那里开始,看看到目前为止的过程:

                         1、用户输入查询。
                         2、引擎会考虑查询的类型并将其分类,以了解基于相似或相同的先前查询交互在高级别应用哪些关键标准。
                         3、引擎会考虑用户在空间和时间中的位置,以考虑他们可能的意图。
                         4、引擎采用查询分类和用户特定的信号,并使用它来确定哪些信号应该具有哪些权重。
                         5、引擎还使用上述数据来确定哪些布局、格式和附加数据可以满足或补充用户的意图。        有了这一切并且已经编写了一个算法,引擎只需要简单地处理数字。他们将拉入可以考虑排名的各种站点,将权重应用于他们的算法,并处理数量以确定站点应出现在搜索结果中的顺序。当然,他们必须以各种方式为页面上的每个元素执行此操作。视频、故事、实体和信息都会发生变化,因此引擎不仅需要对蓝色链接进行排序,还需要对页面上的其他所有内容进行排序。

简而言之

         该网站的排名很容易,把所有的东西放在一起来做这才是真正的工作。您可能会问:我理解了这一点但是如何帮助我进行谷歌SEO 工作。这就像了解计算机工作方式的核心功能一样。我无法制造处理器,但我知道它们的作用,并且我知道哪些特性会导致更快的处理器以及冷却对它们的影响。知道这一点后,我就有了一台更快的机器,我需要更新和升级的频率要少得多。

         Google SEO也是如此。如果您了解谷歌引擎如何运作的核心,您就会了解自己在该生态系统中的位置。这也导致在设计策略时主要是考虑用心和服务真实用户-搜索引擎的用户

在线客服

全球搜在线客服

服务号
播放
全球搜视频