paint-brush
谷歌,垃圾文章的兴起以及为什么在网络上查找信息变得更加困难经过@kamildebbagh
1,230 讀數
1,230 讀數

谷歌,垃圾文章的兴起以及为什么在网络上查找信息变得更加困难

经过 Kamil Debbagh2022/06/17
Read on Terminal Reader
Read this story w/o Javascript

太長; 讀書

你在谷歌上搜索一些东西。第一个结果似乎很有希望。你打开它。这是一篇很长、很乱的文章,你在大海捞针中找不到你的针。知道感觉吗? 通过简单的 Google 搜索找到您要查找的信息变得越来越困难。这是为什么?阅读更多内容以了解我们能做些什么。

Companies Mentioned

Mention Thumbnail
Mention Thumbnail

Coin Mentioned

Mention Thumbnail
featured image - 谷歌,垃圾文章的兴起以及为什么在网络上查找信息变得更加困难
Kamil Debbagh HackerNoon profile picture


你在谷歌上搜索一些东西。第一个结果似乎很有希望。你打开它。这是一篇很长很乱的文章,你在大海捞针中找不到你的针。知道感觉吗?


通过简单的 Google 搜索找到您要查找的信息变得越来越困难。这是为什么?阅读更多以了解我们可以做些什么。


TL;博士

[第 1 部分] 正如我们在整篇文章中看到的那样,在 Google 搜索中找到您正在查询的特定问题的答案的难度越来越大。


[第 2 部分] 问题是双重的:

  • 1. 实际问题:用户没有找到他们要找的东西
  • 2. 感知问题:用户被欺骗以为他们已经找到了他们正在寻找的东西,或者可能通过打开源页面找到它。

各种因素都可能导致这些问题,从 Google 搜索的算法不足到内容营销人员使用深色模式来最大化搜索引擎优化。


[Part 3] 关于感知问题,我提出了一些产品修改,可能会减少对用户的欺骗感,例如:


  1. 允许用户扩展精选片段中的片段长度
  2. 在精选片段中显示摘录的标题
  3. 在移动浏览器上直接登陆源页面的右侧通道。

1.什么:通过谷歌很难找到一条信息

1.1 第 1 步:谷歌搜索

上周日,我刚从屠夫那里拿到一盘装满新鲜肉的托盘,但好几个小时都无法到达我的住处。当我最终这样做时,我想知道:“我可以把肉冷冻后再煮吗,还是坏了?”


事不宜迟,我从口袋里拿出手机,我的母语是法语,我在谷歌上搜索了一些关键词,法语相当于:“肉在冰箱外面放了多久”:


翻译法文→英文截图


多亏了 Google 出色的预览结果(又名featured snippets ),我一眼就得到了问题的答案。太棒了,对吧?

嗯,不。因为显示的答案提到“计数 5 到 6 小时”,但它可能用于与我不同的用例,例如从冰箱中取出肉后可以放置多长时间。因此,作为用户,我没有足够的信心完全信任预览结果。


因此,我的问题的featured snippet太短了。它缺乏背景。

这是我搜索过程中的第一次失败。

在此之后,我决定通过打开featured snippet的源页面来进一步搜索。

1.2 第 2 步:打开我的 Google 搜索的第一个结果

这是我登陆网页的方式:


再一次,请不要注意法语→英语的误译


呃。我降落在页面顶部。所以我需要滚动浏览整个内容以找到我的问题的答案。但是,当然,在前几行中找不到答案,而是通过冗长的介绍来欢迎我。


因此,我通过扫描文本来确定作为featured snippet来源的段落。我的眼睛处于“5到6小时”字符串的扫描模式。第一次扫描后,我找不到正确的段落。


您总是可以反驳说,一旦用户登陆页面,他们可以简单地使用“在此页面上搜索”功能(等效于 ctrl+f)。然而:


  • 在我看来,在 Safari iOS 上这样做太麻烦了。
  • 此功能已变得越来越有效。由于某些网页被配置为在您滚动时逐步加载其内容,因此如果您在刚刚登陆该页面时执行“在此页面上搜索”,则可能会返回 0 个结果,尽管内容实际上是在这页纸。


就我而言,我坚持了下来,在进行了第二次眼睛扫描后,这次以较慢的方式…… Bingo:我找到了这段话。


但此时出现了两个问题。


  1. 首先,这些信息被埋得很深,大约在文章的 3/4 处。我浪费了很多时间试图在文章中找到正确的段落。


  2. 其次,虽然我确实找到了正确的段落,但我意识到这段话是在谈论解冻肉需要多长时间,而不是新鲜肉可以放置多长时间。


换句话说,如果我盲目地相信谷歌的featured snippet ,我会使用一个我没有问的问题的答案。这就是我们所说的欺骗。

这是我搜索过程中的第二次失败。

所以我决定回到谷歌,试试其他搜索结果的运气。

1.3 第 3 步:尝试 Google 搜索的其他结果

回到第一方,谷歌搜索的结果页面:


我试图打开“人们也问”部分,但它并没有真正提供相关的答案。

下一个结果来自一个论坛,在我看来不是一个可靠的来源,所以我完全跳过了它。

第三个结果的标题提到了“食物保存时间”,预览包含“熏肉”,而且它来自著名的法国杂志《费加罗报》,所以我认为这对我来说是一个可靠且相关的选择。

事实上,我在这个页面上找到了一张表格,上面有每种新鲜食物的储存时间数据,放在橱柜里、冰箱里或冰柜里。然而,当我翻阅表格时……

…好吧,与我的用例相关的行的橱柜列是空的。

这是我搜索过程中的第三次也是最后一次失败。


这就是本文的故事讲述部分,现在让我们看看我们可以从我所经历的实验中学到什么和归纳出什么。

2.为什么:为什么我没有找到正确的答案,为什么我一再被骗?

我认为我所经历的确实有两个问题:


  1. 实用一:我没有找到我要找的信息。
  2. 感知一:欺骗:我反复以为我终于找到了信息,但每次打开并阅读源页面时都感到失望——这增加了我的挫败感。

2.1 为什么我没有找到我正在寻找的信息?

我相信谷歌搜索在这里有问题。当然,谷歌通常是非常准确的。但这次不是。我敢说,越来越不是。


但它会在中间停下来指责谷歌。强大的谷歌怎么还不够好?

2.1.1 谷歌搜索性能下降的理论

我在这里写的是我最近观察到的一个理论,但我觉得越来越多的网站正试图欺骗 Google 搜索。


通过 Google 搜索被发现是一个如此强大的客户获取渠道,以至于网站诉诸各种黑暗模式以使其成为 Google 搜索的第一个有机结果——或者更好的是——使其成为谷歌featured snippet的选定页面,神圣搜索引擎优化(或简称 SEO)的圣杯。


让我们以我在初始搜索中获得的特色片段为例:

好吧,文章的第一部分“冷链”是纯粹的填充物。您需要进一步向下滚动页面才能开始查找实质内容,即实际信息:


我越来越多地遇到这个问题。以至于当我现在在网络上打开内容营销相关的文章时,我本能地开始滚动以跳过几个部分,因为我现在认为内容更有可能在文章的中间/结尾处找到。


在这一点上,你可能都想知道同样的事情,同样的问题你想问使用这些黑暗模式的内容营销牛仔。请允许我在这里统一引用杰夫·贝索斯的话:亲爱的营销牛仔们,

(据称,杰夫·贝佐斯(Jeff Bezos)在他的一次爆发中会这么说。资料来源:“亚马逊无界,杰夫·贝佐斯和全球帝国的发明”,布拉德·斯通,2021 年,第 15 页)


虽然我不是 SEO 专家,但我只能假设average-time-spent-on-pageaverage-session-duration等指标对于 1/ 向用户展示尽可能多的广告并因此从每次访问,以及 2/ 让您的网页在 Google 搜索结果中获得良好排名。因此,营销人员尽一切努力最大化这些指标。


另一种猖獗的典型黑暗模式是阅读featured snippet的摘录,然后打开源页面,却无法在网页上找到摘录。这是让我发疯的事情,导致我在精选片段和源页面之间来回进行 10 次来回,以确保我不会因为误读片段而愚蠢。


我可以列出更多的黑暗模式,但简而言之,我们最终用户似乎陷入了内容营销牛仔和谷歌之间的永恒战争中,前者不断试图超越后者。


不管谷歌搜索性能下降的原因是什么,现在让我们考虑第二个问题,即感知问题。

2.2 为什么我屡屡受骗?

感知问题可能看起来很小。但是一再被误导以为您在 Google 的预览中得到了您问题的正确答案,当您查看源页面时才发现它不是您特定问题的答案……这是一种被胡说八道的感觉。一种令人作呕的感觉。


为什么我觉得胡说八道?


让我们回到我得到的第一个搜索结果(谷歌所谓的featured snippets ):


现在,如果我们分析featured snippet ,尤其是其文本摘录:

“确实,小块肉需要 5 到 6 小时,大块肉需要 12 到 24 小时。”


我认为这里的问题是这个答案似乎是我问题的答案。但与此同时,摘录太短了,我无法 100% 相信这是对我的具体问题的回答: “数”到底是为了什么?为了在冰箱、架子上保存肉类……?


这就是产生歧义的地方。因此,我最终检查了源页面,并且 - 你瞧 - 答案与我的问题不匹配。这时候背叛的感觉就来了。感觉就像谷歌确实通过遗漏对我撒了谎。


最后,欺骗感的根本原因似乎是谷歌提供的文本摘录的简短性。


我们可以对实际问题或感知问题做些什么吗?

3.如何:我怎么能找到正确的信息,我怎么可能不觉得被欺骗?

关于第一个问题,我不打算给谷歌推荐,因为在技术层面上,我对搜索引擎算法一无所知。


另一方面,我对感知问题有一些想法。

3.1 感知问题的解决方案:我怎么能不感到被欺骗?

以下是我想出的三个解决方案,可以减轻我的欺骗感:

  • 精选片段

      1. 使摘录的长度可扩展

      1. 显示摘录的标题
  • 登陆源页面

      1. 直接登陆与您的查询匹配的正确段落,并显示在 Google 搜索结果的预览中

3.1.1 解决方案#1:特色片段的可扩展长度

为什么:因为我被欺骗认为该页面回答了我的问题是因为摘录太短


什么:一个有用的功能是能够有更长的摘录。


How :因为很难知道通过显示网页最相关行之前之后的文本来扩展摘录是否更有用,所以在“最相关行”之前和之后添加文本是有意义的(又名“针” )。


如何:至于在最相关的行之前和之后应该添加多少文本,我将在我的示例中选择 [最相关的行] ± [2 行],但当然,这个选择需要细化。


方法此外,由于谷歌当前的摘录长度通常足以找到人们正在寻找的答案,我认为最好以可选的方式为用户提供更长版本的摘录,就像谷歌用歌曲做的那样'歌词。


总而言之,这就是对我有用的东西的样子:

这将是第一种方法,其优点是获得关于答案是否是用户问题的正确答案的额外线索,而无需用户离开搜索页面。


此外,由于谷歌正在对歌曲的歌词做类似的事情,所以他们在实施这一改变时应该没有太大问题。

3.1.2 解决方案#2:在精选片段中显示摘录的标题

在摘录上有更多上下文的另一种方法是从源页面中获取嵌入摘录的父标题。


你知道,网页中的文本是这样构造的:

 #Title level 1 #Title level 2 n°1 #Title level 2 n°2 blahblah #Title level 2 n°3


好吧,获取嵌入文本的最里面的标题将提供一个很好的线索来判断摘录是否回答了用户的问题:


在用我自己的研究示例运行测试后,我意识到,当然,我确实获得了更多的上下文,但这只会给摘录增加混乱。因为在这种情况下,摘录实际上是在谈论解冻肉需要多长时间,而在我的功能版本中,摘录似乎是在谈论冷冻肉需要多长时间。


因此,根据我运行的第一个测试,这个功能看起来没有希望。这并不意味着解决方案 n°2 需要完全被拒绝,而是需要一些试验和错误才能将该解决方案推广到各种源页面。


请注意,解决方案 n°2 当然与解决方案 1 不兼容。预览可以包括可扩展长度的摘录 + 最初嵌入摘录的标题。

3.1.3 方案#3:直接登陆源页面右侧通道

最后,如果用户真的决定打开源页面来查看它,那么他们不必在进入扫描模式的情况下浏览整个页面来查找原始摘录的位置,这将是有用的在页面中。


当用户单击搜索结果时,直接登陆源页面中文本的正确段落是 Chrome 桌面上已经存在的功能,但由于某种原因,它在 Safari iOS 上对我不起作用。

这可能意味着存在阻止 Google 在 Safari iOS 上实现此功能的技术障碍。


但无论技术可行性如何,它都可以让用户浪费更少的时间并快速识别页面是否包含他们问题的答案。


正如我之前提到的,我认为 ctrl+f 不再是一个令人满意的解决方法了。因此,“在正确的通道上着陆”功能在 Safari iOS 上将非常受欢迎。

4. 在网络上查找信息的最后考虑

我的文章是在人们对 Google 搜索越来越不满的背景下发表的。


Google 搜索是 90 年代后期的革命性工具。从那以后,它得到了改进,谷歌(及其母公司 Alphabet)已经成为我们都知道的科技巨头。

然而,20 多年后,人们对谷歌的霸权提出了质疑,一波新的、固执己见的搜索产品正在涌现,以提供搜索网络的替代方式,通常是专注于他们所服务的单一垂直领域。


我目前恰好是这样一家公司的产品经理:Doctrine 的使命是使法律信息易于访问和理解。


通过阅读一位名叫 DKB 的人的文章,我开始意识到 Google 搜索的局限性。如果你喜欢我的文章,你应该试试他的: Google Search Is Dying (Feb. 2022)


亲爱的读者,感谢你们陪伴我完成了这次搜索之旅。如果你喜欢这篇文章,你可以在我的 Substack上找到更多。


PS:为了让你们从悬念中解脱出来,几天前我确实做了午餐肉……结果,味道很棒,而且我还活着:)。


特别感谢 Oriane Sarrouy 和 Othman Bensouda 阅读本文的草稿。


也在这里发布。