744 讀數

探索生成人工智能对新闻未来的影响

经过 Viggy Balagopalakrishnan12 分钟 read2023/07/30

太長; 讀書

Gen AI 可以提高新闻的经济性，但对低复杂性（SEO 黑客）内容与高复杂性内容的影响将截然不同

上周，《纽约时报》报道称，谷歌正在测试一款人工智能工具，该工具使新闻机构能够使用人工智能创建内容。目前尚不清楚该产品的具体功能是什么，但根据谷歌的一条评论，它有助于完成标题和修改写作风格等任务。由于担心这可能会对记者的工作产生影响，谷歌很快发表了一份澄清声明：

我们的目标是让记者选择使用这些新兴技术来提高他们的工作和生产力。很简单，这些工具无意，也不能取代记者在报道、创作和事实核查文章中的重要作用。

这引发了关于生成人工智能新闻未来的激烈讨论。制造人工智能产品的公司认为，这项技术将使媒体组织和记者变得更加高效，而批评者则认为，它可能会损害记者的工作，增加错误信息，并让低质量的人工智能生成的内容充斥市场。

在这篇文章中，我们通过探索以下几件事来揭示生成人工智能对新闻未来的影响：

当今新闻文章的类型（按复杂程度划分）
新闻业
撰写新闻文章的剖析
生成式人工智能能做什么、不能做什么
生成式人工智能和新闻的未来——两个世界的故事

当今新闻文章的类型（按复杂程度划分）

互联网上有多种类型的新闻内容，每种类型的制作复杂程度各不相同。复杂性通常源于及时性、所需研究量和所讲述的故事等因素。

低复杂度文章包括：

事实/数据新闻（例如，列出旧金山抵押贷款利率的文章、包含公司财报电话会议数据的文章）——这些新闻相对简单，主观意见或观点最少。
基于兴趣的/信息性新闻（例如，《纽约时报烹饪》上发表的夏季食谱，一篇解释美联储利率含义的文章）——在选择主题方面有一些创造力，但重点是更多信息性和迎合特定兴趣。
突发新闻（例如，一篇关于首席执行官辞职的文章、一篇描述活跃天气事件的文章）——这些通常是关于快速展开的事件的短文，初始信息和新出现的事实有限。

高复杂性的文章包括：

新闻报道（包含背景、研究和事实）——这些内容对新闻进行更详细的解释，并有研究、额外的背景，并且经常采访人们，因此需要更多的时间和精力来制作；它们也经过广泛的事实核查。
解释性新闻——这包括对当前问题提供解释/观点/意见的观点文章、专栏文章和分析（如本文）；它们通常是主观的，需要广泛的研究来支持观点。
专题报道——这些通常是对目前可能不是真正的热门新闻但重要问题的主题的深入探讨，调查性新闻就属于这一类；这些需要跨越数月的广泛研究和采访，以及创造性的故事讲述。

我之所以提出这种分类，是因为这两类文章的背后目的和制作过程非常不同，因此随着生成式人工智能的使用，它们的发展也会有所不同。考虑到这一点，我们来谈谈新闻如何赚钱。

新闻业

新闻业务很棘手——大多数新闻机构都采用广告支持的媒体模式运营，一小部分已经成功转向订阅。这对新闻机构制作的内容类型具有重大影响。

基于订阅的新闻企业（尤其是《纽约时报》现在约 70% 的收入来自订阅）拥有与消费者价值直接相关的内容策略——专注于高质量内容 + 多样化的基于兴趣的内容，使订阅变得有价值。例如，在上述内容类型中，《纽约时报》主要为其核心新闻提供新闻报道（经过充分研究）、解释性新闻和专题报道，并以《纽约时报烹饪》和《Wirecutter》等基于兴趣的内容为后盾。《华尔街日报》和《华盛顿邮报》等其他一些出版物也采用类似的方法在订阅方面取得了长足的进步。

然而，大多数出版物仍然有广告支持，并且在可预见的未来仍将如此。这意味着他们专注于产生高参与度：更多眼球→更多广告库存→更多收入。对他们来说更有效的策略是用大量高容量、低复杂性的内容（如事实/数据新闻、基于兴趣的/信息新闻）来增强高复杂性内容（如新闻报道、解释性新闻）。

这种策略之所以有效，是因为高复杂性内容有助于为消费者提供长期价值，而大量低复杂性内容有助于吸引眼球并赢得 SEO 游戏。 SEO循环看起来像：获得点击的大量内容→搜索引擎认为您的内容有价值→您的所有内容排名更高→更多的眼球。

这并不是对策略的批评，对于广告支持的媒体来说，玩 SEO 游戏是必要的。现实情况是，新闻媒体是一个可怕的行业——互联网扰乱了内容的创建和分发方式（今天主要通过谷歌搜索/元），而新闻机构尚未从这种破坏的影响中恢复过来。人们试图解决这种不平衡，但这种不平衡仍在不断发展——加拿大/澳大利亚通过了法律，迫使谷歌/Meta支付本质上是“干扰者税”以支持良好的新闻业，像NPR这样的一些组织部分得到联邦资金的支持，还有一些像《华盛顿邮报》这样的报纸是由（通常是善意的）亿万富翁资助的。

综上所述，新闻媒体/新闻对于一个运转良好的民主国家来说是绝对重要的公共事业，但并不是一个伟大的行业。因此，这些新闻企业越自力更生（不必依赖监管或亿万富翁），它们就越能有效地实现其使命。生成式人工智能无法解决所有这些结构性挑战（尤其是内容分发），但它绝对可以使内容创建更加高效，而不必牺牲质量。

撰写新闻文章的剖析

要了解生成人工智能对新闻制作的哪一部分影响最大，了解发表新闻文章所涉及的不同步骤会很有帮助。

我们可以将工作分解为几个连续的部分：

研究——寻找主题、收集事实/数据、与合适的人交谈以获得引用或观点
讲故事——理解研究并提出引人入胜的故事情节
写作——将故事情节转化为撰写文章的实际文字，确定故事情节，用正确的数据支持它/添加支持链接
编辑——改进写作，提出更吸引人的标题，拥有更好的视觉效果，并进行事实检查以满足标准
分发——跨社交媒体等渠道发布和分发。

根据一些研究以及我的写作经验的影响，我估计撰写一篇文章的工作量如下：研究（30%）、讲故事（20%）、写作（20%）、编辑（20%）和分发（10%） 。对实际数字持保留态度，但它们的方向是准确的。

现在，请注意，并非所有格式的新闻文章都需要所有步骤- 低复杂性的文章可能不需要严格执行上述生命周期中的所有步骤，但高复杂性的文章则需要。

举个例子，这篇文章花了我大约 8-9 个小时才完成（我的 Substack 时事通讯上的大多数其他文章也是如此），我想我的文章属于解释性新闻。如果我写一篇低复杂度的文章，我可能会在大约 2 小时内完成。另一个数据点—— 这位《纽约时报》记者表示，他通常可以在几个小时内完成一篇新闻文章，而一篇专题文章可能需要长达 6 个月的时间。

那么，生成式人工智能到底能帮上什么忙呢？它基本上归结为新闻制作过程中的哪些步骤可以使当前（和未来）的产品表现良好。

生成式人工智能能做什么、不能做什么

这是我对每一步的看法。剧透——它们在写作和编辑方面有些有效，如果构建了正确的产品，它们可以有效地进行研究，但它们将继续不擅长讲故事。

研究——能力低得惊人

目前大多数生成式人工智能产品（如 ChatGPT 和 Google Bard）在研究方面的能力都低得惊人：

他们肯定有某些擅长的能力。例如，他们善于为特定观点提供论据或为新话题提供灵感。
他们在总结内容方面处于平均水平，尤其是在阅读文章的基础上回答问题。例如，您可以要求他们阅读本文并列出新闻制作中涉及的不同步骤。
然而，他们经常产生事实上不正确的信息（“幻觉”），不提供他们声称的真相的链接/来源，并且提供来源可疑且可能侵犯版权的数据。请参阅下面的屏幕截图。

（左ChatGPT）擅长提出论点，而（右Bard）不擅长提供经过事实核查的信息或来源；来源：作者创建

对于一般用例（假设您想起草一封电子邮件给未来的 LinkedIn 连接），这些问题并不重要。但是，当您撰写新闻文章时，不进行事实核查可能会严重损害您的品牌认知度。

尽管研究工具可用于有方向性的有用研究（例如，您想知道 Bing 和 Yahoo 搜索拥有多少市场份额），但作家/记者仍然需要做额外的工作来找到新的链接来源，因为当前的工具既不提供链接也没有完全准确的数据。

使用来源干净的数据+能够通过可靠的链接提供答案对于任何为作家构建研究产品的人来说都是一个巨大的机会，而且很可能这里会出现新公司。

讲故事——能力低

如今，生成式人工智能的讲故事能力相当薄弱。这里有一个例子：我为这篇文章做了很多研究，以有组织的格式将这些研究放在一起，并要求 ChatGPT 给我一个故事情节。请参阅下面的屏幕截图了解结果。

乍一看，它们似乎“有道理”。但这就是它的全部内容——从表面上看是有意义的。事实上，这些故事情节都不是非常引人注目，而且我提供的研究笔记比这里提供的表面结果有更多的细节和细微差别。你可以说这些仍然不错，但在写一篇文章的背景下，这对我来说完全没用——充其量，这是灵感/想法，而不是基于我提交的研究的故事情节。

（左）输入 ChatGPT 的研究笔记，（右）生成的故事情节；来源：作者创建

如果您有一个低复杂度的故事，它会为您完成工作。如果您正在构建一个细致入微的故事，或者拥有数据并需要构建故事的帮助，那么当前的产品无法完成这项工作。鉴于涉及大量主观性，我并不看好它会变得更好，而且这将继续成为作家可以增加最大价值的部分。

写作——中等能力

如果你为当前的产品提供你想说的详细故事情节，它可以生成勉强像样的 v1 内容。输出仍然非常千篇一律，指导当前模型以讲述故事的方式构建语言非常具有挑战性。在我为 ChatGPT 提供有关本文故事情节的详细注释后，请参阅屏幕截图以获取示例输出。

乍一看，您可能认为 v1 草案看起来还不错。事实并非如此——语气不对，故事不流畅，而且看起来总是像是机器人写的。尽管提供了非常具体的叙述，但它非常通用，并且没有阐明故事。如果我发表那篇文章，你就不会读它。这就是当今写作能力面临的挑战——它可以适用于低复杂度的文章，但对于更复杂的文章，你基本上必须重写整个草稿。

（左）输入 ChatGPT 的详细故事情节，（右）文章的 v1 草稿；来源：作者创建

这里解锁的重要产品将是实现有效的人类指导——作者不想采用糟糕的千篇一律的版本并逐行重做整个事情。他们想要的是某种形式的用户交互结构，让作者输入故事情节并按顺序逐节撰写文章，同时向人工智能工具提供主动反馈。顶部的樱桃将能够通过提供同一作者过去撰写的文章来定制写作风格。

我认为今天的底层模型确实有能力做到这一点，并且UI 层需要创新，我相信这将在近期发生。

编辑——中等能力

如今的工具具有很强的能力来审查文章、发现错误并进行更正。这些工具也非常擅长装饰任务，例如提出可能表现良好的吸引人的标题或章节标题的想法。

然而，UI 层仍然需要做一些工作才能使其可用于编辑 - 如今有一些部分解决方案，例如Notion AI ，它可以让您在 Notion 页面中改进语言并缩短/更长句子，但它无法捕获页面的完整上下文。 ChatGPT 在对整篇文章进行编辑方面做得很好，但缺乏按照说明轻松编辑特定部分的能力，也无法支持链接（即，我给它一个带有超链接的文本简介，我得到没有任何链接的文本）。

我绝对讨厌写作过程中的编辑部分，而且我相信一些作家和记者也是如此——生成式人工智能绝对可以在近期最大程度地减少一些编辑繁琐的工作。

分布 — 中等能力

今天出现的一些工具可以帮助您生成社交片段，或识别故事中可能更受欢迎的部分。未来这可能会继续变得更好。

生成式人工智能和新闻的未来——两个世界的故事

根据以上分析，你可以看到明显的二元性：

低复杂度的格式需要更简单的研究和讲故事，并且可以轻松编写和编辑，将开始越来越多地由人工智能生成（或在很大程度上由人工智能辅助）。
高复杂性的格式需要更复杂的研究和讲故事的能力，而这些能力目前还不存在，将继续主要由记者创建，但生成式人工智能可以通过最大限度地减少写作和编辑繁琐的工作来带来很高的效率。

虽然人工智能生成的低复杂性内容乍一看似乎很糟糕，但这些文章主要是为了搜索引擎优化目的或增强现有的高质量内容而编写的，而且商品化的竞赛早在生成人工智能浪潮之前就已经开始了。例如，美联社自 2014 年以来一直在使用机器人发布报道公司收益的文章。这样做的好处是，这不是记者想要花时间创建和自动化的内容，这将让他们腾出时间来处理高复杂性的内容。

越来越多的高复杂性内容将会出现。当今产品的研究和讲故事能力有限，这意味着以独特的方式基于信息和讲故事构建引人入胜的故事的能力将继续成为记者所拥有的最大能力。人工智能写作和编辑工具可以加速这一过程，使发布高质量内容的繁重工作不再需要，这对记者来说将是一个巨大的福音。

关于使用人工智能进行新闻报道的一些担忧又如何呢？有些是公平的，但我相信它们大多是可以解决的：

一波垃圾搜索引擎优化内容——谷歌采取了不会惩罚人工智能生成内容的立场，并因打开垃圾内容世界（包括事实不正确的文章）而受到批评。这是一个有点公平的批评，但我相信谷歌会严厉打击这一点——不是出于他们内心的善良，而是因为搜索产品的关键是为用户提供有用的结果。谷歌已经对 SEO 黑客行为（如关键词堆砌和链接耕作）进行了处罚，并且很容易将该框架扩展到人工智能内容。
记者将失去工作——一些人担心记者可能会失去工作，或者处于不利的地位（比如目前正在罢工的好莱坞作家）；这里最大的区别在于，虽然好莱坞有大量作家，但自 2008 年以来，美国新闻编辑室的就业人数下降了 26% ，这并不是因为我们不需要记者，而是因为新闻是一个糟糕的行业；生成式人工智能可以帮助解决企业的经济问题，同时继续帮助记者做他们喜欢的事情。