paint-brush
GPT-4 作为下一代人工智能大型语言模型推出经过@chinechnduka
4,462 讀數
4,462 讀數

GPT-4 作为下一代人工智能大型语言模型推出

经过 Chinecherem Nduka5m2023/03/15
Read on Terminal Reader

太長; 讀書

OpenAI 发布了 GPT-4,这是一种用于其 ChatGPT 聊天机器人的新语言模型。新模型的内存容量是其前身 GPT 3.5 的 8 倍。 GPT4 可以准确回答 26 种不同语言的多项选择题。
featured image - GPT-4 作为下一代人工智能大型语言模型推出
Chinecherem Nduka HackerNoon profile picture
0-item
1-item


随着 ChatGPT 于 2022 年 11 月的推出,我们看到了一个新的生成式 AI 庞然大物 OpenAI 的出现。ChatGPT 用作其使用的底层模型的面向聊天的界面。聊天机器人的第一个版本依赖于名为 GPT-3.5 的大型语言模型。但在 2023 年 3 月 14 日星期二,也就是 ChatGPT 首次发布 4 个月后,OpenAI 发布了 GPT-4,这是一个比以前版本更强大的模型。该聊天机器人最初设计用于与 GPT-3.5 互动,现在充当与 GPT-4 互动的媒介。


GPT-4 能做什么?

GPT-3.5 可以做同样的事情,但更多。该公司在一篇博文中表示,


“GPT-4 比 GPT-3.5 更可靠、更有创意,并且能够处理更细微的指令。”


从2018年开始,OpenAI就开始传播GPT语言模型,但在所有Open AI庞大的语言模型中,GPT-4不仅是最新的,也是最强大的。 OpenAI 报告说它使用 Microsoft Azure 来训练模型。以下是 GPT-4 与 GPT-3.5 的几种比较方式


  1. GPT-4 接受视觉输入,而 GPT-3.5 不接受


鉴于 GPT-4 是 OpenAI 指定的“多模态”,并且可以理解信息的许多“模态”,因此可以通过视觉和文本提示提示它生成内容,而 GPT-3.5 基本上能够读写文本.尽管如此,该公司并未立即部署其图像描述功能,并且 GPT-4 版本仍然仅供 OpenAI 的 ChatGPT Plus 用户和开发人员的订阅者使用,并且仅支持文本。


  1. 与GPT-3.5相比,GPT-4有更大的缓冲区


简单地说,GPT-4 的内存比之前的型号更长。使用 GPT-3.5 和 ChatGPT 的上一个迭代,最大值为 4,096 个“令牌”,或大约 8,000 个单词,而 GPT-4 的最大令牌数为 32,768,或大约 64,000 个单词。这是内存容量的 8 倍。


  1. GPT-4 具有多种“角色”。或可操纵性,与 GPT-3.5 不同


Steerability是指在特定方向或风格上控制或影响语言模型输出的能力。换句话说,它允许用户引导语言模型生成适合特定语气、风格或主题的文本。虽然 GPT-3 没有内置的可操纵性功能,但 GPT-4 有。借助 GPT-4,开发人员和 ChatGPT 用户可以通过在“系统”消息中给出此类指示来指定他们的 AI 的风格和任务,这与具有定义的冗长、语气和风格的传统 ChatGPT 个性截然不同。该公司表示,虽然此功能目前仅供开发人员使用,但很快也会向 ChatGPT 用户开放。


  1. GPT-4 具有更广泛的语言范围。


这意味着 GPT-4 可以理解和生成比其前身 GPT-3.5 更多种语言的文本。这是自然语言处理领域的重大进步。根据 OpenAI 的说法,GPT-4 在他们测试的 26 种语言中,有 24 种语言的英语表现优于 GPT-3.5 和其他 LLM。因此,GPT-4 可以准确回答 26 种不同语言的大量选择题。


  1. GPT-4 对事实的“幻觉”较少


即使它不能完全阻止幻觉,但与早期变体相比,GPT-4 大大减少了幻觉。但是,需要注意的是,GPT-4 仍然不完全可靠。该公司表示,更新后的语言模型继续“幻觉”事实并表现出有缺陷的逻辑,尽管不如 GPT-3.5 糟糕。语言模型软件上下文中的幻觉是指生成的文本看起来连贯且有意义,但实际上不受输入数据的支持。当语言模型生成的文本不基于上下文或与输入文本的语义不一致时,就会发生这种情况。


换句话说,语言模型有时可能会根据其接受训练的信息生成不准确或不合理的文本,从而导致通常所说的“幻觉”。除了上述限制外,该模型还包含社会偏见和对抗性提示。 OpenAI 的博客文章指出,


“在内部对抗性真实性评估中,GPT-4 的得分比最新的 GPT-3.5 高 40%。”


《华盛顿邮报》报道,法学硕士通过互联网文本和视觉训练,学会了模仿人类对种族、性别、宗教和阶级的偏见。


GPT-4 也有与 GPT-3.5 类似的额外限制,其中之一是它仍然缺乏对 2021 年 9 月之后发生的事件的了解。其他人教它新东西的能力也受到以下事实的限制:不从其经验中吸取教训。无论如何,GPT-4 仍然更聪明;因为它更准确,更精确,并且具有更好的专业知识。


该语言模型还表明它能够通过考试。根据 OpenAI 的说法,它在模拟律师考试中得分第 90 个百分位,在 SAT 阅读测试中得分第 93 个百分位,在 SAT 数学测试中得分第 89 个百分位。


GPT4目前在哪里使用?


GPT-4 有潜力用于需要自然语言理解和生成的广泛应用。语言学习软件 Duolingo、支付提供商 Stripe、在线学习平台 Khan Academy 和金融服务公司 Morgan Stanley 是 OpenAI 声明中提到的目前正在使用新模型的公司之一。


微软还报告称,其聊天机器人 BingAI 一直在使用 GPT-4,甚至在该模型公开发布之前。


“我们很高兴地确认新的 Bing 正在 GPT-4 上运行,这是我们为搜索定制的,如果你在过去五周内的任何时间使用过新的 Bing 预览版,你就已经体验到了早期的这个强大模型的版本。”


微软公司副总裁兼消费者首席营销官 Yusuf Mehdi 在一份声明中写道。

根据 OpenAI 的说法,GPT-4“在需要高级推理、复杂指令理解和更多创造力的任务中表现出色”。


自 GPT-4 发布以来的短时间内,用户报告以各种创造性的方式使用它:


这种新工具的可能性被认为是无穷无尽的。

如何访问 GPT-4?

\从根本上说,要访问 ChatGPT,您必须先在 OpenAI 上注册网站,但这样做可以让您选择仅使用 GPT-3.5。您需要付费订阅 ChatGPT Plus(ChatGPT 的更昂贵变体)才能使用 GPT-4。


由于微软已经确认新的 Bing 在 GPT 的新模型上运行,那么很明显数百万的 Bing 用户已经可以通过聊天机器人访问它。

新模型也可以通过 API 访问,该公司表示,他们正在优先考虑在 GPT-4 缓慢推出期间为 OpenAI Evals 提供出色模型评估的开发人员的 API 访问,以便了解他们如何为每个人增强模型。