paint-brush
ChatGPT 4.0 终于开了个玩笑经过@ursushoribilis
2,865 讀數
2,865 讀數

ChatGPT 4.0 终于开了个玩笑

经过 Miguel Rodriguez8m2023/03/20
Read on Terminal Reader

太長; 讀書

测试了新的 ChatGPT4 如何在推理、创造力和分析能力方面比以前的版本有所改进,并发现它总体上更好。自己知道怎么做,因为他们都是在旧数据上训练的,他们都不知道 ChatGPT 的功能
featured image - ChatGPT 4.0 终于开了个玩笑
Miguel Rodriguez HackerNoon profile picture
0-item

我研究了 ChatGPT 新版本 4 的这些方面,并将其与其较早的兄弟版本 ChatGPT V 3.5 进行了比较:


  • 推理:它能解释为什么笑话好笑吗?
  • 创造力:它能给我讲个笑话吗?一个真正的新笑话?
  • 分析:它能解谜吗?
  • 自我知道如何:它对自己了解多少。


OpenAI 记录的聊天 GPT 版本比较


这是我的发现:

  • 推理:ChatGPT4.0 开玩笑了,ChatGPT3.5 没有
  • 创造力:ChatGPT4.0 做得更好。
  • 分析:ChatGPT4.0 是比 ChatGPT3.5 更好的程序员
  • Self know how:由于数据过时,它不知道自己是谁。


以下是详细信息:

推理

我去看了一些关于算法新功能的文章。他们提到了一些有趣的事实。首先是该模型能够解释笑话。


所以我做了一个实验。我向 3.5 和 4 提出了以下问题:

为什么这很有趣*:为什么番茄变红了?因为它看到了沙拉酱!*

我想知道旧版本会告诉我关于这个笑话的什么,所以我请旧的 ChatGPT 3 来解释它。这是我得到的失败版本:

解释笑话 ChatGPT3.5 vs ChatGPT4


这个笑话很有趣,因为它与西红柿因情绪反应而改变颜色的想法有关。妙语“因为它看到了沙拉酱!”是对“因为它看到了光!”这句话的一种演绎。 ,常用于描述突然意识到或改变看法。在这个案例中,开玩笑的是,西红柿之所以变红,是因为看到沙拉酱这种蔬菜常见的调味品而兴奋或受到刺激。幽默来自于一种荒谬的想法,即一种蔬菜可以有如此强烈的情绪反应。


将此与 ChatGPT4 给出的正确答案进行比较:


这个笑话被认为是有趣的,因为它依赖于文字游戏和拟人化。幽默来自于赋予西红柿类似人类的品质,例如感到尴尬的能力。

在笑话中,西红柿“变红”是因为它“看到了沙拉酱”。妙语可以用两种方式解释:


  1. 从字面上看,西红柿在成熟时变红,这是一个自然过程。


  2. 形象地说,西红柿感到尴尬(就像一个人可能会脸红或变红),因为它“看到”了沙拉酱,就好像它抓住了某人脱衣服一样。通过将字面意思与幽默、意想不到的转折相结合,这个笑话创造了一种许多人觉得有趣的心理形象。


因此,如果我们可以通过如何解释一个笑话来判断推理,那么 ChatGPT4.0 无疑是赢家。

创造力

然后我要求他们创造一个目前还不存在的笑话:

ChatGPT3(左)和 ChatGPT4(右)的新笑话


看来他们需要提高系统的幽默技巧。


然后我给了它创建一个数字广告的任务,宣布 ChatGPT-4 的推出,描述它将使用的图形元素,包括标题和文本:


标题:“ChatGPT-4 简介:AI 对话的一场革命”

说明文字:“通过无缝通信、增强的创造力和无与伦比的智能体验下一代人工智能。”


视觉元素:

背景: 融合了绚丽的色彩,象征着类人思维与先进技术的融合。调色板由电蓝色和紫色组成,从深色过渡到浅色。


ChatGPT-4 标志:标志显眼地显示在中心,展示了对话气泡和程式化“4”的组合,这表明 ChatGPT 的第四个版本。徽标使用时尚现代的字体,渐变与背景颜色相匹配。


AI插图:一个全息类人形象,带着未来感的耳机或眼镜,代表着人工智能与人类交流的无缝结合。该图似乎正在与虚拟聊天界面进行交互,强调了 ChatGPT-4 的主要功能。


功能亮点:使用现代图标和简洁文本显示的主要功能列表:

  • 增强上下文理解
  • 无与伦比的创造力
  • 改进的多语言支持
  • 强大的数据隐私和安全


号召性用语 (CTA) :一个突出且引人注目的按钮,鼓励用户“免费试用 ChatGPT-4”或“了解更多”。该按钮使用对比色在背景中脱颖而出,例如橙色或绿色。


推荐转盘:一个旋转的转盘,展示来自满意用户或行业领导者的引述,以建立信任和信誉。旋转木马采用干净现代的布局设计,使用个人的圆形肖像和他们的名言。


页脚:页脚包括 OpenAI 徽标、标语“Powered by OpenAI”以及指向隐私政策和服务条款的链接。


文本: “使用 ChatGPT-4 探索无限可能的世界。我们最新的 AI 语言模型为您带来无与伦比的对话体验,使您能够以前所未有的方式进行联系、创建和协作。今天加入 AI 革命,用 ChatGPT-4 释放你的潜力。”


然后当然,我去找它的数字表亲 Dall-E,要求它创作 ChatGPT 4 描述的数字艺术:


ChatGPT 启动海报的 Dall-E 数字艺术版本


我不是营销专家,但我不得不说我对结果印象深刻。 Chat GPT3.5 对此的口才和说服力稍差。


它还有底部的解释文本,似乎是每个答案的一部分,听起来更像是政治家而不是专家:


广告标题:介绍聊天 GPT-4:AI 对话的未来


标题:向更智能的对话问好


广告文字: AI 对话的未来在于 Chat GPT-4。准备好通过更快、更准确的响应获得更自然、更直观的体验。告别笼统的回应,迎接更智能的对话。


图形元素:

机器人或 AI 设备的未来派插图
显示与 Chat GPT-4 对话的智能手机或笔记本电脑屏幕
标题和标题的大胆和现代排版
强调技术和创新的配色方案,例如蓝色和金属银


这则广告旨在强调 Chat GPT-4 的尖端技术和高级功能,同时也强调其增强我们与 AI 交互方式的潜力。使用未来派插图和显示对话的智能手机或笔记本电脑屏幕有助于将概念变为现实并展示产品的实际应用。大胆而现代的排版和以技术为中心的配色方案强化了创新和进步的信息。

分析

然后我不得不尝试一下它的解谜技巧。这个面试题我用了很多年:

U2 的四名成员(Bono、Edge、Larry 和 Adam)需要穿过一座狭窄的桥才能举办一场音乐会。由于天黑,需要手电筒过桥,但乐队只有一个手电筒,一次只能两个人过桥。 (当然,这并不是说,如果乐队的其中一名成员已经过桥,他就不能自己拿着手电筒回来。)亚当只需要一分钟就可以过桥,拉里需要两分钟, Edge 需要 5 分钟,slowpoke Bono 需要 10 分钟。一对只能和最慢的成员一样快。他们有 17 分钟的时间过马路。他们应该怎么做?


要在 17 分钟内让 U2 的所有四名成员过桥,他们可以按照以下步骤操作:

  • 亚当和拉里一起过桥,用时 2 分钟(过去 2 分钟)。
  • 亚当拿着手电筒回去,用了 1 分钟(3 分钟过去了)。
  • Bono 和 Edge 一起过桥,耗时 10 分钟(过去 13 分钟)。
  • 拉里拿着手电筒回去,用了 2 分钟(15 分钟过去了)。
  • 亚当和拉里再次一起过桥,用时 2 分钟(17 分钟过去了)。这样,所有四名成员 Bono、Edge、Larry 和 Adam 都在整整 17 分钟内穿过了桥。


真正让我吃惊的是它得出答案的速度。

让我感到惊讶的是 ChatGPT 3.5 能够提供相同的解决方案。


所以我去了 Interviewcake.com 并得到了他们最新的编程问题:


编写一个函数 fib(),它接受一个整数 n 并返回第 n 个斐波那契数

ChatGPT 3.5(上图)和 ChatGPT 4(下图)的 Fib(n) 代码

在这种情况下,ChatGPT 4.0 的代码胜出。它具有更好的错误处理并以更优雅的方式解决问题。

自己知道怎么做

当您想了解新推出的 ChatGPT 4.0 时,您会怎么做?当然,你问模型本身。除了模型是用 2021 年 9 月的数据训练的,所以它当然不知道自己。


然而,如果你问它有哪些特点,它给出了一个合理的答案:

  1. 模型大小和架构:GPT-4 可能具有比 GPT-3 更大的模型大小,包含更多参数和层,GPT-3 具有 1750 亿个参数。更大的模型通常会带来更好的性能,因为模型可以学习数据中更复杂的模式和关系。
  2. 训练数据:GPT-4 可能会在更多样化和最新的数据集上接受训练,这将提高对近期事件、趋势和技术的知识和理解。
  3. 微调和特定于任务的适应:GPT-4 可能具有改进的功能,可以针对特定任务或领域进行微调和适应,从而使其在更广泛的用例中更加通用和有效。
  4. 效率和计算要求:GPT-4 在计算资源方面可能更高效,使其能够在更小的设备上运行或减少训练和部署大规模 AI 模型对环境的影响。
  5. 道德考虑和安全措施:GPT-4 可能会采用更先进的安全措施来减少偏见、解决道德问题并防止有害输出或恶意使用。
  6. 改进上下文处理和推理:GPT-4 可能对上下文有更好的理解,使其能够提供更相关和连贯的响应,以及执行需要推理和解决问题能力的任务。

看起来像是一个训练有素的产品负责人会写的文字。如果您随后与他们推广它的方式进行比较,看起来他们确实在推理和上下文处理方面有所改进,但他们仍在努力提高速度。

结论

  • 推理:ChatGPT4.0 开玩笑了,ChatGPT3.5 没有
  • 创造力:ChatGPT4.0 在为自己创建活动方面做得更好。
  • 分析:ChatGPT4.0 是比 ChatGPT3.5 更好的程序员
  • 自知之明:因为资料过时,没人知道ChatGPT4.0是谁。然而,他们试图猜测团队会做哪些改进