paint-brush
Claude 2 AI 处理 PDF 的能力如何? - 让我们找出答案经过@jorgev
3,804 讀數
3,804 讀數

Claude 2 AI 处理 PDF 的能力如何? - 让我们找出答案

经过 Jorge Villegas5m2023/11/03
Read on Terminal Reader
Read this story w/o Javascript

太長; 讀書

我们来看看 AI 助手 Claude 2 处理 PDF 相关任务的表现如何。
featured image - Claude 2 AI 处理 PDF 的能力如何? - 让我们找出答案
Jorge Villegas HackerNoon profile picture
0-item

便携式文档格式 (PDF) 文件在我们的数字世界中无处不在。我们将它们用于从共享文档到在线填写表格的各种用途。但处理 PDF 并不总是那么容易。这就是人工智能发挥作用的地方。


我们将看看AI助手 Claude 2 处理 PDF 相关任务的效果如何。 Claude 2 由 Anthropic 创建,旨在提供帮助、无害且诚实。我们将在一些常见的 PDF 操作中测试它的性能,看看它在处理这种重要的文件格式时是否符合这些理想。


在现实场景中测试人工智能助手至关重要。随着人工智能成为我们生活中如此重要的一部分,了解它们擅长什么以及不足之处至关重要。 Claude 似乎正在成为一个强有力的竞争者,可能与 GPT-4 等模型不相上下。我们相信,了解这些技术的用户将在其成功采用中发挥重要作用。


因此,请加入我们,探索 Claude 2 是否可以使处理 PDF 变得更容易,或者其技能是否仍需要改进。结果可能会让你吃惊。

克劳德2的PDF能力

Claude 2 因其内置的分析和处理 PDF 文件的能力而从其他 AI 助手中脱颖而出。 Anthropic 的研究人员设计了 Claude 2,用于使用机器学习技术解析和理解 PDF 文档的结构。与其他难以理解 PDF 的聊天机器人相比,这使 Claude 2 在处理 PDF 方面具有固有的优势。作为首批配备专用 PDF 分析器组件的AI 模型之一,Claude 2 具有独特的优势,能够出色地完成 PDF 相关任务。在这篇博文中,我们将研究其专业工程如何转化为现实世界中使用这种无处不在的文档格式的熟练程度。我们的测试将揭示 Claude 2 是否能够兑现其承诺,为操作 PDF 提供有用、无害且诚实的帮助。另请注意,10MB 是最大文件大小。

测试 PDF

为了我们的教程,我们将使用 Python 教程PDF并看看我们可以从中得到什么。


让我们首先询问文档中我们知道的问题。我们将给出提示“什么是格式化字符串文字?”。答案在 PDF 中也很深,所以如果它能够回答文档开头而不是结尾的文本,那就会很有趣。

这是结果。 PDF 中的答案非常简洁。


直接报价

现在,让我们尝试从文件中获取直接引用。我们的提示现在将是“什么是函数注释?请给我引用该文件中的内容”。


这是结果。


这证实是直接引用!它甚至能够显示代码片段。

财务文件

现在,我们将尝试财务文档。我们将添加微软最新的季度报告。我们会提示“根据文件。微软本季度的总收入是多少?”这是我们结果的屏幕截图。

我们可以看到克劳德提供了我们要求的收入信息,经过事实核查,我们可以自信地验证其准确性。克劳德甚至指出了可以找到这些信息的确切页面,而且它也是正确的。


然后我们提示:“与去年相比,收入的百分比变化是多少?”。我想看看是否可以做一些分析。

令我惊讶的是,它竟然能够弄清楚。它还给出了结果的页码。我什至不知道这些数据在文档中。我认为需要去年第三季度的收入和今年的收入,然后进行数学计算来计算百分比差异。

备择方案

克劳德目前对您可以提出的请求数量施加了限制,甚至可能有一个等待访问的名单。考虑到这些限制,探索一些替代方案是值得的。

困惑

Perplexity AI 是一个很棒的 NLP 人工智能工具,带有文档。用户可以上传纯文本、代码或 PDF 格式的PDF 文件,Perplexity 将利用文件内容来制定答案。对于短文件,整个文档将通过语言模型进行分析。 Perplexity 还可以手动将长 PDF 分块到主题区域,并将其输入 GPT-4 进行创意写作。 Perplexity 可以分析 PDF 以直接从文档中回答问题、提供其给出的答案的来源引文、比较和对比研究论文、根据查询查找相关文档或论文、分析数据并从各种来源生成见解、可视化数据并创建来自各种来源的图形,并将文本从一种语言翻译成另一种语言。如果您使用免费帐户,则只能执行一定数量的请求。如果您想要无限文件上传,则需要订阅 20 美元/月。

聊天GPT

ChatGPT 已宣布将 PDF 分析作为 ChatGPT Plus 订阅者最新更新中的一项新功能。此功能允许用户上传 PDF 文件和其他文档,然后由 ChatGPT 进行分析。聊天机器人可以提取摘要和各种数据点,甚至可以根据该数据编写图表。该功能目前处于测试阶段,可供 ChatGPT Plus 会员使用。该更新还包括自动工具切换,使 ChatGPT 能够根据上下文猜测用户想要什么。自 2023 年 10 月起,ChatGPT Plus 客户即可使用这些新功能

开源

最后但同样重要的是,开源解决方案提供了一个令人信服的替代方案。有大量开源工具可用于 PDF 分析,利用 Langchain 或 Python 数据科学等各种技术,通常与矢量数据库集成。值得注意的是,与 Pinecone 等商业服务相比,Pgvector 等矢量数据库解决方案可以提供更具成本效益的选择。尽管如此,GitHub 等平台上的开源社区提供了大量可访问且可自定义的模型来满足您的 PDF 分析需求。

结论

当我们第一次测试 Claude 的 PDF 分析器时,我真的很兴奋。早期的结果看起来很棒。但你知道人工智能模型的情况如何——它们并不完美。肯定存在一些错误。当我第一次开始与 Claude讨论 PDF 时,经常会感到困惑。但我一直对它的进步印象深刻。与以前相比,如果有的话,错误也大大减少了。


随着时间的推移,看到这种改进确实很有希望。我并不是说它已经准备好取代人类的专业知识;而是说它已经准备好取代人类的专业知识。显然,您需要仔细检查。我们仍然需要密切关注任何潜在的问题。但我对 Claude 的 PDF 能力的发展方向持乐观态度。这最终可能成为一个非常有用的工具。当然,有很多选择,但这是其中一个很好的选择。