paint-brush
Wie gut ist die KI von Claude 2 bei der Arbeit mit PDFs? - Lass es uns herausfindenvon@jorgev
3,816 Lesungen
3,816 Lesungen

Wie gut ist die KI von Claude 2 bei der Arbeit mit PDFs? - Lass es uns herausfinden

von Jorge Villegas5m2023/11/03
Read on Terminal Reader
Read this story w/o Javascript

Zu lang; Lesen

Wir werfen einen Blick darauf, wie gut der KI-Assistent Claude 2 PDF-bezogene Aufgaben bewältigt.
featured image - Wie gut ist die KI von Claude 2 bei der Arbeit mit PDFs? - Lass es uns herausfinden
Jorge Villegas HackerNoon profile picture
0-item

Dateien im Portable Document Format (PDF) sind in unserer digitalen Welt allgegenwärtig. Wir nutzen sie für alles, vom Teilen von Dokumenten bis zum Online-Ausfüllen von Formularen. Doch die Arbeit mit PDFs ist nicht immer einfach. Hier kommt künstliche Intelligenz ins Spiel.


Wir werden uns ansehen, wie gut der KI- Assistent Claude 2 PDF-bezogene Aufgaben bewältigt. Claude 2 wurde von Anthropic entwickelt und soll hilfreich, harmlos und ehrlich sein. Wir werden es anhand einiger gängiger PDF-Aktionen auf Herz und Nieren testen, um zu sehen, ob es diesen Idealen bei der Arbeit mit diesem wichtigen Dateiformat gerecht wird.


Es ist wichtig, KI-Assistenten in realen Szenarien auf die Probe zu stellen. Da KI zu einem immer wichtigeren Teil unseres Lebens wird, ist es wichtig zu wissen, worin sie sich auszeichnet und wo sie möglicherweise zu kurz kommt. Claude scheint sich zu einem robusten Konkurrenten zu entwickeln, möglicherweise auf Augenhöhe mit Modellen wie GPT-4. Wir sind zuversichtlich, dass Benutzer, die diese Technologien verstehen, eine wichtige Rolle bei ihrer erfolgreichen Einführung spielen werden.


Seien Sie also dabei, wenn wir herausfinden, ob Claude 2 die Arbeit mit PDFs erleichtern kann oder ob seine Fähigkeiten noch verbessert werden müssen. Die Ergebnisse werden Sie vielleicht überraschen.

Die PDF-Fähigkeit von Claude 2

Claude 2 unterscheidet sich von anderen KI-Assistenten durch seine integrierte Fähigkeit, PDF-Dateien zu analysieren und damit zu arbeiten. Die Forscher von Anthropic haben Claude 2 entwickelt, um die Struktur von PDF-Dokumenten mithilfe maschineller Lerntechniken zu analysieren und zu verstehen. Dies verschafft Claude 2 einen inhärenten Vorteil bei der Verarbeitung von PDFs im Vergleich zu anderen Chatbots, die Schwierigkeiten hätten, sie zu verstehen. Als eines der ersten KI-Modelle mit einer speziellen PDF-Analysekomponente ist Claude 2 einzigartig positioniert, um bei PDF-bezogenen Aufgaben hervorragende Leistungen zu erbringen. In diesem Blog-Beitrag untersuchen wir, wie sich die spezielle Technik in praktische Kenntnisse im Umgang mit diesem allgegenwärtigen Dokumentformat umsetzt. Unsere Tests werden zeigen, ob Claude 2 sein Versprechen einhält, hilfreiche, harmlose und ehrliche Hilfe bei der Bearbeitung von PDFs zu bieten. Beachten Sie außerdem, dass die maximale Dateigröße 10 MB beträgt.

PDFs testen

Für unser Tutorial verwenden wir ein Python-Tutorial- PDF und sehen, was wir daraus machen können.


Beginnen wir damit, ihm Fragen zu stellen, von denen wir wissen, dass sie im Dokument enthalten sind. Wir geben ihm die Eingabeaufforderung „Was sind formatierte String-Literale?“. Die Antwort liegt auch ziemlich tief im PDF, daher wäre es interessant, wenn Texte am Anfang von Dokumenten beantwortet werden könnten, nicht aber am Ende.

Hier ist das Ergebnis. Die Antworten sind im PDF ziemlich prägnant.


Direkte Zitate

Versuchen wir nun, direkte Zitate aus der Datei zu erhalten. Unsere Eingabeaufforderung lautet nun: „Was sind Funktionsanmerkungen?“ Geben Sie mir ein Zitat aus dem Dokument.“


Hier ist das Ergebnis.


Was bestätigt, dass es sich um ein direktes Zitat handelt! Es konnte sogar das Code-Snippet angezeigt werden.

Finanzdokumente

Jetzt werden wir es mit Finanzdokumenten versuchen. Wir werden den aktuellsten Quartalsbericht von Microsoft hinzufügen. Wir werden es mit „Laut Dokument“ auffordern. Wie hoch war der Gesamtumsatz von Microsoft für das Quartal? Hier ist der Screenshot unserer Ergebnisse.

Wir können sehen, dass Claude die von uns angeforderten Umsatzinformationen bereitgestellt hat, und nach einer Faktenprüfung können wir deren Richtigkeit mit Sicherheit bestätigen. Claude hat sogar die genaue Seite angegeben, auf der diese Informationen zu finden waren, und sie ist auch korrekt.


Dann fragten wir: „Wie hoch war die prozentuale Umsatzveränderung im Vergleich zum letzten Jahr?“. Ich wollte sehen, ob es eine Analyse durchführen kann.

Zu meiner Überraschung gelang es, es herauszufinden. Außerdem wurde die Seitenzahl der Ergebnisse angegeben. Ich wusste nicht einmal, dass diese Daten in den Dokumenten enthalten waren. Ich dachte, man würde die Einnahmen aus dem dritten Quartal des letzten und des diesjährigen nehmen und dann rechnen, um die prozentuale Differenz zu berechnen.

Alternativen

Claude beschränkt derzeit die Anzahl der Anfragen, die Sie stellen können, und führt möglicherweise sogar eine Warteliste für den Zugriff. Angesichts dieser Einschränkungen lohnt es sich, einige alternative Optionen zu prüfen.

Verwirrung

Perplexity AI ist ein großartiges KI-Tool für NLP mit Dokumenten. Benutzer können PDF-Dateien im Klartext-, Code- oder PDF-Format hochladen, und Perplexity nutzt den Dateiinhalt, um Antworten zu formulieren. Bei kurzen Dateien wird das gesamte Dokument vom Sprachmodell analysiert. Perplexity kann lange PDFs auch manuell in Themenbereiche unterteilen und sie zum kreativen Schreiben an GPT-4 weiterleiten. Perplexity kann PDFs analysieren, um Fragen direkt aus den Dokumenten zu beantworten, Quellenangaben für die darin gegebenen Antworten bereitzustellen, Forschungsarbeiten zu vergleichen und gegenüberzustellen, verwandte Dokumente oder Arbeiten auf der Grundlage einer Abfrage zu finden, Daten zu analysieren und Erkenntnisse aus verschiedenen Quellen zu generieren, Daten zu visualisieren und zu erstellen Grafiken aus verschiedenen Quellen herunterladen und Texte von einer Sprache in eine andere übersetzen. Wenn Sie ein kostenloses Konto haben, können Sie nur eine bestimmte Anzahl von Anfragen stellen. Wenn Sie unbegrenzten Datei-Upload wünschen, müssen Sie ein Abonnement für 20 $/Monat abschließen.

ChatGPT

ChatGPT hat die PDF-Analyse als neue Funktion in seinem neuesten Update für ChatGPT Plus-Abonnenten angekündigt. Mit dieser Funktion können Benutzer PDF-Dateien und andere Dokumente hochladen, die dann von ChatGPT analysiert werden können. Der Chatbot kann Zusammenfassungen und verschiedene Datenpunkte extrahieren oder sogar Grafiken und Diagramme auf der Grundlage dieser Daten schreiben. Die Funktionalität befindet sich derzeit in der Betaphase und ist für ChatGPT Plus-Mitglieder verfügbar. Das Update beinhaltet auch einen automatischen Tool-Wechsel, der es ChatGPT ermöglicht, anhand des Kontexts zu erraten, was Benutzer wollen. Die neuen Funktionen stehen ChatGPT Plus-Kunden seit Oktober 2023 zur Verfügung

Open Source

Nicht zuletzt bieten Open-Source-Lösungen eine überzeugende Alternative. Für die PDF-Analyse steht eine Vielzahl von Open-Source-Tools zur Verfügung, die verschiedene Technologien wie Langchain oder Python Data Science nutzen und oft in Vektordatenbanken integriert sind. Es ist erwähnenswert, dass Vektordatenbanklösungen wie Pgvector im Vergleich zu kommerziellen Diensten wie Pinecone eine deutlich kostengünstigere Option bieten können. Dennoch bietet die Open-Source-Community auf Plattformen wie GitHub eine Fülle zugänglicher und anpassbarer Modelle, um Ihre PDF-Analyseanforderungen zu erfüllen.

Abschluss

Ich war wirklich begeistert, als wir Claudes PDF-Analysator zum ersten Mal getestet haben. Die ersten Ergebnisse sahen großartig aus. Aber Sie wissen ja, wie es mit KI-Modellen ist – sie sind nicht perfekt. Hier und da gab es auf jeden Fall ein paar Fehler. Als ich anfing , mit Claude über PDFs zu plaudern , kam es ziemlich oft zu Verwirrung. Aber ich war immer wieder beeindruckt, wie viel besser es geworden ist. Die Fehler sind, wenn überhaupt, im Vergleich zu früher deutlich geringer.


Es ist wirklich vielversprechend, diese Art von Verbesserung im Laufe der Zeit zu sehen. Ich sage noch nicht, dass es bereit ist, menschliches Fachwissen zu ersetzen. Natürlich möchten Sie die Dinge noch einmal überprüfen. Wir müssen weiterhin nach möglichen Problemen Ausschau halten. Aber ich bin optimistisch, was die Entwicklung von Claudes PDF-Fähigkeiten betrifft. Dies könnte sich als unglaublich nützliches Werkzeug erweisen. Natürlich gibt es viele Optionen, aber diese ist eine großartige davon.