Mit der Einführung von ChatGPT im November 2022 erlebten wir die Entstehung eines neuen generativen KI-Giganten, OpenAI. ChatGPT dient als chatorientierte Schnittstelle für das zugrunde liegende Modell, das es verwendet. Die erste Version des Chatbots basierte auf einem großen Sprachmodell namens GPT-3.5, das uns alle umgehauen hat.
Aber am Dienstag, den 14. März 2023, 4 Monate nach dem ersten Start von ChatGPT, bringt OpenAI mit der Veröffentlichung von GPT-4, einem leistungsfähigeren Modell als frühere Versionen, Schwung in die Sache. Ursprünglich für die Interaktion mit GPT-3.5 konzipiert, fungiert der Chatbot nun als Medium für die Interaktion mit GPT-4.
Das Gleiche, was GPT-3.5 kann, aber mehr. Das Unternehmen sagte in einem Blogbeitrag:
„GPT-4 ist zuverlässiger, kreativer und in der Lage, viel differenziertere Anweisungen zu verarbeiten als GPT-3.5.“
Seit 2018 verbreitet OpenAI GPT-Sprachmodelle, aber von allen großen Sprachmodellen von Open AI ist GPT-4 nicht nur das neueste, sondern auch das leistungsstärkste. OpenAI berichtete, dass es Microsoft Azure zum Trainieren des Modells verwendet habe. Hier sind einige Vergleiche zwischen GPT-4 und GPT-3.5
GPT-4 akzeptiert visuelle Eingaben, GPT-3.5 jedoch nicht
Da GPT-4 im Sinne von OpenAI „multimodal“ ist und viele „Modalitäten“ von Informationen verstehen kann, kann es durch visuelle und textliche Hinweise zur Erstellung von Inhalten veranlasst werden, während GPT-3.5 im Wesentlichen in der Lage war, Text zu lesen und zu schreiben . Dennoch stellt das Unternehmen seine Bildbeschreibungsfunktion nicht sofort bereit, und die GPT-4-Version bleibt nur für Abonnenten von OpenAIs ChatGPT Plus-Benutzern und -Entwicklern verfügbar und unterstützt nur Text.
Im Vergleich zu GPT-3.5 verfügt GPT-4 über einen größeren Puffer
Einfach ausgedrückt verfügt GPT-4 über einen längeren Speicher als das Vorgängermodell. Bei GPT-3.5 und der vorherigen Iteration von ChatGPT betrug das Maximum 4.096 „Tokens“ oder etwa 8.000 Wörter, während die maximale Token-Anzahl für GPT-4 32.768 oder etwa 64.000 Wörter beträgt. Das ist 8-mal mehr Speicherkapazität.
GPT-4 verfügt über eine Vielzahl von „Personas“. oder Lenkbarkeit, im Gegensatz zu GPT-3.5
Unter Steuerbarkeit versteht man die Fähigkeit, die Ausgabe eines Sprachmodells in eine bestimmte Richtung oder einen bestimmten Stil zu steuern oder zu beeinflussen. Mit anderen Worten: Benutzer können das Sprachmodell steuern, um Text zu erstellen, der zu einem bestimmten Ton, Stil oder Thema passt. Während GPT-3 nicht über integrierte Lenkbarkeitsfunktionen verfügt, ist dies bei GPT-4 der Fall. Mit GPT-4 können Entwickler und ChatGPT-Benutzer den Stil und die Aufgabe ihrer KI festlegen, indem sie solche Anweisungen in der „System“-Nachricht angeben, im Gegensatz zur herkömmlichen ChatGPT-Persönlichkeit mit definierter Ausführlichkeit, Ton und Stil. Das Unternehmen gab an, dass diese Funktion derzeit zwar nur Entwicklern zugänglich ist, bald aber auch ChatGPT-Benutzern zur Verfügung gestellt wird.
GPT-4 verfügt über ein breiteres Sprachspektrum.
Das bedeutet, dass GPT-4 Texte in einer größeren Vielfalt an Sprachen verstehen und generieren kann als sein Vorgänger GPT-3.5. Dies ist ein bedeutender Fortschritt auf dem Gebiet der Verarbeitung natürlicher Sprache. Laut OpenAI übertrifft GPT-4 die englischsprachige Leistung von GPT-3.5 und anderen LLMs in 24 der 26 getesteten Sprachen. Dadurch kann GPT-4 eine große Anzahl von Multiple-Choice-Fragen in 26 verschiedenen Sprachen präzise beantworten.
GPT-4 hat weniger „Halluzinationen“ in Bezug auf Fakten
Auch wenn es Halluzinationen oder das Erfinden von Fakten nicht vollständig unterbindet, schwächt GPT-4 diese im Vergleich zu früheren Varianten erheblich ab. Das Unternehmen sagte, das aktualisierte Sprachmodell „halluziniere“ weiterhin Fakten und weise fehlerhafte Logik auf, wenn auch nicht so schlimm wie GPT-3.5. Halluzinationen im Zusammenhang mit Sprachmodellsoftware beziehen sich auf die Erzeugung von Text, der kohärent und bedeutungsvoll erscheint, aber nicht tatsächlich von den Eingabedaten unterstützt wird. Dies kann auftreten, wenn ein Sprachmodell Text generiert, der nicht im Kontext verankert ist oder nicht mit der semantischen Bedeutung des Eingabetextes übereinstimmt.
Mit anderen Worten: Ein Sprachmodell generiert manchmal Text, der auf der Grundlage der Informationen, auf die es trainiert wurde, nicht korrekt oder plausibel ist, was zu sogenannten „Halluzinationen“ führt. Zusätzlich zu den oben genannten Einschränkungen berücksichtigt das Modell auch soziale Vorurteile und kontroverse Anreize. Im Blogbeitrag von OpenAI heißt es:
„GPT-4 schneidet bei internen kontradiktorischen Faktenbewertungen um 40 % besser ab als das neueste GPT-3.5.“
Laut der Washington Post haben LLMs durch ihre Ausbildung in Texten und Bildern im Internet gelernt, menschliche Vorurteile in Bezug auf Rasse, Geschlecht, Religion und Klasse nachzuahmen. Offensichtlich haben KI-Systeme das Potenzial, bestehende Vorurteile in der Gesellschaft aufrechtzuerhalten und zu verstärken, anstatt sie zu mildern.
GPT-4 weist außerdem zusätzliche Einschränkungen auf, die denen von GPT-3.5 ähneln. Eine davon besteht darin, dass ihm immer noch Kenntnisse über Ereignisse fehlen, die nach September 2021 stattgefunden haben lernt nicht aus seinen Erfahrungen. Unabhängig davon ist GPT-4 immer noch intelligenter; da es genauer und präziser ist und über ein besseres Fachwissen verfügt.
Das Sprachmodell hat auch gezeigt, dass es Prüfungen bestehen kann. Laut OpenAI erreichte es bei einer simulierten Anwaltsprüfung das 90. Perzentil, bei einem SAT-Lesetest das 93. Perzentil und bei einem SAT-Mathetest das 89. Perzentil.
GPT-4 hat das Potenzial, in einer Vielzahl von Anwendungen eingesetzt zu werden, die das Verständnis und die Erzeugung natürlicher Sprache erfordern. Die Sprachlernsoftware Duolingo, der Zahlungsanbieter Stripe, die Online-Lernplattform Khan Academy und das Finanzdienstleistungsunternehmen Morgan Stanley gehörten zu den in der Stellungnahme von OpenAI genannten Unternehmen, die derzeit das neue Modell nutzen.
Microsoft berichtete außerdem, dass sein Chatbot BingAI die ganze Zeit über GPT-4 verwendet habe, sogar schon vor der Veröffentlichung des Modells.
„Wir freuen uns, bestätigen zu können, dass das neue Bing auf GPT-4 läuft, das wir für die Suche angepasst haben. Wenn Sie in den letzten fünf Wochen zu irgendeinem Zeitpunkt die neue Bing-Vorschau verwendet haben, haben Sie bereits eine frühe Erfahrung gemacht Version dieses leistungsstarken Modells.“
Yusuf Mehdi, Corporate Vice President und Chief Marketing Officer für Verbraucher bei Microsoft, schrieb in einer Erklärung.
Laut OpenAI zeichnet sich GPT-4 „durch Aufgaben aus, die fortgeschrittenes Denken, das Verständnis komplizierter Anweisungen und mehr Kreativität erfordern“.
Benutzer haben berichtet, dass GPT-4 in der kurzen Zeit seit seiner Veröffentlichung auf vielfältige erfinderische Weise verwendet wurde:
Es wird angenommen, dass die Möglichkeiten dieses neuen Tools endlos sind.
Um auf ChatGPT zugreifen zu können, müssen Sie sich grundsätzlich zunächst bei OpenAI registrieren
Da Microsoft bestätigt hat, dass das neue Bing auf dem neuen GPT-Modell läuft, ist es offensichtlich, dass Millionen von Bing-Benutzern bereits über den Chatbot darauf zugreifen können.
Das neue Modell ist auch über die API zugänglich. Das Unternehmen gab an, dass es den API-Zugriff für Entwickler priorisiert, die während der langsamen Einführung von GPT-4 herausragende Modellbewertungen an OpenAI Evals abgeben, um zu erfahren, wie sie das Modell für alle verbessern können.