Bist du das 👆? Sie haben nicht CompSci gemacht, also sind Sie jetzt der Hofnarr, der schnell versucht, Wissen in der __   __ zu erweitern, die die Welt je gesehen hat?  Hol erstmal Luft. Hier ist ein Beitrag, der auf das Wesentliche zurückgeht und in dem Sie „   stellen können, ohne sich beurteilt zu fühlen. am schnellsten wachsenden Branche eine wirklich dumme Frage“  Ein kleines Glossar mit LLM-Begriffen für diejenigen, die lernen    – Mehr als man auf den ersten Blick sieht … Eine Art Modell, das beim maschinellen Lernen verwendet wird, insbesondere für die Verarbeitung von Datensequenzen wie Text oder Audio. Es eignet sich gut zum Verstehen des   in Sätzen und kann zum Übersetzen von Sprachen, zum Zusammenfassen von Text oder zum Generieren von Chatbot-Antworten verwendet werden. Transformer Kontexts    Es ist wie eine riesige Datenbank mit Sprachkenntnissen, die Artikel schreiben, Fragen beantworten oder realistische Dialoge erstellen kann.  Large Language Model (LLM) –   Ein Transformer ist eine Technik, die in der KI zur Verarbeitung von Sprache verwendet wird. Ein LLM ist ein großes KI-Modell für Sprachaufgaben, das oft mit der Transformer-Technik erstellt wird.    – Der Teil eines Computersystems oder einer Software, der es Benutzern ermöglicht, damit zu interagieren. Stellen Sie es sich als das Frontend eines Programms vor, in das Sie Ihre Frage oder Ihren Befehl eingeben und das Programm antwortet. Schnittstelle    – In der KI bedeutet dies, ein trainiertes Modell zu verwenden, um Vorhersagen oder Entscheidungen zu treffen. Nachdem beispielsweise ein Modell darauf trainiert wurde, Katzen in Bildern zu erkennen, erfolgt die Inferenz, wenn das Modell ein neues Bild betrachtet und entscheidet, ob eine Katze darin zu sehen ist.🐈‍⬛ Inferenz    – Eine Methode zum Trainieren von Maschinen, bei der Sie den Modellbeispielen Antworten geben. Als würde man einem Programm viele Bilder von Katzen zeigen und ihm sagen: „Das ist eine Katze“, damit es lernt, wie Katzen aussehen. Überwachtes Lernen    – Eine Maschine trainieren, ohne ihr die Antworten zu geben. Das Modell betrachtet Daten und versucht selbstständig Muster oder Gruppen zu finden. Es könnte beispielsweise verschiedene Arten von Musik nach Genres sortieren, ohne dass die Genrenamen mitgeteilt werden.   (  Unüberwachtes Lernen heeeyo)    – Maschinen durch Versuch und Irrtum beibringen. Die Maschine trifft Entscheidungen in einer Situation und erhält Belohnungen oder Strafen, je nachdem, ob ihre Entscheidungen gut oder schlecht sind. Mit der Zeit lernt sie, bessere Entscheidungen zu treffen (  Reinforcement Learning oder nachtragend und verschwiegen zu werden).    – Entwickelt, um ein bisschen wie ein menschliches Gehirn zu funktionieren. Es besteht aus vielen kleinen Einheiten (wie Gehirnzellen), die zusammenarbeiten, um Informationen zu verarbeiten und Probleme zu lösen. Neuronales Netzwerk  Erstellen eines LLM   Sammeln Ihrer Daten  Beginnen Sie mit der Erfassung verschiedenster Textdaten. Dies können Bücher, Online-Artikel oder Daten aus Datenbanken sein. Je vielfältiger Ihre Daten sind, desto besser kann Ihr LLM verschiedene Aspekte der Sprache verstehen.  Kaggle verfügt über großartige Daten für ML- und Data-Science-Projekte. Schauen Sie sich den australischen Einheimischen und   an. Kaggle-Großmeister Jeremy Howard    hostet häufig von Forschern und Entwicklern veröffentlichte Datensätze. Guter Ort zum Suchen. GitHub     Erwähnenswert ist Google Scholar für Datensätze zu Aufsätzen und Regierungsseiten   Daten vorverarbeiten    In diesem Schritt geht es darum, Fehler zu beheben, Teile zu entfernen, die nicht nützlich sind, und sie so zu organisieren, dass Ihre KI effektiv daraus lernen kann. Bereinigen Sie nun diese Daten.   Überlegungen  Wie gehen Sie mit fehlenden Werten um, beheben Formatierungsprobleme und gehen mit doppelten Daten um?   Auswahl einer Modellarchitektur  Bei der Modellarchitektur handelt es sich im Wesentlichen um das Design oder die Struktur des Modells, die als Blaupause dafür dient, wie die KI Informationen verarbeitet.  Die Transformer-Architektur ist besonders darauf zugeschnitten, sequentielle Daten wie Text zu verarbeiten, wobei der Schwerpunkt auf dem Verständnis des Kontexts innerhalb der Daten liegt, und dabei bleiben wir für heute.   Trainieren des Modells  Geben Sie die aufbereiteten Daten in Ihr KI-Modell ein. Hier beginnt Ihre KI, die Feinheiten der Sprache zu erlernen. Schulungen können zeit- und ressourcenintensiv sein, insbesondere bei vielen Daten. (Hier möchte ich meine Freunde bei   erwähnen, der Podcast kommt bald) Unsloth   Testen und Verfeinern  Bewerten Sie nach dem Training, wie gut Ihre KI Sprache versteht und generiert. Abhängig von den Ergebnissen müssen Sie möglicherweise Anpassungen und Umschulungen vornehmen, um die Leistung zu verbessern.   Ausführen des LLM   Nun, wie lässt man das Biest laufen?  Anstatt ein LLM von Grund auf neu zu erstellen, können Sie   verwenden, um auf Modelle zuzugreifen, die bereits mit wahnsinnigen Datenmengen trainiert wurden. Sie können diese Modelle entweder in ihrem Cloud-Dienst ausführen oder sie herunterladen, um sie lokal auf Ihrem Computer auszuführen. Hugging Face  Unabhängig von Ihrer Wahl liegt der Schlüssel darin, über ein trainiertes LLM-Modell   sei es über das Internet oder direkt auf Ihrem Computer.  und die Möglichkeit zu verfügen, damit zu interagieren,   Dies ist Teil eins einer Reihe von Beiträgen, die darauf abzielen, die Hürden für das Verständnis und die Einführung von Open-Source-KI zu verringern.  Ich schreibe und produziere hier Podcasts-   (unbeaufsichtigtes Lernen  Weitere Links hier  https://linktr.ee/Unsupervisedlearning   Auch   veröffentlicht hier

The writer is smart, but don't just like, take their word for it. #DoYourOwnResearch before making any investment decisions or decisions regarding your health or security. (Do not regard any of this content as professional investment advice, or health advice)

Read My Stories

Dieses Audio ist in der Originalsprache der Geschichte produziert!

LLMs für Dummies – Komplettlösung und Glossar

About Author

KOMMENTARE

Hängeetiketten

DIESER ARTIKEL WURDE VORGESTELLT IN

Related Stories

HackerNoon Decoded 2024: Celebrating Our Data Science Community!

HackerNoon Decoded 2024: Celebrating Our AI Community!

Welcome to HackerNoon Decoded: The Best of 2024 Tech Blogging

HackerNoon Decoded: The Top 10 Countries Where HackerNoon Is the Most Active

HackerNoon Decoded 2024: Celebrating Our Data Science Community!

HackerNoon Decoded 2024: Celebrating Our AI Community!

Welcome to HackerNoon Decoded: The Best of 2024 Tech Blogging

HackerNoon Decoded: The Top 10 Countries Where HackerNoon Is the Most Active

Light-Mode

Classic

Newspaper

Minty

Dark-Mode

Neon Noir

Minty

HN StartUps