abonnieren Sie zuerst meinen Twitter , ich tweete technische Sachen
Noch ein Speedrun in der Serie , los gehts
Ich habe gerade das Meme des bestärkenden Lernens (RL) bei Ihnen angewendet:
Was für ein Köder das war... oh mein Gott...
Warum ist es für Meme-Kelvin also so schwer zu lernen, was RL ist? Weil er die Implementierung von RL lernen möchte , anstatt das Konzept zu verstehen . DESHALB IST MEME-KELVIN!
Wenn Sie etwas Neues, ein neues Werkzeug, eine neue Technologie oder irgendetwas anderes lernen, beginnen Sie NICHT mit der Implementierung, sondern mit Ideen, Konzepten und Problemen, die das Werkzeug löst!
Wo Kelvin, hier ist es: Um Reinforcement Learning (RL) zu verstehen, denken Sie an ein Videospiel, bei dem Sie Punkte bekommen, wenn Sie die richtigen Züge machen.
Beim bestärkenden Lernen funktioniert das so: Ein Programm lernt, indem es Entscheidungen trifft und Belohnungen oder Strafen auf der Grundlage seiner Aktionen erhält.
Dies war nur ein Beispiel für die Anwendung des START-WITH-IDEAS-Prinzips auf Reinforcement Learning. Aber ich habe versprochen, Ihnen zu erklären, wie man das gesamte ML in 52 Sekunden lernt ...
Um ML in 52 Sekunden zu lernen , lernen Sie die ML-Konzepte, nicht die Implementierungen , dann googeln (oder GPT) Sie nach Implementierungen in PyTorch oder einer beliebigen Bibliothek. Es wird sich im nächsten Jahr auf jeden Fall ändern, und das ist in Ordnung, die Ideen werden noch viel länger dieselben bleiben – holen Sie sich Ideen!
Beim überwachten Lernen wird ein Programm anhand von Beispielen mit Antworten (sogenannte markierte Daten) unterrichtet. Dadurch lernt das Programm die Verbindung zwischen den Beispielen und Antworten, sodass es die Antworten für neue Beispiele erraten kann, die es noch nicht gesehen hat.
Algorithmen und zu lösende Probleme: Vorhersage von Immobilienpreisen (lineare Regression), Entscheidung, ob ein Kunde ein Produkt kaufen wird (Entscheidungsbäume)
Dabei betrachtet das Programm Beispiele ohne Antworten (unbeschriftete Daten) und versucht, darin Muster oder Gruppen zu finden. Dies kann bei Aufgaben wie der Gruppierung ähnlicher Elemente oder der Reduzierung der zur Beschreibung der Daten erforderlichen Informationsmenge hilfreich sein.
Zu lösende Algorithmen und Probleme: Gruppieren von Personen mit ähnlichem Musikgeschmack (k-Means-Clustering), Komprimieren von Bildern ohne zu viele Informationen zu verlieren (Hauptkomponentenanalyse)
Beim bestärkenden Lernen lernt das Programm, Entscheidungen zu treffen, indem es Dinge ausprobiert und Feedback in Form von Belohnungen oder Strafen erhält. Ziel ist es, mit der Zeit bessere Entscheidungen zu treffen und Probleme effektiver zu lösen.
Algorithmen und zu lösende Probleme: Einem Roboter das Laufen beibringen (Q-Learning), einem Programm das Schachspielen beibringen (Policy-Gradient-Methoden)
Dabei werden aus Rohdaten wichtige Informationen (Features) ausgewählt, die dem Programm helfen, besser zu lernen. Manchmal beinhaltet dies auch die Erstellung neuer Features unter Einsatz von Fachwissen und Kreativität.
Beispiel: Länge und Breite eines Blattes helfen bei der Bestimmung einer Pflanzenart
Um zu sehen, ob ein Machine-Learning-Modell gut funktioniert, muss man prüfen, wie gut es funktioniert. Um die Leistung eines Modells zu prüfen, werden häufig Messwerte wie Genauigkeit, Präzision, Rückruf, F1-Score und mittlerer quadrierter Fehler verwendet.
⏲️ Noch 24 Sekunden, alles gut!
Lassen Sie uns auch Deep Learning behandeln!
Das ist wirklich abstrakt. Sie können sich ein neuronales Netzwerk als Gehirnneuronen vorstellen, die in Spalten angeordnet sind und sich gegenseitig von links nach rechts mit unterschiedlicher Kraft (über Verbindungen) anpingen – die Kraft, mit der ein Neuron (in jeder Schicht) angepingt wird, definiert den nächsten Ping und damit das Endergebnis selbst.
Algorithmen und zu lösende Probleme: Erkennen von Objekten in Bildern (Feedforward-Neuralnetze), Übersetzen von Sprachen (Radial-Basis-Funktionsnetze)
Wenn Sie einen Fehler machen, lernen Sie daraus und versuchen, ihn nicht zu wiederholen. Backpropagation ist eine Möglichkeit für ein Programm, dasselbe zu tun.
Dadurch erkennt das Programm, wo der Fehler lag, und kann besser die richtigen Antworten finden.
CNNs sind spezielle neuronale Netzwerke, die gitterartige Daten, wie etwa Bilder, verstehen können.
Sie verfügen über Ebenen, die ihnen dabei helfen, Muster zu lernen und Bildteile wie Linien und Formen zu erkennen.
Zu lösende Algorithmen und Probleme: Erkennen von Gesichtern in Fotos (LeNet-5), Identifizieren verschiedener Tierarten in Bildern (AlexNet, VGG)
RNNs sind für die Arbeit mit Daten konzipiert, die in einer Sequenz vorliegen, etwa einer Reihe von Zahlen oder Wörtern.
Sie können sich an vorherige Eingaben erinnern und diese Informationen nutzen, um bessere Entscheidungen zu treffen.
Zu lösende Algorithmen und Probleme: Vorhersage von Aktienkursen (Long Short-Term Memory, LSTM), Generieren von Text basierend auf einem bestimmten Stil (Gated Recurrent Units, GRU)
Dabei wird ein Programmmodell, das bereits viel gelernt hat, für eine neue Aufgabe mit begrenzten Daten optimiert.
Dadurch lernt das Programm schneller und erzielt bessere Ergebnisse, weil es aus seinen vorherigen Lernvorgängen bereits nützliche Dinge weiß.
Beispiel: Verwendung eines auf viele Hunderassen trainierten Modells (wie ResNet) zur Erkennung bestimmter Katzenarten
Diese Techniken helfen dem Programm, zu viel aus den Daten zu lernen, was zu Problemen wie Überanpassung führen kann.
beendet in: 0 min, 52 sek
Das ist im Grunde alles. Gehen Sie jetzt los und trainieren Sie Ihre Agenten, Kelvin, indem Sie nach Implementierungen für die Algorithmen und Probleme googeln, die Sie lösen möchten!
Um ein Tool zu verwenden, beginnen Sie mit einem Problem, das das Tool löst, und lernen, welche Konzepte zur Lösung des Problems verwendet werden. Behalten Sie die Implementierung nicht im Kopf, wie „wie man etwas mit einem Tool macht“, das ist kompliziert und alles passt sowieso nicht in Ihren Kopf.
Lernen Sie Ideen kennen und googeln Sie nach Implementierungen.
Nachdem Sie 5 bis 10 Mal nach einer Implementierung gegoogelt haben, werden Sie sie auswendig lernen. Dann wird die Technologie obsolet und Sie vergessen sie. Das ist ok, das passiert ständig.
Ideen vergisst man nur schwer, sie bleiben lange im Gedächtnis
Tschüß und bis zum nächsten Drag Race
Warte, Akshually!
Wenn Sie möchten, dass die Bildungssysteme praxisorientiert und nutzbringend sind, sollten Sie dem Twit Bird folgen <3
Wie auch immer, Sie können Twitter folgen, wenn Ihnen der Text gefallen hat und Sie mehr wollen oder wenn Sie süchtig nach Spaß in sozialen Netzwerken sind
oder folge niemandem und hör auf niemanden! Gehe deinen eigenen Weg!
Ich möchte tatsächlich, dass Sie meinen Tweets folgen, es war nur ein Verkauf.
Sehen Sie sich mein „REACT in 43 Sekunden lernen“ an.