In der heutigen Welt haben wir dank leistungsstarker KI-Modelle wie   sowie Vision-Modellen und anderen ähnlichen Technologien Zugriff auf eine enorme Datenmenge. Allerdings kommt es bei diesen Modellen nicht nur auf die Menge der Daten an, sondern auch auf deren Qualität. Die schnelle und maßstabsgetreue Erstellung eines guten Datensatzes kann eine herausfordernde und kostspielige Aufgabe sein. ChatGPT  Hier kommt aktives Lernen ins Spiel.  Vereinfacht ausgedrückt zielt aktives Lernen darauf ab, die Annotation Ihres Datensatzes zu optimieren und das bestmögliche Modell mit der geringsten Menge an Trainingsdaten zu trainieren.  Es handelt sich um einen überwachten Lernansatz, der einen iterativen Prozess zwischen den Vorhersagen Ihres Modells und Ihren Daten beinhaltet. Anstatt auf einen vollständigen Datensatz zu warten, können Sie mit einem kleinen Stapel kuratierter annotierter Daten beginnen und Ihr Modell damit trainieren.  Mithilfe von aktivem Lernen können Sie dann Ihr Modell nutzen, um unsichtbare Daten zu kennzeichnen, die Genauigkeit von Vorhersagen zu bewerten und den nächsten Datensatz auszuwählen, der anhand von Erfassungsfunktionen mit Anmerkungen versehen werden soll.  Ein Vorteil des aktiven Lernens besteht darin, dass Sie das Konfidenzniveau der Vorhersagen Ihres Modells analysieren können.  Wenn eine Vorhersage ein geringes Vertrauen aufweist, fordert das Modell die Beschriftung zusätzlicher Bilder dieses Typs an. Andererseits erfordern Vorhersagen mit hoher Zuverlässigkeit nicht mehr Daten. Indem Sie insgesamt weniger Bilder mit Anmerkungen versehen, sparen Sie Zeit und Geld und erhalten gleichzeitig ein optimiertes Modell. Aktives Lernen ist ein vielversprechender Ansatz für die Arbeit mit großen Datensätzen.   Beim aktiven Lernen sind einige wichtige Punkte zu beachten.  Erstens beinhaltet es menschliche Anmerkungen, die Ihnen die Kontrolle über die Qualität der Vorhersagen Ihres Modells geben. Es ist keine Blackbox, die auf Millionen von Bildern trainiert wird. Sie beteiligen sich aktiv an seiner Entwicklung und helfen bei der Verbesserung seiner Leistung. Dieser Aspekt macht aktives Lernen wichtig und interessant, auch wenn dadurch die Kosten im Vergleich zu unbeaufsichtigten Ansätzen steigen können. Allerdings übersteigt die Zeitersparnis beim Training und Einsatz des Modells diese Kosten oft.  Darüber hinaus können Sie automatische Anmerkungstools verwenden und diese manuell korrigieren, was die Kosten weiter senkt.  Beim aktiven Lernen verfügen Sie über einen beschrifteten Datensatz, auf dem Ihr Modell trainiert wird, während der unbeschriftete Satz potenzielle Daten enthält, die noch nicht mit Anmerkungen versehen wurden. Ein entscheidendes Konzept sind die Abfragestrategien, die bestimmen, welche Daten gekennzeichnet werden sollen. Es gibt verschiedene Ansätze, um im großen Pool unbeschrifteter Daten die aussagekräftigsten Teilmengen zu finden. Bei der Unsicherheitsstichprobe geht es beispielsweise darum, Ihr Modell anhand unbeschrifteter Daten zu testen und die am wenigsten zuverlässig klassifizierten Beispiele für die Annotation auszuwählen.     , bei der mehrere Modelle, die jeweils auf einer anderen Teilmenge gekennzeichneter Daten trainiert werden, ein Komitee bilden. Diese Modelle haben unterschiedliche Perspektiven auf das Klassifizierungsproblem, ebenso wie Menschen mit unterschiedlichen Erfahrungen ein unterschiedliches Verständnis bestimmter Konzepte haben. Die zu kommentierenden Daten werden auf der Grundlage der Meinungsverschiedenheiten zwischen den Ausschussmodellen ausgewählt, was auf Komplexität hinweist. Dieser iterative Prozess wird fortgesetzt, während die ausgewählten Daten kontinuierlich mit Anmerkungen versehen werden. Eine weitere Technik des aktiven Lernens ist Query by Committee (QBC)  Dies ist nur eine grundlegende Erklärung des aktiven Lernens und zeigt ein Beispiel einer Abfragestrategie.  Bei Interesse kann ich weitere Informationen oder Videos zu anderen maschinellen Lernstrategien bereitstellen. Ein reales Beispiel für aktives Lernen ist das Beantworten von Captchas bei Google. Auf diese Weise helfen Sie ihnen, komplexe Bilder zu identifizieren und Datensätze mit dem gemeinsamen Input mehrerer Benutzer zu erstellen und so sowohl die Qualität der Datensätze als auch die Überprüfung durch den Menschen sicherzustellen. Wenn Sie also das nächste Mal auf ein Captcha stoßen, denken Sie daran, dass Sie zum Fortschritt von KI-Modellen beitragen!  Um mehr zu erfahren und ein praktisches Beispiel mit einem hervorragenden Tool zu sehen, das von meinen Freunden bei Encord entwickelt wurde, schauen Sie sich das Video an:   https://youtu.be/Zv6UzuwUBd4?embedable=true&transcript=true

The writer is smart, but don't just like, take their word for it. #DoYourOwnResearch before making any investment decisions or decisions regarding you health or security. (Do not regard any of this content as professional investment advice, or health advice)

Walkthroughs, tutorials, guides, and tips. This story will teach you how to do something new or how to do something better.

The is an opinion piece based on the author’s POV and does not necessarily reflect the views of HackerNoon.

This writer has a vested interested be it monetary, business, or otherwise, with 1 or more of the products or companies mentioned within.

Watch more on YouTube: https://www.youtube.com/c/WhatsAI

I explain Artificial Intelligence terms and news to non-experts.

2021 - HackerNoon Contributor of the Year - FACEBOOK

2022 - Best Data Science Newsletter

2022 - HackerNoon Contributor of the Year - Artificial Intelligence

2022 - HackerNoon Contributor of the Year - Computer Vision

2022 - HackerNoon Contributor of the Year - Data Science

Eine Einführung in aktives Lernen

About Author

KOMMENTARE

Hängeetiketten

DIESER ARTIKEL WURDE VORGESTELLT IN

Related Stories

HackerNoon Decoded 2024: Celebrating Our Management Community!

Meet Deepgram: HackerNoon Company of the Week

Starting 2025 with New Features: Settings Dashboard, HackerNoon Decoded, Updated Search UI, and More

HackerNoon Decoded: The Top 10 Countries Where HackerNoon Is the Most Active

HackerNoon Decoded 2024: Celebrating Our Management Community!

Meet Deepgram: HackerNoon Company of the Week

Starting 2025 with New Features: Settings Dashboard, HackerNoon Decoded, Updated Search UI, and More

HackerNoon Decoded: The Top 10 Countries Where HackerNoon Is the Most Active

Light-Mode

Classic

Newspaper

Minty

Dark-Mode

Neon Noir

Minty

HN StartUps