Dans le monde d'aujourd'hui, nous avons accès à une énorme quantité de données, grâce à de puissants modèles d'IA comme   , ainsi qu'à des modèles de vision et à d'autres technologies similaires. Cependant, il ne s'agit pas seulement de la quantité de données sur lesquelles ces modèles s'appuient, mais aussi de la qualité. Créer un bon ensemble de données rapidement et à grande échelle peut être une tâche difficile et coûteuse. ChatGPT  C'est là que l'apprentissage actif entre en jeu.  En termes simples, l'apprentissage actif vise à optimiser l'annotation de votre ensemble de données et à former le meilleur modèle possible en utilisant le moins de données d'apprentissage.  Il s'agit d'une approche d'apprentissage supervisé qui implique un processus itératif entre les prédictions de votre modèle et vos données. Au lieu d'attendre un ensemble de données complet, vous pouvez commencer avec un petit lot de données annotées organisées et former votre modèle avec.  Ensuite, à l'aide de l'apprentissage actif, vous pouvez tirer parti de votre modèle pour étiqueter des données invisibles, évaluer la précision des prédictions et sélectionner le prochain ensemble de données à annoter en fonction des fonctions d'acquisition.  L'un des avantages de l'apprentissage actif est que vous pouvez analyser le niveau de confiance des prédictions de votre modèle.  Si une prédiction est peu fiable, le modèle demandera des images supplémentaires de ce type à étiqueter. D'un autre côté, les prédictions avec une confiance élevée ne nécessiteront pas plus de données. En annotant globalement moins d'images, vous gagnez du temps et de l'argent tout en obtenant un modèle optimisé. L'apprentissage actif est une approche très prometteuse pour travailler avec des ensembles de données à grande échelle.   Il y a quelques points clés à retenir sur l'apprentissage actif.  Tout d'abord, cela implique une annotation humaine, vous permettant de contrôler la qualité des prédictions de votre modèle. Ce n'est pas une boîte noire dressée sur des millions d'images. Vous participez activement à son développement et contribuez à l'amélioration de ses performances. Cet aspect rend l'apprentissage actif important et intéressant, même s'il peut augmenter les coûts par rapport aux approches non supervisées. Cependant, le temps gagné dans la formation et le déploiement du modèle dépasse souvent ces coûts.  De plus, vous pouvez utiliser des outils d'annotation automatiques et les corriger manuellement, ce qui réduit encore les dépenses.  Dans l'apprentissage actif, vous disposez d'un ensemble de données étiqueté sur lequel votre modèle est formé, tandis que l'ensemble sans étiquette contient des données potentielles qui n'ont pas encore été annotées. Un concept crucial est celui des stratégies de requête, qui déterminent les données à étiqueter. Il existe différentes approches pour trouver les sous-ensembles les plus informatifs dans le grand pool de données non étiquetées. Par exemple, l'échantillonnage d'incertitude implique de tester votre modèle sur des données non étiquetées et de sélectionner les exemples classés les moins sûrs pour l'annotation.     , où plusieurs modèles, chacun formé sur un sous-ensemble différent de données étiquetées, forment un comité. Ces modèles ont des perspectives distinctes sur le problème de classification, tout comme les personnes ayant des expériences différentes ont des compréhensions différentes de certains concepts. Les données à annoter sont sélectionnées en fonction du désaccord entre les modèles de comité, ce qui indique la complexité. Ce processus itératif se poursuit alors que les données sélectionnées sont annotées en continu. Une autre technique d'apprentissage actif est la requête par comité (QBC)  Il s'agit simplement d'une explication de base de l'apprentissage actif, présentant un exemple de stratégie de requête.  Si vous êtes intéressé, je peux vous fournir plus d'informations ou des vidéos sur d'autres stratégies d'apprentissage automatique. Un exemple concret d'apprentissage actif est lorsque vous répondez à des captchas sur Google. Ce faisant, vous les aidez à identifier des images complexes et à créer des ensembles de données avec la contribution collective de plusieurs utilisateurs, garantissant à la fois la qualité de l'ensemble de données et la vérification humaine. Ainsi, la prochaine fois que vous rencontrerez un captcha, n'oubliez pas que vous contribuez à l'avancement des modèles d'IA !  Pour en savoir plus et voir un exemple pratique utilisant un excellent outil développé par mes amis d'Encord, regardez la vidéo :   https://youtu.be/Zv6UzuwUBd4?embedable=true&transcript=true

The writer is smart, but don't just like, take their word for it. #DoYourOwnResearch before making any investment decisions or decisions regarding you health or security. (Do not regard any of this content as professional investment advice, or health advice)

Walkthroughs, tutorials, guides, and tips. This story will teach you how to do something new or how to do something better.

The is an opinion piece based on the author’s POV and does not necessarily reflect the views of HackerNoon.

This writer has a vested interested be it monetary, business, or otherwise, with 1 or more of the products or companies mentioned within.

Watch more on YouTube: https://www.youtube.com/c/WhatsAI

I explain Artificial Intelligence terms and news to non-experts.

2021 - HackerNoon Contributor of the Year - FACEBOOK

2022 - Best Data Science Newsletter

2022 - HackerNoon Contributor of the Year - Artificial Intelligence

2022 - HackerNoon Contributor of the Year - Computer Vision

2022 - HackerNoon Contributor of the Year - Data Science

Une introduction à l'apprentissage actif

About Author

COMMENTAIRES

ÉTIQUETTES

CET ARTICLE A ÉTÉ PARU DANS

Related Stories

Libérer la puissance de l’IA. Une revue systématique des techniques de pointe : résumé et introduction

HackerNoon Decoded: The Top 10 Countries Where HackerNoon Is the Most Active

Valhalla de Floki se joint en tant que sponsor associé de la tournée indienne au Sri Lanka

Les couches invisibles : pourquoi les entretiens avec les utilisateurs sont un atout irremplaçable

Libérer la puissance de l’IA. Une revue systématique des techniques de pointe : résumé et introduction

HackerNoon Decoded: The Top 10 Countries Where HackerNoon Is the Most Active

Valhalla de Floki se joint en tant que sponsor associé de la tournée indienne au Sri Lanka

Les couches invisibles : pourquoi les entretiens avec les utilisateurs sont un atout irremplaçable

Light-Mode

Classic

Newspaper

Minty

Dark-Mode

Neon Noir

Minty

HN StartUps