paint-brush
Fonctions de base radiales : types, avantages et cas d'utilisationpar@sanjaykn170396
11,830 lectures
11,830 lectures

Fonctions de base radiales : types, avantages et cas d'utilisation

par Sanjay Kumar6m2023/01/24
Read on Terminal Reader

Trop long; Pour lire

Cet article explique l'intuition de base, l'idée mathématique et la portée de la fonction de base radiale dans le développement de modèles d'apprentissage automatique prédictifs. La fonction Base radiale est une fonction mathématique qui prend une entrée à valeur réelle et génère une sortie à valeur réelle basée sur la distance entre la valeur d'entrée projetée dans l'espace à partir d'un point fixe imaginaire placé ailleurs. Cette fonction est couramment utilisée dans de nombreux algorithmes d'apprentissage automatique et d'apprentissage en profondeur.
featured image - Fonctions de base radiales : types, avantages et cas d'utilisation
Sanjay Kumar HackerNoon profile picture


Il s'agit d'un article d'introduction expliquant l'intuition de base, l'idée mathématique et la portée des fonctions de base radiale dans le développement de modèles d'apprentissage automatique prédictifs.


Table des matières

  1. Introduction
  2. Intuition de base d'une fonction de base radiale
  3. Types de fonction de base radiale
  4. Le concept du Réseau RBF
  5. Portée et avantages du RBF
  6. Conclusion
  7. Références

Introduction

Dans l'apprentissage automatique, la résolution de problèmes basée sur des algorithmes basés sur des hyperplans dépend fortement de la distribution des points de données dans l'espace. Cependant, c'est un fait connu que les données du monde réel suivent rarement des hypothèses théoriques.


Il existe de nombreuses fonctions de transformation qui peuvent convertir la forme naturelle des points de données en distributions théoriquement recommandées en persévérant dans les modèles cachés des données. Radial Basis est l'une de ces fonctions renommées qui est abordée dans de nombreux manuels d'apprentissage automatique. Dans cet article, nous découvrirons l'intuition de base, les types et l'utilisation de la fonction de base radiale.

L'intuition de base d'une fonction de base radiale

La fonction de base radiale est une fonction mathématique qui prend une entrée à valeur réelle et génère une sortie à valeur réelle basée sur la distance entre la valeur d'entrée projetée dans l'espace à partir d'un point fixe imaginaire placé ailleurs.


Cette fonction est couramment utilisée dans de nombreux algorithmes d'apprentissage automatique et d'apprentissage en profondeur tels que les machines à vecteurs de support, les réseaux de neurones artificiels, etc.


Comprenons le concept et l'utilisation de cette fonction mathématique.

En temps réel, chaque fois que nous résolvons des problèmes complexes d'apprentissage automatique à l'aide d'algorithmes tels que SVM, nous devons projeter tous nos points de données dans un espace multidimensionnel imaginaire où chaque caractéristique sera une dimension.


Supposons que nous ayons un problème de classification pour prédire si un étudiant réussira ou échouera à l'examen.


Nous avons les caractéristiques suivantes comme variables indépendantes :


  • Notes aux examens internes
  • Marques dans les projets
  • Pourcentage de fréquentation


Ainsi, ces 3 variables indépendantes deviennent 3 dimensions d'un espace comme celui-ci-

Source image : Illustré par l'auteur


Considérons que nos points de données ressemblent à ceci où-

  • La couleur verte représente les étudiants qui ont réussi l'examen

  • La couleur rouge représente les étudiants qui ont échoué à l'examen

    Source image : Illustré par l'auteur


    Maintenant, SVM va créer un hyperplan qui parcourt ces 3 dimensions afin de différencier les élèves ayant échoué et réussis-

    Source image : Illustré par l'auteur


Donc, techniquement maintenant, le modèle comprend que tous les points de données qui tombent d'un côté de l'hyperplan appartiennent aux étudiants qui ont réussi les examens et vice versa.


Dans notre exemple, il était facile de créer l'hyperplan car un hyperplan linéaire et droit suffisait à discriminer les 2 catégories. Mais dans les projets complexes en temps réel, ces relations peuvent être violées dans de nombreux scénarios. Surtout lorsque vous avez des centaines de variables indépendantes, il n'y a aucune possibilité d'obtenir une relation linéaire entre les points de données de sorte qu'il sera difficile de créer un hyperplan optimal.


Dans de tels scénarios, les chercheurs appliquent généralement la fonction de base radiale à chacun des points de données afin qu'ils puissent passer un hyperplan linéaire à travers les points de données pour résoudre facilement le problème.


Considérez que nos points de données ressemblent à ceci dans l'espace-

Source image : Illustré par l'auteur


Il est clair que nous ne pouvons pas utiliser un hyperplan linéaire tel qu'il puisse regrouper les points de données selon leurs classes.


RBF nous aidera dans ce genre de scénarios.


Certains chercheurs projetteront généralement ces points de données dans des dimensions beaucoup plus élevées afin que la distance entre les points de données augmente afin qu'ils puissent appliquer une fonction (RBF ou toute autre fonction) pour construire un hyperplan. Mais il n'est pas nécessaire de construire des dimensions élevées puisque c'est toujours la décision du statisticien/chercheur qui comprend les modèles dans les données.


Ensuite, nous devons marquer un point imaginaire dans l'espace comme celui-ci là où nous en avons besoin.

Source image : Illustré par l'auteur


Après cela, nous devons dessiner des cercles concentriques basés sur ce point imaginaire.


Source image : Illustré par l'auteur
La distance entre le centre et tout point de données positionné dans la limite du cercle s'appelle le rayon.
Source image : Illustré par l'auteur

Après avoir calculé le rayon, nous devons passer cette valeur dans une fonction mathématique (RBF) qui renverra une valeur réelle. La valeur renvoyée sera l'amplitude transformée d'un point de données particulier utilisé pour d'autres procédures.


Types de fonctions de base radiales

Il existe plusieurs types de fonctions de base radiale. Chacun d'eux transformera la valeur d'entrée d'une manière différente. Certains d'entre eux sont-


Fonction de base radiale multiquadratique


Source image : Illustré par l'auteur

Où,

  • r est le rayon
  • ε est une constante


La fonction ressemblera à ceci par rapport au temps,

Source de l'image : référence 1


Fonction de base radiale multiquadrique inverse


Source image : Illustré par l'auteur

Où,

  • r est le rayon
  • ε est une constante


Source de l'image : référence 1

Fonction de base radiale gaussienne

Source image : Illustré par l'auteur Où,

  • r est le rayon
  • ε est une constante


Source de l'image : référence 1


J'expliquerai intuitivement ce que ces fonctions feront intuitivement dans l'espace. Il y a 2 processus différents qui sont effectués par ces fonctions-


  • Étendre les points de données dans le sens horizontal
  • Compression des points de données dans le sens vertical


Le processus d'expansion ressemblera visuellement à ceci-

Source image : Illustré par l'auteur


Le processus de compression ressemblera visuellement à ceci-

Source image : Illustré par l'auteur


Après l'expansion et la compression, les points de données auraient été transformés comme ceci-

Source image : Illustré par l'auteur


Maintenant, nous pouvons facilement construire un hyperplan linéaire qui peut classer les points de données comme ceci-
Source image : Illustré par l'auteur

Le concept du réseau RBF

Parfois, RBF est également utilisé avec des réseaux de neurones artificiels avec une couche cachée. Dans de tels types de réseaux, RBF sera utilisé comme fonctions d'activation dans les couches cachées. Outre la couche cachée, il y aura une couche d'entrée qui contient plusieurs neurones où chacun d'eux représente une variable de caractéristique et la couche de sortie aura une somme pondérée des sorties de la couche cachée pour former les sorties du réseau.


Source image : Illustré par l'auteur


Ces réseaux sont appelés réseaux RBF.

Portée et avantages du RBF

  • Avec l'aide de la fonction RBF, il est possible de résoudre les problèmes dans les ensembles de données qui ont des distributions non linéaires complexes.
  • La fonction RBF a une forte tolérance au bruit d'entrée
  • Dans le réseau de neurones RBF, il n'y aura qu'une seule couche cachée très facile à gérer.
  • Les modèles cachés dans la distribution peuvent être mieux généralisés après l'application de la fonction RBF.
  • Dans le réseau de neurones RBF, nous pouvons facilement interpréter quelle est la signification/fonction de chaque nœud dans la couche cachée du RBNN. Ceci est difficile dans la perception multicouche.
  • Certains des hyperparamètres présents dans le perceptron multicouche tels que le nombre de nœuds dans la couche cachée, le nombre de couches cachées, etc. sont difficiles à optimiser. Mais ceux-ci ne se trouvent pas dans les réseaux de neurones RBF.

Conclusion

Dans cet article, nous avons discuté de l'une des fonctions de transformation les plus utiles en apprentissage automatique. J'ai essayé d'expliquer ce concept compliqué sans de nombreux calculs mathématiques approfondis de manière lucide ciblant les débutants dans l'espace d'apprentissage AIML.


Cette fonction est disponible en tant que bibliothèque intégrée dans la plupart des langages de programmation orientés science des données tels que Python ou R. Par conséquent, il est facile de l'implémenter une fois que vous avez compris l'intuition théorique. J'ai ajouté les liens vers certains des matériaux avancés dans la section des références où vous pouvez approfondir les calculs complexes si vous êtes intéressé.

Références

  1. Fonctions de base radiales - Wikipédia
  2. Réseaux à fonction de base radiale Archivé le 23/04/2014 sur la Wayback Machine
  3. Tête de balai, David H. ; Lowe, David (1988)."Interpolation fonctionnelle multivariable et réseaux adaptatifs" (PDF) . Systèmes complexes . 2 : 321–355. Archivé de l'original (PDF) le 14/07/2014.
  4. Michael JD Powell (1977). "Procédures de redémarrage pour la méthode du gradient conjugué". Programmation mathématique . 12 (1): 241–254. doi : 10.1007/bf01593790 . S2CID 9500591 .
  5. Sahin, Ferat (1997). Une approche par fonction de base radiale d'un problème de classification d'images couleur dans une application industrielle en temps réel (M.Sc.). Virginie Tech . p. 26. manche : 10919/36847 . Les fonctions à base radiale ont été introduites pour la première fois par Powell pour résoudre le vrai problème d'interpolation multivariée.