Régression : Définition et signification — Wiki IA

Une tâche d'apprentissage automatique qui prédit une valeur numérique continue plutôt qu'une catégorie. « Quelle sera la température demain ? » (régression : prédire un nombre) vs. « Est-ce qu'il va pleuvoir demain ? » (classification : prédire une catégorie). La régression linéaire ajuste une droite ; la régression par réseau de neurones peut apprendre des relations non-linéaires arbitraires entre les entrées et les sorties.

Pourquoi c'est important

La régression est l'une des deux tâches fondamentales de l'apprentissage automatique (l'autre étant la classification) et sous-tend tout, de la prédiction du cours des actions à l'évaluation immobilière en passant par la modélisation scientifique. C'est aussi le point d'entrée le plus simple pour comprendre l'apprentissage automatique — ajuster une droite à des points de données, c'est quelque chose que la plupart des gens peuvent visualiser, et le saut de la régression linéaire aux réseaux de neurones est conceptuellement petit.

En profondeur

Régression linéaire : y = w1·x1 + w2·x2 + ... + biais. Trouver les poids qui minimisent la différence entre les valeurs prédites et réelles (généralement l'erreur quadratique moyenne). C'est le modèle d'apprentissage automatique le plus simple et il est encore largement utilisé quand les relations sont à peu près linéaires. La régression logistique (malgré son nom) est en fait de la classification — elle prédit des probabilités de catégories en appliquant une fonction sigmoïde à la sortie linéaire.

Régression par réseau de neurones

Remplace la fonction linéaire par un réseau de neurones et tu peux apprendre des relations arbitrairement complexes. La couche de sortie a un seul neurone sans fonction d'activation (ou une activation linéaire), et la fonction de perte est typiquement l'erreur quadratique moyenne ou l'erreur absolue moyenne. C'est utilisé pour : prédire des prix, estimer des délais, prévoir la demande, et toute tâche où la sortie est un nombre plutôt qu'une étiquette.

La régression dans les LLM

Fait intéressant, les LLM peuvent effectuer de la régression par le texte : « Étant donné ces caractéristiques de maison, prédis le prix » peut être géré en interrogeant un LLM. La recherche montre que les LLM performent étonnamment bien sur des tâches de régression simples, bien qu'ils soient moins fiables que des modèles de régression dédiés pour les applications nécessitant de la précision. Là où les LLM brillent, c'est quand la régression nécessite de comprendre un contexte non structuré : « Étant donné cet avis produit, prédis la note en étoiles » combine compréhension du texte et prédiction numérique.

Régression

Pourquoi c'est important

En profondeur

Régression par réseau de neurones

La régression dans les LLM

Concepts connexes