Zubnet AIApprendreWiki › Unsupervised Apprendreing
Training

Unsupervised Apprendreing

Une approche d'entraînement où le modèle trouve des patterns dans les données sans qu'on lui dise quoi chercher. Pas d'étiquettes, pas de bonnes réponses — juste des données brutes et un modèle qui découvre la structure par lui-même. Le clustering, la réduction de dimensionnalité et la détection d'anomalies sont des tâches non supervisées classiques. Le modèle regroupe les points de données similaires, trouve des représentations compressées ou identifie les outliers.

Pourquoi c'est important

La plupart des données du monde réel ne sont pas étiquetées — t'as des millions de transactions mais personne n'a tagué chacune comme « fraude » ou « pas fraude ». L'apprentissage non supervisé trouve dans ces données brutes des patterns qui seraient impossibles à découvrir manuellement. C'est aussi la base des embeddings, qui alimentent la recherche sémantique, les systèmes de recommandation et le RAG.

Deep Dive

Unsupervised learning encompasses a family of techniques. Clustering algorithms like K-means group similar data points together. Autoencoders learn compressed representations by encoding data to a small bottleneck and then reconstructing it. Dimensionality reduction (PCA, t-SNE, UMAP) projects high-dimensional data into 2D or 3D for visualization. What unites them is the absence of labels — the model defines its own notion of "similar" or "important" based on the data's statistical structure.

Where LLMs Fit

LLM pre-training is often called "self-supervised" rather than truly unsupervised, because the training signal comes from the data itself (predict the next token). But the spirit is unsupervised — no human annotator labels each token. The model discovers language structure, factual knowledge, reasoning patterns, and even some world knowledge purely from the statistical patterns in text. This is why pre-training requires such massive datasets: without labels to guide it, the model needs enormous amounts of data to discover meaningful patterns on its own.

Concepts liés

← Tous les termes
← Twelve Labs Upstage →