Zubnet AIApprendreWiki › Date de coupure des connaissances
Fondamentaux

Date de coupure des connaissances

Aussi appelé : Coupure des données d'entraînement, date de connaissance
La date après laquelle un modèle n'a pas de données d'entraînement, ce qui signifie qu'il manque de connaissances sur les événements, découvertes ou changements survenus après cette date. Si la coupure d'un modèle est avril 2024, il ne sait rien de ce qui s'est passé en mai 2024 ou après — nouveaux produits, actualités, articles scientifiques ou faits mis à jour.

Pourquoi c'est important

La date de coupure est la source de frustration la plus courante avec les assistants IA. « Pourquoi ne connaît-il pas X ? » Parce que X est arrivé après l'entraînement. Cette limitation pousse à l'adoption du RAG (donner au modèle accès à l'information actuelle) et à l'utilisation d'outils (laisser le modèle chercher sur le web). Comprendre la coupure t'aide à savoir quand faire confiance au modèle et quand vérifier.

En profondeur

La coupure existe parce que les données d'entraînement doivent être collectées, nettoyées et traitées avant que l'entraînement ne commence — un processus qui prend des semaines à des mois. Un modèle sorti en 2025 pourrait avoir une date de coupure fin 2024. L'écart entre la coupure et la sortie représente le temps de traitement. Certains fournisseurs font des « mises à jour de connaissances » supplémentaires par ajustement fin sur des données plus récentes, mais elles sont typiquement limitées (actualités, lancements de produits) plutôt que complètes.

Pas un mur dur

La coupure n'est pas parfaitement nette. Les données d'entraînement incluent souvent du contenu publié sur une plage de dates, et les scrapes web peuvent inclure des pages mises à jour à différents moments. Un modèle pourrait connaître certaines choses d'après sa coupure « officielle » à cause de la collecte de données chevauchante. Il pourrait aussi avoir des lacunes de connaissances d'avant la coupure si certaines sources n'ont pas été incluses. La date de coupure est un guide approximatif, pas une frontière précise.

Contourner la limitation

Trois approches adressent la limitation de la coupure : le RAG (récupérer des documents actuels et les inclure dans le prompt), les outils de recherche web (laisser le modèle chercher l'information actuelle), et les mises à jour régulières du modèle (réentraînement ou ajustement fin sur des données récentes). En pratique, la plupart des applications en production utilisent le RAG ou l'utilisation d'outils plutôt que de se fier uniquement aux connaissances internes du modèle, même pour l'information dans la période d'entraînement, parce que les connaissances paramétriques du modèle peuvent être imprécises même pour ce qu'il « sait ».

Concepts connexes

← Tous les termes
← Décodage spéculatif Decart AI →