Édition de connaissances : Définition et signification — Wiki IA

Des techniques pour modifier des faits spécifiques dans un modèle entraîné sans le réentraîner. Si un modèle affirme incorrectement "Le président de la France est Macron" après une nouvelle élection, l'édition de connaissances peut mettre à jour ce fait spécifique en modifiant des poids ciblés, sans affecter les autres connaissances ou capacités du modèle. L'objectif est la précision chirurgicale : changer un fait, laisser tout le reste intact.

Pourquoi c'est important

L'édition de connaissances répond à un problème pratique : les modèles deviennent obsolètes, et le réentraînement est coûteux. Si tu pouvais mettre à jour des faits spécifiques à moindre coût, les modèles pourraient rester à jour entre les grandes phases d'entraînement. Il y a aussi des implications de sécurité : pourrait-on retirer des connaissances dangereuses ? Le domaine est prometteur mais immature — les éditions ont souvent des effets secondaires imprévus sur les connaissances connexes.

En profondeur

L'approche dominante (ROME/MEMIT) : identifier quels poids du réseau feedforward encodent un fait spécifique en traçant l'effet causal des neurones sur la prédiction du modèle, puis modifier ces poids pour changer l'association stockée. Par exemple, pour mettre à jour "La tour Eiffel est à Paris" en "La tour Eiffel est à Londres", tu trouves les poids qui associent "tour Eiffel" → "Paris" dans les couches FFN et tu les rediriges vers "Londres".

Le problème de l'effet d'entraînement

Éditer "La tour Eiffel est à Londres" devrait aussi changer les réponses à "Dans quel pays est la tour Eiffel ?" (Royaume-Uni, pas la France) et "Quels monuments sont à Paris ?" (plus la tour Eiffel). Les méthodes d'édition actuelles échouent souvent sur ce point : elles changent le fait direct mais laissent les inférences liées incohérentes. Ce problème d'"effet d'entraînement" suggère que les connaissances dans les LLM sont plus interconnectées que la métaphore de l'édition chirurgicale ne le laisse entendre.

Défis de mise à l'échelle

Quelques éditions fonctionnent raisonnablement bien. Des centaines d'éditions commencent à dégrader la qualité du modèle — les poids édités accumulent des changements qui interfèrent entre eux et avec les connaissances non éditées. Cela limite l'utilisation pratique de l'édition de connaissances : c'est acceptable pour quelques corrections mais ne peut pas servir de mécanisme général de mise à jour de modèle. Pour rester à jour, le RAG (fournir des informations actualisées au moment de l'inférence) reste plus pratique que l'édition des poids du modèle.

Édition de connaissances

Pourquoi c'est important

En profondeur

Le problème de l'effet d'entraînement

Défis de mise à l'échelle

Concepts connexes