Si tu as déjà hérité d'un point de contrôle fine-tuné sans moyen propre de vérifier d'où il venait, le nouveau Model Provenance Kit de Cisco vise précisément ce trou. Publié comme outil Python open-source avec CLI, MPK prend l'empreinte des modèles au niveau des poids — il examine les métadonnées d'architecture, la structure du tokenizer et les poids appris eux-mêmes pour déterminer si deux transformeurs partagent une origine commune.

L'outil offre deux modes. Compare produit une analyse détaillée de similarité entre deux modèles. Scan compare un modèle unique à une base d'empreintes initiale couvrant environ 150 modèles de base répartis sur 45 familles et 20 éditeurs, avec des paramètres allant de 135M à plus de 70B. C'est une posture différente de celle des projets d'attestation style sigstore comme sigstore/model-transparency, qui signent les artefacts au moment de la publication. L'approche de Cisco présume que l'artefact est déjà entre tes mains et qu'il faut récupérer la lignée à partir des poids — utile quand la signature en amont n'a jamais été faite ou qu'un modèle arrive sans documentation.

L'empreinte au niveau des poids comble une lacune que la signature seule ne couvre pas. Chaque fine-tune, chaque fusion LoRA, chaque fork non crédité dans un pull HuggingFace est un endroit où la lignée se perd. Les régulateurs qui s'appuient sur les exigences de provenance du AI Act européen, les équipes de sécurité qui scannent à la recherche de modèles de base empoisonnés, la réponse aux incidents après une CVE en amont — tous ont besoin d'un moyen de demander « c'est quoi ce modèle, vraiment? » sans faire confiance à un manifeste. C'est le genre d'infrastructure que l'économie des wrappers a discrètement laissé manquer : pas un nouveau modèle, mais un moyen de savoir sur quoi tu t'appuies.

Si tu livres quoi que ce soit qui ingère des modèles tiers — plateformes IA internes, marketplaces de modèles, services de fine-tune — clone le repo, lance Scan sur ton inventaire et regarde ce qui ressort. La base d'empreintes en est aux 150 premiers; la valeur s'accumule à mesure que des contributeurs ajoutent. Si tu publies des modèles de base, contribuer des empreintes est la façon dont l'écosystème devient honnête sur la lignée.