Shopify a drastiquement réduit ses coûts d'inférence d'IA de 75x tout en doublant la qualité de sortie en remplaçant leur système d'extraction de données marchandes basé sur GPT par un framework multi-agent construit sur DSPy et Qwen 3. Le géant du commerce électronique est passé d'une approche à prompt unique utilisant GPT-5 à un système multi-agent sophistiqué qui coordonne des agents d'IA spécialisés pour différentes tâches d'extraction de données.

Ceci représente une validation significative des modèles open-source dans les charges de travail de production où le coût et la performance comptent plus que les noms de marque. Les résultats de Shopify montrent comment une conception système réfléchie—utilisant le framework de prompting structuré de DSPy avec plusieurs agents coordonnés—peut débloquer de meilleures performances de modèles plus petits et moins chers que d'utiliser des modèles frontière coûteux sur des problèmes à coup unique. La réduction de coût de 75x n'est pas seulement une question de prix de modèle; elle démontre comment les choix architecturaux peuvent fondamentalement remodeler l'économie de l'IA.

Avec seulement une source couvrant ce développement, des détails techniques clés restent flous—spécifiquement comment Shopify a structuré leur coordination d'agents, quels types de données marchandes ils extraient, et comment ils ont mesuré les améliorations de qualité. Le manque de couverture plus large suggère soit des résultats en phase précoce ou un contrôle délibéré de l'information autour de ce qui pourrait être des avantages d'infrastructure compétitifs.

Pour les développeurs construisant des systèmes d'IA de production, l'approche de Shopify offre un plan directeur: investir dans des frameworks d'orchestration comme DSPy plutôt que de s'appuyer sur des appels de modèle monolithiques. La combinaison de modèles open-source avec du prompting sophistiqué et de la coordination d'agents devient une alternative viable aux appels API coûteux pour des cas d'usage spécifiques où vous pouvez contrôler toute la pile.