GitHub Copilot 1 जून 2026 को per-token बिलिंग पर जा रहा है, "Premium Requests" फ़्लैट-रेट मॉडल को ख़त्म कर रहा है जो coding-agent कॉल्स को एक तय मासिक भत्ते में बंडल करता था। नई संरचना में, $10/महीना Copilot Pro 1,000 AI Credits में बदल जाता है, जहाँ एक क्रेडिट मौजूदा दर पर एक US सेंट के बराबर है। कोड completions और Next Edit सुझाव मुफ़्त रहते हैं; बाक़ी सब — Chat, agent runs, मॉडल चयन — मीटर पर आता है।
यह बदलाव मायने रखता है क्योंकि पुराना मॉडल दोनों तरफ़ से दुरुपयोग हो रहा था। कई घंटे का स्वायत्त-agent कार्य एक Premium Request गिनता था; एक तुच्छ Q&A भी एक ही गिनता था। नया मॉडल लागत को असली token वॉल्यूम से बाँधता है — input, output, cache hits, और फ़ीचर प्रकार — दरें मॉडल के हिसाब से बदलती हैं। GitHub ने प्रति-मॉडल रेट कार्ड प्रकाशित नहीं किया है, पर मतलब सीधा है: Claude-Sonnet-श्रेणी के agent runs पर प्रति क्रेडिट लागत Haiku-श्रेणी completions से अधिक होगी, और जिस भी टीम ने "Premium Request" abstraction के इर्द-गिर्द workflows बनाए हैं, उसे अब seat खर्च के बजाय token खर्च मॉडल करना होगा। प्रभावी तिथि: 1 जून 2026।
यह wrapper economy अपने ही बुनियादी ढाँचे को पकड़ रही है। फ़्लैट-रेट dev tools तब व्यवहार्य थे जब API लागतें VC द्वारा भारी रूप से सब्सिडी में थीं और जब agent stack पतला था। Reasoning मॉडल और लंबे-रन agent traces ने वह गणित तोड़ दिया — जटिल refactor पर 100K-token rollouts करता एक coding agent वास्तव में 200-token completion से एक अलग लागत आकार है। GitHub का लागत pass-through ईमानदार pricing है; यह उन tools के लिए एक प्रतिस्पर्धी मौक़ा भी है जो फ़्लैट-रेट या self-hosted विकल्प देते हैं, क्योंकि Copilot लाइन-आइटम वाली हर dev shop को अभी एक बजट सरप्राइज़ मिला है।
अगर आप Copilot को अपने stack में कोड डिलीवर करने के लिए use करते हैं, 1 जून से पहले instrumentation करें: नई दरों पर token खर्च का अनुमान लगाने के लिए Chat, agent, और tool-use volumes log करें। अगर GitHub से साफ़ अनुमान नहीं मिलता, पहले महीने प्रति developer कठोर credit cap लगाएँ और adjust करें। ओपन-वेट मॉडलों के साथ self-hosted Continue ops क्षमता वाली shops के लिए एक विश्वसनीय विकल्प है। बाक़ी सबके लिए, उत्तर वही है जो हमेशा होता है जब per-call meter आता है: पहले मापें, उन loops को optimize करें जो बिल को हिलाते हैं।
