Knowledge Cutoff: परिभाषा और अर्थ — AI विकी

वह तिथि जिसके बाद model के पास कोई training data नहीं है, यानी उसे उस तिथि के बाद घटित events, discoveries, या changes का ज्ञान नहीं है। यदि किसी model का cutoff अप्रैल 2024 है, तो उसे मई 2024 या बाद में हुई किसी भी चीज़ के बारे में पता नहीं है — नए products, समाचार events, वैज्ञानिक papers, या updated facts।

यह क्यों मायने रखता है

Knowledge cutoff AI assistants के साथ frustration का सबसे आम स्रोत है। "यह X के बारे में क्यों नहीं जानता?" क्योंकि X training के बाद हुआ। यह सीमा RAG (model को वर्तमान जानकारी तक पहुंच देना) और tool use (model को web search करने देना) को अपनाने को प्रेरित करती है। Cutoff को समझने से आपको पता चलता है कि model पर कब भरोसा करना है और कब verify करना है।

गहन अध्ययन

Cutoff इसलिए है क्योंकि training data को training शुरू होने से पहले collect, clean, और process किया जाना चाहिए — एक प्रक्रिया जिसमें हफ्ते से महीने लगते हैं। 2025 में release हुए model का training data cutoff late 2024 का हो सकता है। Cutoff और release के बीच का gap processing time को दर्शाता है। कुछ providers अधिक हालिया data पर fine-tuning के माध्यम से अतिरिक्त "knowledge updates" करते हैं, लेकिन ये आमतौर पर संकीर्ण (news events, product launches) होते हैं बजाय comprehensive के।

एक कठोर दीवार नहीं

Cutoff पूरी तरह साफ नहीं है। Training data में अक्सर तिथियों की एक range में published content शामिल होता है, और web scrapes में विभिन्न समय पर last updated pages शामिल हो सकते हैं। Model अपने "official" cutoff के बाद की कुछ चीज़ें जान सकता है क्योंकि overlapping data collection होती है। Cutoff से पहले के ज्ञान में भी gaps हो सकती हैं यदि कुछ sources शामिल नहीं किए गए। Cutoff date एक rough guide है, precise boundary नहीं।

इसके आसपास काम करना

Cutoff limitation को address करने के तीन दृष्टिकोण: RAG (वर्तमान documents retrieve करें और prompt में शामिल करें), web search tools (model को वर्तमान जानकारी खोजने दें), और नियमित model updates (recent data पर retraining या fine-tuning)। व्यवहार में, अधिकांश production applications training period के भीतर की जानकारी के लिए भी model के internal knowledge पर पूरी तरह निर्भर होने के बजाय RAG या tool use का उपयोग करती हैं, क्योंकि model का parametric knowledge उन चीज़ों के लिए भी imprecise हो सकता है जिन्हें वह "जानता" है।

Knowledge Cutoff

यह क्यों मायने रखता है

गहन अध्ययन

एक कठोर दीवार नहीं

इसके आसपास काम करना

संबंधित अवधारणाएँ