Extractive summarization TextRank (PageRank से प्रेरित graph-आधारित algorithm) या BERT-आधारित वाक्य scoring जैसी तकनीकों का उपयोग करके सबसे महत्वपूर्ण वाक्यों की पहचान करता है। सारांश मूल वाक्यों का उपसमूह होता है, जो तथ्यात्मक सटीकता की गारंटी देता है लेकिन अजीब, असंबद्ध टेक्स्ट उत्पन्न कर सकता है। Abstractive summarization नया टेक्स्ट उत्पन्न करने के लिए sequence-to-sequence मॉडल (T5, BART, या LLMs) का उपयोग करता है, अधिक प्रवाहपूर्ण सारांश उत्पन्न करता है लेकिन hallucination का जोखिम रहता है — मूल में न होने वाली जानकारी जोड़ना।
LLMs ने उन दस्तावेज़ों के लिए summarization को लगभग हल कर दिया है जो context window में फिट होते हैं। "इस लेख को 3 बुलेट पॉइंट्स में सारांशित करें" बिना किसी fine-tuning के आश्चर्यजनक रूप से अच्छे परिणाम देता है। शेष चुनौतियाँ: context window से लंबे दस्तावेज़ों का सारांश (chunking रणनीतियों की आवश्यकता), तथ्यात्मक सटीकता बनाए रखना (LLMs कभी-कभी सारांश को विश्वसनीय लेकिन गढ़े हुए विवरणों से "बढ़ाते" हैं), और आउटपुट लंबाई को सटीक रूप से नियंत्रित करना।
Production में सामान्य summarization पैटर्न: map-reduce (लंबे दस्तावेज़ को chunks में विभाजित करें, प्रत्येक chunk का सारांश करें, फिर सारांशों का सारांश करें), hierarchical (अनुभागों का सारांश करें, फिर अनुभाग सारांशों का सारांश करें), और rolling (एक चालू सारांश बनाए रखें जो नई सामग्री जुड़ने पर अपडेट होता रहे)। मीटिंग transcripts के लिए, वक्ता-attributed summarization ("Sarah ने X प्रस्तावित किया, Pierre ने चिंता Y उठाई") सामान्य summarization से अधिक उपयोगी है।