Sumarização extrativa identifica as frases mais importantes usando técnicas como TextRank (um algoritmo baseado em grafos inspirado no PageRank) ou pontuação de frases baseada em BERT. O resumo é um subconjunto das frases originais, o que garante precisão factual mas pode produzir texto desconexo e desajeitado. Sumarização abstrativa usa modelos sequence-to-sequence (T5, BART ou LLMs) para gerar texto novo, produzindo resumos mais fluentes mas arriscando alucinação — adicionar informações que não estão no original.
LLMs tornaram a sumarização quase um problema resolvido para documentos que cabem na janela de contexto. "Resuma este artigo em 3 pontos" produz resultados surpreendentemente bons com zero ajuste. Os desafios restantes: sumarizar documentos maiores que a janela de contexto (exigindo estratégias de fragmentação), manter precisão factual (LLMs às vezes "enriquecem" o resumo com detalhes plausíveis mas fabricados) e controlar o tamanho da saída com precisão.
Padrões comuns de sumarização em produção: map-reduce (dividir documento longo em partes, sumarizar cada parte, depois sumarizar os resumos), hierárquico (sumarizar seções, depois sumarizar os resumos das seções) e rolling (manter um resumo contínuo que é atualizado conforme novo conteúdo é adicionado). Para transcrições de reuniões, sumarização atribuída por falante ("Sarah propôs X, Pierre levantou a preocupação Y") é mais útil do que sumarização genérica.