Zubnet AIApprendreWiki › Question Answering
Using AI

Question Answering

QA, Reading Comprehension
Un système qui répond à des questions posées en langage naturel. Le QA extractif trouve l'étendue de la réponse à l'intérieur d'un document donné (« Selon le paragraphe 3, la réponse est... »). Le QA génératif synthétise une réponse à partir d'une ou plusieurs sources. Le QA open-domain répond à n'importe quelle question sans document spécifique. Le QA basé sur RAG récupère des documents pertinents et génère des réponses à partir d'eux.

Pourquoi c'est important

Le question-answering est le pattern d'interaction fondamental pour les assistants IA. Chaque chatbot, chaque base de connaissances d'entreprise, chaque bot de support client est essentiellement un système QA. Comprendre les différents paradigmes QA (extractif, génératif, retrieval-augmented) t'aide à choisir la bonne architecture pour ton application et à fixer des attentes réalistes sur l'exactitude.

Deep Dive

Extractive QA (the SQuAD paradigm): given a document and a question, identify the exact span of text that answers the question. Fine-tuned BERT models excel at this — they read the document, understand the question, and highlight the answer. This is fast, accurate, and verifiable (the answer is always a direct quote). But it can only answer questions whose answers appear verbatim in the document.

RAG-Based QA

The dominant modern pattern: (1) user asks a question, (2) retrieve relevant documents from a knowledge base using semantic search, (3) include the retrieved documents in the LLM's context, (4) the LLM generates an answer based on the retrieved context. This combines the precision of retrieval with the fluency of generation. The key challenges are retrieval quality (finding the right documents) and faithfulness (generating answers that accurately reflect the source material).

Evaluation

QA accuracy is measured differently for each paradigm. Extractive QA uses exact match (EM) and F1 score against ground-truth answer spans. Generative QA is harder to evaluate automatically — multiple valid phrasings exist for any answer. RAGAS and similar frameworks evaluate RAG-based QA on faithfulness (does the answer match the source?), relevance (did you retrieve the right documents?), and answer quality. Human evaluation remains the gold standard for generative QA.

Concepts liés

← Tous les termes
ESC