Zubnet AI學習Wiki › Encoder-Decoder
模型

Encoder-Decoder(編碼器-解碼器)

別名:序列到序列

由編碼器(壓縮輸入)和解碼器(生成輸出)組成的架構。T5/BART 是編碼器-解碼器架構。GPT/Claude 是純解碼器架構。BERT 是純編碼器架構。

為什麼重要

解釋了為什麼不同模型擅長不同任務,以及為什麼純解碼器架構在 LLM 領域勝出。

深度解析

編碼器使用雙向注意力;解碼器使用因果注意力加上交叉注意力。純解碼器因其簡單性和良好的縮放特性而勝出。純編碼器(BERT)在嵌入向量、分類和搜尋方面仍然是主流。

相關概念

← 所有術語