Mantém histórico de conversa reenviado a cada turno. A memória é limitada pela janela de contexto — uma ilusão. Camada de produto: UI, filtros de segurança, roteamento de modelo, integrações de ferramentas, system prompt.
Chatbots parecem “lembrar” da conversa, mas na realidade todo o histórico é reenviado ao modelo a cada mensagem. Quando a conversa excede a janela de contexto, mensagens antigas são descartadas ou resumidas. Funcionalidades de “memória” persistente (como a do ChatGPT) são sistemas separados que armazenam fatos e os injetam no system prompt.
O mesmo modelo (ex: Claude Sonnet) pode alimentar interfaces completamente diferentes com personalidades, capacidades e restrições distintas. O chatbot adiciona camadas: filtragem de conteúdo, gerenciamento de contexto, integração com ferramentas (busca, código, imagens), persistência e UI. Entender essa distinção é crucial para desenvolvedores que constroem sobre APIs.