Zubnet AIAprenderWiki › Banco de dados vetorial
Ferramentas

Banco de dados vetorial

Também conhecido como: Qdrant, Pinecone, Weaviate, ChromaDB
Um banco de dados otimizado para armazenar e pesquisar embeddings (vetores). Em vez de corresponder palavras-chave exatas como um banco de dados tradicional, bancos de dados vetoriais encontram os itens mais semanticamente similares. Você pergunta "como corrigir um vazamento de memória" e ele retorna documentos sobre "depuração de consumo de RAM" porque os embeddings são próximos.

Por que isso importa

Bancos de dados vetoriais são a camada de armazenamento que faz RAG funcionar. Sem eles, você precisaria embedar toda a sua base de conhecimento a cada consulta. Também são a espinha dorsal de sistemas de recomendação e busca semântica.

Em profundidade

Um banco de dados vetorial armazena vetores de alta dimensão (tipicamente 384 a 3072 números de ponto flutuante, dependendo do modelo de embedding) e suporta busca rápida de vizinhos mais próximos em milhões ou bilhões deles. A operação fundamental é: dado um vetor de consulta, encontrar os k vetores no banco de dados mais próximos dele, medidos por similaridade de cosseno, produto escalar ou distância euclidiana. Busca força bruta (comparar a consulta com cada vetor armazenado) é exata mas muito lenta em escala. Então bancos de dados vetoriais usam algoritmos de vizinho mais próximo aproximado (ANN) que trocam uma pequena quantidade de precisão por ganhos massivos de velocidade — tipicamente encontrando 95-99% dos verdadeiros vizinhos mais próximos enquanto pesquisam apenas uma pequena fração do índice.

Como o Índice Funciona

O algoritmo ANN mais comum é HNSW (Hierarchical Navigable Small World), usado por Qdrant, Weaviate, pgvector e muitos outros. HNSW constrói um grafo multicamada onde cada vetor é um nó conectado a seus vizinhos mais próximos. A busca começa na camada superior (conexões esparsas e de longo alcance) e desce para camadas inferiores (conexões densas e de curto alcance), como dar zoom em um mapa. É rápido, preciso e funciona bem para datasets de até algumas centenas de milhões de vetores. O trade-off é memória: HNSW mantém o grafo em RAM.

Escolhendo Seu Banco de Dados

Escolher entre os principais bancos de dados vetoriais depende das suas restrições. Qdrant e Weaviate são open source e auto-hospedáveis, o que importa para privacidade de dados e controle de custos. Pinecone é totalmente gerenciado (sem infra para operar) mas com vendor lock-in e cobrado por vetor, o que fica caro em escala. ChromaDB é leve e embedded (roda in-process, armazena em disco), ótimo para prototipagem e datasets pequenos. PostgreSQL com a extensão pgvector é atraente se você já roda Postgres. Para a maioria dos sistemas de RAG em produção, Qdrant ou Weaviate dão o melhor equilíbrio de performance, recursos e controle operacional.

Filtragem Importa

Filtragem por metadados é um recurso que separa bancos de dados vetoriais sérios de implementações de brinquedo. Na prática, você quase nunca quer pesquisar toda a sua coleção — quer pesquisar "todos os documentos carregados por este usuário" ou "apenas documentos dos últimos 30 dias" ou "apenas chunks deste PDF específico". Bancos de dados vetoriais permitem armazenar metadados junto a cada vetor e aplicar filtros antes ou durante a busca por similaridade. Acertar seu schema de metadados no momento da indexação economiza enorme dor de cabeça depois.

Ainda Amadurecendo Rápido

Bancos de dados vetoriais existiam antes da onda atual de IA — Spotify usava busca de vizinho mais próximo aproximado para recomendações de música anos atrás, e a biblioteca Faiss do Facebook existe desde 2017. Mas a explosão de modelos de embedding e RAG em 2023-2024 os transformou de tecnologia de nicho em infraestrutura crítica. O espaço ainda está amadurecendo rápido: multi-tenancy, busca híbrida (combinando busca vetorial e por palavras-chave em uma única consulta) e indexação em disco (lidando com datasets maiores que a RAM) são áreas onde os produtos diferem significativamente e estão melhorando rapidamente. Se você está começando um projeto hoje, escolha um banco de dados que lide com sua escala atual, suporte filtragem de metadados e busca híbrida, e tenha uma trajetória ativa de manutenção.

Conceitos relacionados

← Todos os termos
← VRAM Vidu →
ESC