Um banco de dados vetorial armazena vetores de alta dimensão (tipicamente 384 a 3072 números de ponto flutuante, dependendo do modelo de embedding) e suporta busca rápida de vizinhos mais próximos em milhões ou bilhões deles. A operação fundamental é: dado um vetor de consulta, encontrar os k vetores no banco de dados mais próximos dele, medidos por similaridade de cosseno, produto escalar ou distância euclidiana. Busca força bruta (comparar a consulta com cada vetor armazenado) é exata mas muito lenta em escala. Então bancos de dados vetoriais usam algoritmos de vizinho mais próximo aproximado (ANN) que trocam uma pequena quantidade de precisão por ganhos massivos de velocidade — tipicamente encontrando 95-99% dos verdadeiros vizinhos mais próximos enquanto pesquisam apenas uma pequena fração do índice.
O algoritmo ANN mais comum é HNSW (Hierarchical Navigable Small World), usado por Qdrant, Weaviate, pgvector e muitos outros. HNSW constrói um grafo multicamada onde cada vetor é um nó conectado a seus vizinhos mais próximos. A busca começa na camada superior (conexões esparsas e de longo alcance) e desce para camadas inferiores (conexões densas e de curto alcance), como dar zoom em um mapa. É rápido, preciso e funciona bem para datasets de até algumas centenas de milhões de vetores. O trade-off é memória: HNSW mantém o grafo em RAM.
Escolher entre os principais bancos de dados vetoriais depende das suas restrições. Qdrant e Weaviate são open source e auto-hospedáveis, o que importa para privacidade de dados e controle de custos. Pinecone é totalmente gerenciado (sem infra para operar) mas com vendor lock-in e cobrado por vetor, o que fica caro em escala. ChromaDB é leve e embedded (roda in-process, armazena em disco), ótimo para prototipagem e datasets pequenos. PostgreSQL com a extensão pgvector é atraente se você já roda Postgres. Para a maioria dos sistemas de RAG em produção, Qdrant ou Weaviate dão o melhor equilíbrio de performance, recursos e controle operacional.
Filtragem por metadados é um recurso que separa bancos de dados vetoriais sérios de implementações de brinquedo. Na prática, você quase nunca quer pesquisar toda a sua coleção — quer pesquisar "todos os documentos carregados por este usuário" ou "apenas documentos dos últimos 30 dias" ou "apenas chunks deste PDF específico". Bancos de dados vetoriais permitem armazenar metadados junto a cada vetor e aplicar filtros antes ou durante a busca por similaridade. Acertar seu schema de metadados no momento da indexação economiza enorme dor de cabeça depois.
Bancos de dados vetoriais existiam antes da onda atual de IA — Spotify usava busca de vizinho mais próximo aproximado para recomendações de música anos atrás, e a biblioteca Faiss do Facebook existe desde 2017. Mas a explosão de modelos de embedding e RAG em 2023-2024 os transformou de tecnologia de nicho em infraestrutura crítica. O espaço ainda está amadurecendo rápido: multi-tenancy, busca híbrida (combinando busca vetorial e por palavras-chave em uma única consulta) e indexação em disco (lidando com datasets maiores que a RAM) são áreas onde os produtos diferem significativamente e estão melhorando rapidamente. Se você está começando um projeto hoje, escolha um banco de dados que lide com sua escala atual, suporte filtragem de metadados e busca híbrida, e tenha uma trajetória ativa de manutenção.