Um grafo de conhecimento armazena conhecimento como triplas (sujeito, predicado, objeto): (Albert Einstein, nasceu_em, Ulm), (Ulm, localizada_em, Alemanha). Essas triplas formam um grafo onde entidades são nós e relacionamentos são arestas. Você pode percorrer o grafo para responder perguntas multi-hop: "Onde fica o local de nascimento da pessoa que desenvolveu a relatividade geral?" segue Einstein → nasceu_em → Ulm → localizada_em → Alemanha.
A integração de grafos de conhecimento com LLMs assume várias formas: usar KGs como fonte para RAG (recuperar subgrafos relevantes para uma consulta), usar LLMs para popular KGs (extrair entidades e relacionamentos de texto) e usar KGs para verificar saídas de LLMs (checar fatos declarados contra o grafo). GraphRAG (Microsoft) usa LLMs para construir um grafo de conhecimento a partir de documentos, depois consulta esse grafo para recuperação mais estruturada do que busca vetorial pura.
Construir um grafo de conhecimento requer: extração de entidades (identificar pessoas, lugares, conceitos no texto), extração de relações (identificar como entidades se relacionam), resolução de entidades (reconhecer que "SP", "São Paulo" e "Sampa" são a mesma entidade) e design de esquema (definir que tipos de entidades e relacionamentos existem). LLMs tornaram cada um desses passos mais baratos e precisos, democratizando a construção de KGs para organizações que antes não podiam arcar com o esforço manual.