Un grafo de conocimiento almacena conocimiento como tripletas (sujeto, predicado, objeto): (Albert Einstein, nacido_en, Ulm), (Ulm, ubicado_en, Alemania). Estas tripletas forman un grafo donde las entidades son nodos y las relaciones son aristas. Puedes recorrer el grafo para responder preguntas de múltiples saltos: "¿Dónde nació la persona que desarrolló la relatividad general?" sigue Einstein → nacido_en → Ulm → ubicado_en → Alemania.
La integración de grafos de conocimiento con LLMs toma varias formas: usar KGs como fuente para RAG (recuperar subgrafos relevantes para una consulta), usar LLMs para poblar KGs (extraer entidades y relaciones del texto), y usar KGs para verificar salidas de LLMs (comprobar hechos declarados contra el grafo). GraphRAG (Microsoft) usa LLMs para construir un grafo de conocimiento a partir de documentos, luego consulta ese grafo para una recuperación más estructurada que la búsqueda vectorial pura.
Construir un grafo de conocimiento requiere: extracción de entidades (identificar personas, lugares, conceptos en texto), extracción de relaciones (identificar cómo se relacionan las entidades), resolución de entidades (reconocer que "CDMX", "Ciudad de México" y "la capital mexicana" son la misma entidad), y diseño de esquema (definir qué tipos de entidades y relaciones existen). Los LLMs han hecho cada uno de estos pasos más barato y más preciso, democratizando la construcción de KGs para organizaciones que previamente no podían costear el esfuerzo manual.