Zubnet AIAprenderWiki › Edición de conocimiento
Entrenamiento

Edición de conocimiento

También conocido como: Knowledge Editing, Model Editing, Fact Editing
Técnicas para modificar hechos específicos en un modelo entrenado sin reentrenarlo. Si un modelo declara incorrectamente "El presidente de Francia es Macron" después de una nueva elección, la edición de conocimiento puede actualizar este hecho específico modificando pesos objetivos, sin afectar el otro conocimiento o las capacidades del modelo. El objetivo es precisión quirúrgica: cambiar un hecho, dejar todo lo demás intacto.

Por qué importa

La edición de conocimiento aborda un problema práctico: los modelos se desactualizan y el reentrenamiento es caro. Si pudieras actualizar hechos específicos de manera económica, los modelos podrían mantenerse actualizados entre grandes ciclos de entrenamiento. También tiene implicaciones de seguridad: ¿se podría eliminar conocimiento peligroso? El campo es prometedor pero inmaduro — las ediciones a menudo tienen efectos secundarios no deseados en el conocimiento relacionado.

En profundidad

El enfoque dominante (ROME/MEMIT): identificar qué pesos de la red feedforward codifican un hecho específico rastreando el efecto causal de las neuronas en la predicción del modelo, luego modificar esos pesos para cambiar la asociación almacenada. Por ejemplo, para actualizar "La Torre Eiffel está en París" a "La Torre Eiffel está en Londres", encuentras los pesos que mapean "Torre Eiffel" → "París" en las capas FFN y los rediriges a "Londres".

El problema del efecto dominó

Editar "La Torre Eiffel está en Londres" también debería cambiar las respuestas a "¿En qué país está la Torre Eiffel?" (Reino Unido, no Francia) y "¿Qué monumentos hay en París?" (ya no la Torre Eiffel). Los métodos de edición actuales a menudo fallan en esto: cambian el hecho directo pero dejan las inferencias relacionadas inconsistentes. Este problema de "efecto dominó" sugiere que el conocimiento en los LLMs está más interconectado de lo que la metáfora de edición quirúrgica implica.

Desafíos de escala

Unas pocas ediciones funcionan razonablemente bien. Cientos de ediciones comienzan a degradar la calidad del modelo — los pesos editados acumulan cambios que interfieren entre sí y con el conocimiento no editado. Esto limita el uso práctico de la edición de conocimiento: está bien para unas pocas correcciones pero no puede servir como mecanismo general de actualización del modelo. Para mantenerse actualizado, RAG (proporcionar información actualizada en tiempo de inferencia) sigue siendo más práctico que editar los pesos del modelo.

Conceptos relacionados

← Todos los términos