Reconocimiento de Entidades Nombradas: Definición y significado — Wiki de IA

Identificar y categorizar entidades nombradas en texto — personas, organizaciones, ubicaciones, fechas, montos monetarios y otros nombres propios. En "Apple anunció una inversión de $3B en Múnich el martes," NER identifica Apple (Organización), $3B (Dinero), Múnich (Ubicación) y martes (Fecha). Es una tarea fundamental de NLP usada en extracción de información, búsqueda y construcción de grafos de conocimiento.

Por qué importa

NER es la columna vertebral de la extracción de información estructurada a partir de texto no estructurado. Cada motor de búsqueda, agregador de noticias y sistema de inteligencia usa NER para entender de qué trata un documento. También es el primer paso en la construcción de grafos de conocimiento a partir de texto — no puedes construir relaciones entre entidades que no has identificado.

En profundidad

NER se formula típicamente como una tarea de etiquetado de secuencias: cada token recibe una etiqueta como B-PER (inicio de nombre de persona), I-PER (dentro de nombre de persona), O (no es una entidad). El esquema de etiquetado BIO maneja entidades de varias palabras: "Nueva" recibe B-LOC, "York" recibe I-LOC. Los modelos BERT ajustados son el estándar para NER de alta precisión, aunque el NER incorporado de spaCy es popular para extracción rápida y suficientemente buena.

NER específico de dominio

Los modelos NER generales manejan tipos comunes de entidades (persona, organización, ubicación, fecha). Las aplicaciones específicas de dominio necesitan tipos personalizados: NER médico extrae medicamentos, síntomas y dosis. NER legal extrae números de casos, estatutos y partes. NER financiero extrae símbolos bursátiles, métricas financieras y referencias regulatorias. Estos requieren datos de entrenamiento específicos de dominio, que son costosos de anotar pero mejoran dramáticamente la calidad de extracción en contextos especializados.

NER con LLMs

Los LLMs pueden realizar NER mediante prompting: "Extrae todos los nombres de personas y organizaciones de este texto y devuélvelos como JSON." Esto es más lento y costoso que los modelos NER dedicados pero maneja tipos de entidades novedosos sin datos de entrenamiento y funciona entre idiomas de forma nativa. Para sistemas de producción que procesan millones de documentos, los modelos dedicados ganan en costo. Para extracción ad-hoc o tipos de entidades poco comunes, los LLMs ganan en flexibilidad.