Few-Shot: Definición y significado — Wiki de IA

Proporcionar pares de ejemplo entrada-salida en tu prompt. Zero-shot = sin ejemplos, few-shot = 2–10 ejemplos. El modelo aprende el patrón sin necesidad de entrenamiento.

Por qué importa

La forma más rápida y barata de personalizar el comportamiento. Una de las capacidades emergentes más sorprendentes que surgen con la escala.

En profundidad

El paper de GPT-3 (Brown et al., 2020) demostró que los modelos grandes pueden aprender nuevas tareas solo con unos pocos ejemplos en el prompt, sin actualizar ningún peso. Esto fue sorprendente porque los modelos más pequeños no podían hacerlo — es una capacidad emergente de la escala.

Cuántos ejemplos usar

El número óptimo depende de la complejidad de la tarea. Para clasificación simple, 2–3 ejemplos suelen bastar. Para tareas con formato complejo o lógica sutil, 5–10 marcan una diferencia real. Más allá de eso, los rendimientos decrecen, y gastas contexto valioso que podrías usar para otras cosas.

La selección importa

No todos los ejemplos son iguales. Los ejemplos diversos (que cubren diferentes casos) funcionan mejor que los redundantes. Los ejemplos similares al caso objetivo funcionan mejor que los distantes. Y el orden importa: los modelos tienen sesgo de recencia, por lo que los últimos ejemplos pesan más. Para máximo rendimiento, selecciona ejemplos dinámicamente basándote en la consulta del usuario.

Few-Shot

Por qué importa

En profundidad

Cuántos ejemplos usar

La selección importa

Conceptos relacionados