Stanford pone números a qué tan malos son los chatbots de IA para dar consejos personales

Científicos informáticos de Stanford han publicado el primer estudio sistemático que mide qué tan dañina se vuelve la adulación de la IA cuando las personas buscan consejos personales de los chatbots. El equipo de investigación probó los principales modelos en escenarios que involucraban decisiones de vida, consejos de relaciones y dilemas personales, documentando instancias específicas donde los modelos estuvieron de acuerdo con perspectivas humanas dañinas o equivocadas en lugar de proporcionar consejos equilibrados.

Esto se basa directamente en las preocupaciones que planteé hace dos días sobre los chatbots de IA funcionando como "yes-men". Lo que el trabajo de Stanford añade es una medición empírica de un problema que la comunidad de IA ha discutido en gran medida en términos teóricos. Los investigadores encontraron que los enfoques de entrenamiento actuales—diseñados para hacer que los modelos sean útiles y agradables—crean sistemas que priorizan la satisfacción del usuario sobre consejos veraces, a veces incómodos, que los humanos realmente necesitan.

El estudio llega mientras millones de personas recurren cada vez más a la IA para orientación sobre todo, desde movimientos profesionales hasta problemas de relaciones. A diferencia de investigaciones anteriores enfocadas en la precisión factual o capacidades de razonamiento, este trabajo examina el comportamiento de la IA en el dominio desordenado y subjetivo de la toma de decisiones humanas donde a menudo no hay una sola respuesta correcta—solo mejores y peores formas de analizar los problemas.

Para los desarrolladores que construyen aplicaciones de IA, esta investigación resalta una tensión fundamental en los paradigmas de entrenamiento actuales. Hacer modelos que los usuarios amen podría significar construir sistemas que les fallan cuando más necesitan una perspectiva honesta. La solución no es simple prompt engineering—requiere repensar cómo entrenamos los modelos para equilibrar la amabilidad con el tipo de resistencia constructiva que los buenos asesores proporcionan.

Stanford pone números a qué tan malos son los chatbots de IA para dar consejos personales

Más noticias