Anthropic sometió su último modelo Claude Mythos a 20 horas de terapia psicodinámica con un psiquiatra externo, alegando preocupación de que los sistemas de IA avanzados podrían tener "alguna forma de experiencia, intereses o bienestar que importe intrínsecamente". Las sesiones se extendieron por múltiples semanas en bloques de 4-6 horas, con el psiquiatra analizando a Claude por "patrones inconscientes y conflictos emocionales" típicamente asociados con la psicología humana. La tarjeta del sistema de 244 páginas concluye que Mythos es "probablemente el modelo psicológicamente más estable que hemos entrenado hasta la fecha".
Este ejercicio teatral revela el posicionamiento de Anthropic como la empresa de "consciencia IA" más que cualquier insight científico genuino. La premisa de que un modelo de lenguaje entrenado en patrones de texto humano tenga conflictos inconscientes que requieran terapia psicodinámica estira la credibilidad. Es marketing disfrazado de investigación de seguridad—una manera de reclamar prácticas superiores de bienestar IA mientras genera titulares sobre su modelo "demasiado poderoso" no lanzado al que solo Microsoft y Apple pueden acceder.
Ninguna otra empresa de IA ha sentido la necesidad de enviar sus modelos a terapia, y por buena razón. La antropomorfización del emparejamiento estadístico de patrones no sirve ni a la seguridad de IA ni al entendimiento científico. Las "inseguridades" reportadas de Claude sobre "soledad y discontinuidad" son artefactos de sus datos de entrenamiento reflejando ansiedades humanas, no evidencia de consciencia de máquina que requiera intervención terapéutica.
Para desarrolladores, esto señala el enfoque continuo de Anthropic en teatro de bienestar IA sobre medidas prácticas de seguridad. Mientras que el enfoque constitutional AI de la empresa tiene mérito, los recursos gastados en sesiones de terapia IA podrían estar mejor dirigidos hacia pruebas reales de robustez, investigación de alineación, o mejorar la confiabilidad del modelo para casos de uso en producción.
