Andrej Karpathy empezó en Anthropic esta semana, reportando al líder de pre-entrenamiento Nick Joseph y liderando un nuevo equipo enfocado en usar Claude para acelerar la investigación de pre-entrenamiento. Historial de Karpathy: cofundador de OpenAI, ex-Director AI de Tesla, autor de Nano-GPT, llm.c, y el canon educativo LLM desde-cero que la comunidad de investigación de small-model ha estado citando por años. Fundó Eureka Labs en 2024; ese proyecto está en pausa con la intención de volver "a su tiempo." Su propia declaración: "los próximos años en la frontera de los LLMs serán especialmente formativos. Estoy muy emocionado de unirme al equipo aquí y volver a R&D." Esto es el movimiento alumni-OpenAI-a-Anthropic más prominente desde que Dario y Daniela Amodei dejaron OpenAI para fundar Anthropic en 2021.

Dos cosas que esto señala. Primero, la org de pre-entrenamiento de Anthropic ahora tiene un equipo dedicado para investigación AI-asistida, dirigido por uno de los nombres más respetados en eficiencia de escalado. La expertise de Karpathy — linaje nano-GPT, llm.c, eficiencia-small-model en la frontera — es inusual en labs grandes donde la cultura dominante es más cómputo, más datos, más parámetros. Anthropic apuesta a que alguien que entiende profundamente el régimen small-model encuentra ganancias de eficiencia que se componen a escala. Segundo, "usar Claude para acelerar investigación de pre-entrenamiento" es la forma operacional de la tesis agentes-AI-escribiendo-sus-propios-sucesores. El mandato del equipo es usar el Claude actual para encontrar el siguiente Claude más rápido. Si funciona, eso es una aceleración medible en velocidad de investigación — y una apuesta fundamentalmente diferente a la trayectoria compute-and-scale Stargate de OpenAI o la construcción Vera Rubin NVL72 más JV-TPU-Blackstone de Google.

Efecto ecosistema: Anthropic cree que el foso competitivo es la velocidad de investigación por dólar de cómputo, no la capacidad cruda de cómputo. Consistente con el framing Capability Curve en Code With Claude (62% a 87% en SWE-bench Verified en doce meses) y con el enfoque MCP más Managed Agents en primitivas de infraestructura en lugar de solo modelos más grandes. Donde OpenAI bajo Altman escala Stargate, Google construye sistemas de referencia Vera Rubin NVL72 y JVs con Blackstone en clouds TPU, Anthropic contrata al experto en eficiencia small-model para liderar investigación de pre-entrenamiento AI-asistida. Apuesta diferente sobre qué gana los próximos dos años. Para los builders del ecosistema wrapper, esto refuerza lo que la Capability Curve ya decía: los dólares de investigación de Anthropic van a hacer el modelo mismo mejor y más rápido, no en el scaffolding alrededor de él.

Lunes: vigila el output de pre-entrenamiento de Anthropic en Q3 y Q4 por señales de aceleración en throughput de investigación — cadencia de lanzamiento de modelos, velocidad de salida de papers, mejoras de eval por unidad de cómputo. Si la próxima generación Opus o un refresh Sonnet envía antes de los típicos 12-15 meses y muestra otro salto clase-SWE-bench, la tesis AI-assisted-research tiene respaldo empírico. Para builders específicamente: el bucle de mejora del modelo se internaliza — la apuesta es por modelos que se hacen mejores más rápido a sí mismos. Eso cambia la planificación de prompt-engineering downstream. Los patterns de prompt que funcionaban a la capacidad previa del modelo decaen más rápido si la velocidad de investigación acelera. Planea para vidas más cortas de prompt-pattern; construye tu stack lo suficientemente delgado para cabalgar la curva en lugar de quedar bloqueado a un comportamiento de modelo fijo. Karpathy uniéndose también es una señal de contratación: si eres investigador de eficiencia-small-model y has estado observando dónde está la acción R&D real, la respuesta acaba de volverse más clara.