Andrej Karpathy ने इस सप्ताह Anthropic में शुरू किया, pre-training lead Nick Joseph को रिपोर्ट करते हुए और Claude का use करके pre-training research को accelerate करने पर focused एक नई team lead करते हुए। Karpathy की history: OpenAI co-founder, पूर्व Tesla AI Director, Nano-GPT, llm.c, और from-scratch educational LLM canon के लेखक जिसे small-model research community years से quote कर रही है। उन्होंने 2024 में Eureka Labs founded किया; वह project paused है "in time" वापस आने के intent के साथ। उनका अपना statement: "अगले कुछ साल LLMs की frontier पर especially formative होंगे। मैं यहाँ team को join करने और R&D पर वापस आने के लिए बहुत excited हूँ।" यह 2021 में Dario और Daniela Amodei ने Anthropic को found करने के लिए OpenAI छोड़ने के बाद से OpenAI alum-to-Anthropic move सबसे prominent है।
दो चीज़ें जो यह signal करता है। पहला, Anthropic की pre-training org में अब AI-assisted research के लिए एक dedicated team है, जो scaling efficiency में सबसे respected names में से एक द्वारा headed है। Karpathy की expertise — nano-GPT lineage, llm.c, frontier पर small-model-efficiency — बड़े labs में unusual है जहाँ dominant culture है more compute, more data, more parameters। Anthropic bet कर रहा है कि कोई जो deeply small-model regime को समझता है वो efficiency wins पाता है जो scale पर compound करते हैं। दूसरा, "Claude का use करके pre-training research accelerate करना" AI-agents-writing-their-own-successors thesis का operational form है। Team mandate है current Claude का use करके अगले Claude को faster ढूंढना। अगर काम करता है, यह research velocity में measurable speedup है — और OpenAI के compute-and-scale Stargate trajectory या Google के Vera Rubin NVL72 plus Blackstone-TPU-JV buildout से fundamentally different bet है।
Ecosystem effect: Anthropic मानता है कि competitive moat compute के per dollar research velocity है, raw compute capacity नहीं। Code With Claude पर Capability Curve framing (बारह महीनों में SWE-bench Verified पर 62% से 87%) और bigger models के बजाय infrastructure primitives पर MCP plus Managed Agents focus के साथ consistent। जहाँ OpenAI Altman के under Stargate scale करता है, Google Vera Rubin NVL72 reference systems बनाता है और TPU clouds पर Blackstone के साथ JV करता है, Anthropic AI-assisted pre-training research lead करने के लिए small-model-efficiency expert hire करता है। अगले दो साल क्या जीतता है इस पर different bet। Wrapper-ecosystem builders के लिए, यह reinforce करता है जो Capability Curve पहले से कह रही थी: Anthropic के research dollars model को खुद better और faster बनाने में जाते हैं, इसके आसपास scaffolding में नहीं।
सोमवार: Q3 और Q4 में Anthropic के pre-training output को research throughput में acceleration के संकेतों के लिए watch करें — model release cadence, paper output velocity, per unit compute eval improvements। अगर अगली Opus generation या Sonnet refresh typical 12-15 months से जल्दी ship होती है और एक और SWE-bench-class jump दिखाती है, AI-assisted-research thesis के पास empirical backing है। Builders के लिए specifically: model-improvement loop internalize हो रहा है — bet उन models पर है जो खुद को faster better बनाते हैं। यह downstream prompt-engineering planning बदलता है। Prompt patterns जो model की previous capability पर काम करते थे research velocity accelerates होने पर faster decay करते हैं। शॉर्ट prompt-pattern lifetimes के लिए plan करें; एक fixed model behavior पर locked रहने के बजाय curve ride करने के लिए अपने stack को काफ़ी thin बनाएँ। Karpathy का joining एक hiring signal भी है: अगर आप small-model-efficiency researcher हैं और देख रहे हैं कि real R&D action कहाँ है, जवाब अभी clearer हो गया।
