Karpathy entra na Anthropic, lidera equipe usando Claude para acelerar R&D pre-treinamento, Zubnet AI Notícias

Andrej Karpathy começou na Anthropic esta semana, reportando ao líder de pré-treinamento Nick Joseph e liderando uma nova equipe focada em usar Claude para acelerar pesquisa de pré-treinamento. Histórico de Karpathy: cofundador da OpenAI, ex-Diretor AI da Tesla, autor de Nano-GPT, llm.c, e o cânone educacional LLM do-zero que a comunidade de pesquisa small-model cita há anos. Ele fundou a Eureka Labs em 2024; esse projeto está em pausa com intenção de retornar "no tempo certo." Sua própria declaração: "os próximos anos na fronteira dos LLMs serão especialmente formativos. Estou muito animado em entrar para a equipe aqui e voltar ao R&D." Este é o movimento alumni-OpenAI-para-Anthropic mais proeminente desde que Dario e Daniela Amodei deixaram a OpenAI para fundar a Anthropic em 2021.

Duas coisas que isso sinaliza. Primeiro, a org de pré-treinamento da Anthropic agora tem uma equipe dedicada para pesquisa AI-assistida, dirigida por um dos nomes mais respeitados em eficiência de escalonamento. A expertise de Karpathy — linhagem nano-GPT, llm.c, eficiência-small-model na fronteira — é incomum em labs grandes onde a cultura dominante é mais computação, mais dados, mais parâmetros. A Anthropic aposta que alguém que entende profundamente o regime small-model encontra ganhos de eficiência que se compõem em escala. Segundo, "usar Claude para acelerar pesquisa de pré-treinamento" é a forma operacional da tese agentes-AI-escrevendo-seus-próprios-sucessores. O mandato da equipe é usar o Claude atual para encontrar o próximo Claude mais rápido. Se funciona, isso é aceleração mensurável em velocidade de pesquisa — e uma aposta fundamentalmente diferente da trajetória compute-and-scale Stargate da OpenAI ou da construção Vera Rubin NVL72 mais JV-TPU-Blackstone do Google.

Efeito ecossistema: a Anthropic acredita que o fosso competitivo é a velocidade de pesquisa por dólar de computação, não a capacidade bruta de computação. Consistente com o framing Capability Curve em Code With Claude (62% a 87% no SWE-bench Verified em doze meses) e com o foco MCP mais Managed Agents em primitivas de infraestrutura ao invés de apenas modelos maiores. Onde a OpenAI sob Altman escala Stargate, o Google constrói sistemas de referência Vera Rubin NVL72 e JVs com a Blackstone em clouds TPU, a Anthropic contrata o expert em eficiência-small-model para liderar pesquisa de pré-treinamento AI-assistida. Aposta diferente sobre o que vence os próximos dois anos. Para builders do ecossistema wrapper, isso reforça o que a Capability Curve já dizia: os dólares de pesquisa da Anthropic vão para fazer o modelo em si melhor e mais rápido, não no scaffolding ao redor.

Segunda-feira: observe o output de pré-treinamento da Anthropic em Q3 e Q4 por sinais de aceleração em throughput de pesquisa — cadência de lançamento de modelos, velocidade de saída de papers, melhorias de eval por unidade de computação. Se a próxima geração Opus ou um refresh Sonnet enviar antes dos típicos 12-15 meses e mostrar outro salto classe-SWE-bench, a tese AI-assisted-research tem respaldo empírico. Para builders especificamente: o ciclo de melhoria do modelo se internaliza — a aposta é em modelos que se fazem melhores mais rápido eles mesmos. Isso muda o planejamento de prompt-engineering downstream. Os patterns de prompt que funcionavam na capacidade anterior do modelo decaem mais rápido se a velocidade de pesquisa acelera. Planeje para vidas mais curtas de prompt-pattern; construa seu stack fino o suficiente para cavalgar a curva ao invés de ficar preso a um comportamento de modelo fixo. Karpathy entrando também é um sinal de contratação: se você é pesquisador de eficiência-small-model e tem observado onde a ação R&D real está, a resposta acaba de ficar mais clara.

Karpathy entra na Anthropic, lidera equipe usando Claude para acelerar R&D pre-treinamento

Mais notícias