A OpenAI atualizou o Agents SDK em 15 de abril com um conjunto de capacidades que, tomadas em conjunto, são a ratificação mais clara até o momento dos padrões em que o ecossistema de agentes convergiu ao longo do último ano. A atualização envia um harness model-native com memória configurável, orquestração consciente de sandbox e ferramentas de sistema de arquivos "tipo Codex". Padroniza cinco primitivas que os desenvolvedores vinham costurando à mão: uso de ferramentas via MCP, disclosure progressivo via skills, instruções customizadas via AGENTS.md, execução de código baseada em shell e edições de arquivo via apply-patch. A execução em sandbox é suportada nativamente com integrações bring-your-own para Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop e Vercel. Python sai primeiro, TypeScript vem em seguida. A parte interessante não é uma única feature; é a forma do movimento agregado.

Cinco padrões acabam de ser ratificados em um único lançamento. AGENTS.md, um arquivo markdown na raiz do projeto que fornece instruções customizadas ao agente, agora é uma primitiva explícita da OpenAI, ao lado do CLAUDE.md da Anthropic e do padrão SKILL.md de Android do Google de ontem. A convenção de nomes se padronizou em "arquivo legível-para-agente na raiz do projeto", e com a OpenAI adotando AGENTS.md, a convenção está efetivamente resolvida. MCP, que a Anthropic lançou em 2024 e que um grande ecossistema de terceiros adotou, agora é cidadão de primeira classe na OpenAI. Era o último grande laboratório resistindo; MCP é o padrão de facto para interfaces de ferramentas. Skills, que o Google usou no trabalho SKILL.md do Android, agora são uma primitiva nomeada do SDK da OpenAI para "disclosure progressivo" de instruções de agente. Execução de código baseada em shell e edições de arquivo via apply-patch são as duas primitivas de execução que emergiram do Claude Code e do Cursor, e a OpenAI as adota sem renomear. No plural, "provedores de sandbox" sinaliza algo diferente. A OpenAI não está tentando possuir a camada de sandbox; está padronizando a interface e deixando um mercado se desenvolver. O Code Mode da Cloudflare, que cobri ontem, se encaixa direto nesse modelo.

A forma desta atualização é a OpenAI saindo de "nós inventamos os padrões" para "adotamos o que o ecossistema já escolheu". Essa é uma mudança de postura significativa. Nos últimos dois anos, a presunção padrão era que cada laboratório ia enviar suas próprias primitivas proprietárias de agente e competir na qualidade delas. O que de fato aconteceu foi convergência: MCP para ferramentas, CLAUDE.md e AGENTS.md para instruções, SKILL.md e skills para disclosure progressivo, abstrações de sandbox para execução de código. Os laboratórios que tentam enviar versões proprietárias disso se veem contornados pelo ecossistema de terceiros. A OpenAI ratificar os padrões do ecossistema é o movimento pragmático. Sinaliza que a camada agent-SDK não é mais uma superfície significativa de lock-in, e que a diferenciação competitiva tem que acontecer nas camadas qualidade de modelo, qualidade de integração de sandbox e profundidade de ecossistema. Isso é também implicitamente admitir que o jeito mais rápido de extrair valor do ecossistema de agentes é plugar limpo em vez de lutar contra a corrente.

Para quem está construindo com agentes de código ou de uso de ferramentas, três movimentos imediatos. Primeiro, se você ainda não está usando AGENTS.md ou equivalente como superfície de configuração de agente do seu projeto, adote agora. A convenção foi resolvida e o custo de migração compõe quanto mais você fica em um sistema custom. Segundo, audite sua exposição de ferramentas MCP. Com a OpenAI agora suportando oficialmente MCP, o servidor que você construiu para o Claude ou para um cliente terceiro vai funcionar nativamente no SDK da OpenAI, e vice-versa. Isso tira muita fricção de setups multi-provedor. Terceiro, escolha seu provedor de sandbox com deliberação. Sete provedores agora são de primeira classe no SDK da OpenAI, o que significa que sandboxing não é mais uma decisão de commodity. Os provedores se diferenciam em latência, suporte de linguagens, precificação e postura de segurança, e essas diferenças vão aparecer no comportamento em runtime do seu agente. O Code Mode da Cloudflare e a postura Python-first da E2B são dois exemplos de provedores de sandbox com abordagens distintas. A meta-lição é que os padrões de agente se estabilizaram mais rápido do que a maioria esperava. Se você ainda está escrevendo andaimes de tool-calling custom, encanamento de sandbox custom ou arquivos de instrução custom, isso agora é mais passivo que ativo.