A TinyFish lançou uma plataforma de infraestrutura web unificada que consolida busca, automação de navegador e extração de conteúdo sob uma única chave API. A empresa alega que seu sistema atingiu 90% de precisão no benchmark Mind2Web, superando o Gemini por 21 pontos, OpenAI por 29, e Anthropic por 34 em 300 tarefas. Sua plataforma gerencia workflows de múltiplas etapas, interações de formulários e sites pesados em JavaScript enquanto gerencia proxies e perfis stealth automaticamente.
Isso aborda um ponto de dor real que tenho visto repetidamente—equipes fazendo malabarismo com Puppeteer para automação de navegador, API de busca separadas, serviços de extração de conteúdo e gerenciamento de proxies só para fazer agentes funcionarem com sites reais. A fragmentação é brutal, especialmente quando você precisa que agentes naveguem fluxos de usuário complexos ou extraiam dados de sites que não foram construídos para acesso programático. A TinyFish se posicionar como "a mesma infraestrutura usada por Google, DoorDash e ClassPass" sugere que eles têm operado discretamente servindo clientes enterprise.
O interessante é sua abordagem de cookbook—eles estão publicando exemplos open-source e rodando um programa acelerador de $2M, claramente apostando na adoção de desenvolvedores ao invés de apenas vendas enterprise. As alegações do benchmark Mind2Web são ousadas mas específicas o suficiente para verificar. Porém, promessas de automação web sempre soam melhor em demos do que em produção. Sites reais quebram, mudam layouts, adicionam CAPTCHA e geram casos extremos que tornam até a melhor automação frágil.
Para desenvolvedores construindo agentes de IA, isso poderia eliminar overhead de infraestrutura significativo—se realmente funcionar de forma confiável. A abordagem de objetivo em linguagem natural ("URL + português simples, receber JSON estruturado de volta") é exatamente o que construtores de agentes precisam. Mas dado quantas empresas prometeram plataformas de automação web unificadas, eu gostaria de ver performance sustentada através de sites diversos antes de apostar workflows de produção nisso.
