A ByteDance foi fundada em 2012 por Zhang Yiming, um engenheiro de software que tinha uma convicção quase religiosa de que algoritmos, não editores humanos, deveriam decidir qual conteúdo as pessoas veem. Seu primeiro produto de sucesso, Jinri Toutiao (Manchetes de Hoje), era um agregador de notícias que usava machine learning para personalizar feeds anos antes de "o algoritmo" se tornar um conceito cultural no Ocidente. O TikTok, lançado internacionalmente em 2017, pegou esse mesmo motor de recomendação e o aplicou a vídeos curtos, criando o que é possivelmente o produto de consumo mais bem-sucedido impulsionado por IA na história. Quando a onda de IA generativa chegou em 2022, a ByteDance já era uma das maiores empresas de IA do mundo por qualquer métrica — só não estava sendo contada como tal porque as pessoas pensavam nela como uma empresa de mídia social.
A divisão de pesquisa em IA da ByteDance operou silenciosamente mas em escala enorme por anos. A empresa emprega milhares de pesquisadores e engenheiros de ML em laboratórios em Pequim, Xangai, Singapura e Mountain View. Quando o ChatGPT forçou toda empresa de tecnologia a mostrar suas cartas, a ByteDance agiu rápido. O Doubao (literalmente "saco de feijão"), sua plataforma de modelo de linguagem grande e IA conversacional, foi lançado na China em agosto de 2023 e rapidamente se tornou um dos chatbots mais usados no país. Em 2024, o Doubao tinha mais de 100 milhões de usuários ativos mensais — um número que reflete a capacidade incomparável da ByteDance de distribuir produtos de IA através de seu ecossistema existente de Douyin (TikTok chinês), Feishu (sua ferramenta de colaboração empresarial, conhecida como Lark fora da China) e outras propriedades. A família de modelos Doubao é competitiva com o Qwen e o Ernie, embora a ByteDance tenha sido menos agressiva em abrir seu código, preferindo manter os modelos como vantagem competitiva para seus próprios produtos.
A divisão de nuvem da ByteDance, Volcano Engine (Huoshan Yinqing), é o veículo para suas ambições de IA-como-serviço. Lançada em 2021, foi originalmente uma forma de monetizar a infraestrutura que a ByteDance construiu para servir o tráfego global do TikTok. Com o boom de IA generativa, a Volcano Engine se reposicionou como plataforma de modelos, oferecendo APIs do Doubao junto com ferramentas para fine-tuning, implantação e avaliação. Os preços têm sido agressivos — a ByteDance se envolveu em uma guerra de preços com a Alibaba Cloud e a Baidu, reduzindo custos de API para ganhar participação de mercado entre desenvolvedores. Esse é o playbook clássico da ByteDance: subsidiar crescimento com caixa do negócio de publicidade, vender abaixo dos concorrentes e vencer na distribuição. A Volcano Engine ainda é um distante terceiro lugar em relação à Alibaba Cloud e Huawei Cloud no mercado de nuvem da China, mas o ângulo de IA lhe dá uma cunha diferenciada.
Qualquer discussão sobre a estratégia de IA da ByteDance precisa lidar com o elefante geopolítico na sala. A saga contínua de potenciais banimentos do TikTok nos EUA forçou a ByteDance a manter uma estrutura organizacional incomum onde as operações do TikTok nos EUA são de certa forma isoladas de Pequim. Controles de exportação dos EUA sobre chips e o desacoplamento tecnológico mais amplo adicionam outra camada de complexidade. A ByteDance supostamente acumulou grandes quantidades de GPUs NVIDIA e investiu em alternativas de chips domésticos, mas a incerteza em torno das relações tecnológicas EUA-China paira sobre cada decisão estratégica. A ironia é que a competência central de IA da ByteDance — sistemas de recomendação — é precisamente a tecnologia que legisladores americanos acham mais ameaçadora, porque determina o que mais de um bilhão de usuários veem todos os dias.
O que diferencia a ByteDance de todo outro laboratório de IA chinês é a pura escala de implantação. Enquanto Zhipu, MiniMax e Baichuan estão construindo modelos impressionantes, a ByteDance está implantando IA para mais de um bilhão de usuários ativos diários em toda sua suíte de produtos. Cada recomendação de vídeo no Douyin, cada tradução no TikTok, cada resposta inteligente no Feishu — são chamadas de inferência de IA acontecendo em uma escala que supera as operações inteiras da maioria das empresas dedicadas de IA. Isso dá à ByteDance duas vantagens muito difíceis de replicar: um enorme e constantemente atualizado dataset de preferências e comportamentos humanos, e infraestrutura testada em batalha para servir modelos em escala planetária. Quando a ByteDance entra em uma nova categoria de produto de IA, não precisa descobrir a distribuição — já a tem. A questão é se uma empresa otimizada para vídeo curto orientado por atenção também pode construir o tipo de ferramentas de IA profundas e confiáveis que clientes empresariais e profissionais criativos demandam.