ByteDance a été fondée en 2012 par Zhang Yiming, un ingénieur logiciel animé d'une conviction quasi religieuse que les algorithmes, et non les éditeurs humains, devraient décider quel contenu les gens voient. Son premier succès, Jinri Toutiao (Today's Headlines), était un agrégateur d'actualités utilisant l'apprentissage automatique pour personnaliser les fils d'information des années avant que « l'algorithme » ne devienne un concept culturel en Occident. TikTok, lancé à l'international en 2017, a pris ce même moteur de recommandation et l'a appliqué à la vidéo courte, créant ce qui est sans doute le produit grand public propulsé par l'IA le plus réussi de l'histoire. Au moment où la vague de l'IA générative a frappé en 2022, ByteDance était déjà l'une des plus grandes entreprises d'IA au monde selon tous les critères — simplement, elle n'était pas comptée comme telle parce qu'on la considérait comme une entreprise de médias sociaux.
La division de recherche en IA de ByteDance a opéré discrètement mais à une échelle énorme pendant des années. L'entreprise emploie des milliers de chercheurs et d'ingénieurs en apprentissage automatique dans des laboratoires à Pékin, Shanghai, Singapour et Mountain View. Quand ChatGPT a forcé chaque entreprise technologique à révéler son jeu, ByteDance a réagi rapidement. Doubao (littéralement « haricot »), leur grand modèle de langage et plateforme d'IA conversationnelle, a été lancé en Chine en août 2023 et est rapidement devenu l'un des agents conversationnels les plus utilisés du pays. D'ici 2024, Doubao comptait plus de 100 millions d'utilisateurs actifs mensuels — un chiffre qui reflète la capacité inégalée de ByteDance à distribuer des produits d'IA à travers son écosystème existant de Douyin (TikTok chinois), Feishu (leur outil de collaboration en entreprise, connu sous le nom de Lark à l'extérieur de la Chine) et d'autres propriétés. La famille de modèles Doubao elle-même est compétitive avec Qwen et Ernie, bien que ByteDance ait été moins agressive quant à sa diffusion en logiciel libre, préférant garder les modèles comme avantage compétitif pour ses propres produits.
La division infonuagique de ByteDance, Volcano Engine (Huoshan Yinqing), est le véhicule de leurs ambitions d'IA en tant que service. Lancée en 2021, elle était à l'origine un moyen de monétiser l'infrastructure que ByteDance avait construite pour servir le trafic mondial de TikTok. Avec l'essor de l'IA générative, Volcano Engine s'est repositionnée comme plateforme de modèles, offrant les API de Doubao aux côtés d'outils d'affinage, de déploiement et d'évaluation. La tarification a été agressive — ByteDance a engagé une guerre des prix avec Alibaba Cloud et Baidu, réduisant les coûts d'API pour gagner des parts de marché auprès des développeurs. C'est la stratégie classique de ByteDance : subventionner la croissance avec les revenus publicitaires, sous-coter les concurrents et gagner par la distribution. Volcano Engine reste un lointain troisième derrière Alibaba Cloud et Huawei Cloud sur le marché chinois de l'infonuagique, mais l'angle IA lui donne un avantage différencié.
Toute discussion sur la stratégie IA de ByteDance doit prendre en compte l'éléphant géopolitique dans la pièce. La saga en cours des interdictions potentielles de TikTok aux États-Unis a contraint ByteDance à maintenir une structure organisationnelle inhabituelle où les opérations américaines de TikTok sont en partie cloisonnées par rapport à Pékin. Les contrôles à l'exportation américains sur les puces et le découplage technologique plus large ajoutent une couche supplémentaire de complexité. ByteDance aurait accumulé de grandes quantités de GPU NVIDIA et a investi dans des alternatives nationales, mais l'incertitude autour des relations technologiques sino-américaines plane sur chaque décision stratégique. L'ironie est que la compétence centrale de ByteDance en IA — les systèmes de recommandation — est précisément la technologie que les législateurs américains trouvent la plus menaçante, parce qu'elle détermine ce que plus d'un milliard d'utilisateurs voient chaque jour.
Ce qui distingue ByteDance de tous les autres laboratoires d'IA chinois, c'est l'ampleur du déploiement. Tandis que Zhipu, MiniMax et Baichuan construisent des modèles impressionnants, ByteDance déploie l'IA auprès de plus d'un milliard d'utilisateurs actifs quotidiens à travers sa suite de produits. Chaque recommandation vidéo sur Douyin, chaque traduction sur TikTok, chaque réponse intelligente dans Feishu — ce sont des appels d'inférence d'IA à une échelle qui éclipse l'ensemble des opérations de la plupart des entreprises d'IA dédiées. Cela donne à ByteDance deux avantages très difficiles à reproduire : un ensemble de données énorme et constamment renouvelé des préférences et comportements humains, et une infrastructure éprouvée au combat pour servir des modèles à l'échelle planétaire. Quand ByteDance entre dans une nouvelle catégorie de produit d'IA, l'entreprise n'a pas besoin de trouver comment distribuer — elle le fait déjà. La question est de savoir si une entreprise optimisée pour la vidéo courte axée sur l'attention peut également construire le type d'outils d'IA profonds et fiables que les clients entreprises et les professionnels de la création exigent.