Zubnet AI学习Wiki › 阿里云
公司

阿里云

别名:通义千问、Qwen 系列模型
阿里巴巴集团的云计算部门及通义模型家族的创造者。通义模型具有全开放权重、多语言支持,是当前最强大的开源模型之一。

为什么重要

阿里云已将通义千问打造为亚洲部署最广泛的开源模型家族,并成为与Meta的Llama真正具备全球竞争力的模型,证明具备前沿能力的模型可以来自硅谷以外。其开源模型发布、庞大的云基础设施以及ModelScope生态系统,为开发者——尤其是受美国出口管制影响的市场——提供了可信且高质量的西方AI平台替代选择。

深度解析

阿里云—也称为阿里云—于2009年作为马云的阿里巴巴集团的云计算部门推出,最初是为处理双十一全球最大的在线购物活动所出现的巨大的流量高峰而建立的。从最初的内部基础设施逐渐发展为中国领先的公共云提供商,占据了国内市场的约三分之一。但对AI世界来说,真正的故事始于2023年,当时阿里云发布了首个Qwen(通义千问)模型,并承诺采取激进的开放权重策略,这将重塑全球可访问的基础模型格局。

Qwen模型家族

Qwen系列的发展速度令西方实验室措手不及。Qwen 1.0于2023年中期首次亮相,是一款令人尊敬但并不特别的大型语言模型。2024年初发布的Qwen 1.5显著缩小了与前沿模型之间的差距。随后Qwen 2和Qwen 2.5迅速推出,其中Qwen2.5-72B在大多数基准测试中与Llama 3.1-70B相匹配或超越,同时真正实现了多语言支持—不仅仅是英语加一些中文,而是在包括阿拉伯语、日语、韩语和东南亚语言在内的数十种语言上表现强劲,而这些语言大多数西方模型处理得并不好。由阿里达摩院的白金泽领导的Qwen团队还扩展到多模态领域,包括用于视觉语言任务的Qwen-VL和Qwen-Audio,以及专门的编码变体(Qwen-Coder)和数学模型(Qwen-Math)。到2025年,Qwen已成为亚洲大部分地区生产使用中事实上的默认开放权重模型家族。

开放权重作为策略

阿里云决定在Apache 2.0许可证下发布Qwen模型并非出于慈善目的—而是一项旨在扩大云市场份额的精心策划的举措。该策略与Meta的Llama策略相似:免费提供模型,销售计算资源。每一个在阿里云ModelScope平台上对Qwen进行微调的开发者,每一个通过阿里云推理API部署Qwen的初创公司,每一个基于Qwen构建并需要托管服务的企业—他们都可能成为潜在的云客户。这一策略在那些由于美国对先进芯片的出口管制,使得运行来自美国供应商的前沿封闭模型要么不切实际,要么在政治上不可取的市场中尤为有效。阿里云已将Qwen定位为那些希望建立国内AI能力而不依赖OpenAI或Google的国家的主权AI选择。

应对芯片限制

自2022年10月以来,美国对先进半导体向中国的出口管制不断收紧,这已成为每一个中国AI实验室—包括阿里云在内的限制性因素。由于无法购买NVIDIA H100或其后续产品,阿里云已大力投资于其自研的Hanguang 800 AI加速器,并据报道在禁令生效前已囤积了大量旧版A100芯片。Qwen团队在计算资源的使用上也变得非常高效,似乎在训练计算资源的使用量上远低于可比的西方模型,尽管这究竟是真正的算法效率还是仅仅是不透明的报告存在争议,但结果本身说明了一切:Qwen模型的表现始终超出其规模。

拥有AI雄心的云巨头

在所有中国AI实验室中,阿里云的定位是独特的,因为它结合了庞大的云计算基础设施和前沿模型开发。百度拥有Ernie模型,但其云计算业务较弱。腾讯拥有云规模,但模型表现不那么令人印象深刻。阿里云则两者兼备,还拥有ModelScope平台(中国版的Hugging Face),该平台已成为中国生态系统中开源AI的中心枢纽。2023年11月决定分拆并随后取消云计算部门的IPO反映了公司内部在AI投资力度与盈利能力优化之间的紧张关系。到2025年初,阿里巴巴集团已承诺在未来三年内投资超过500亿美元用于云计算和AI基础设施—这一信号表明以AI为核心的战略最终胜出。对于美国科技生态系统之外的开发者和企业而言,阿里云和Qwen已成为OpenAI-微软轴心之外最可信的开放替代方案。

相关概念

← 所有术语
← 智能体 对齐 →
ESC