Stability AI通过发布Stable Diffusion点燃了开源图像生成革命,创建了一个由数千个衍生模型、工具和创意应用组成的生态系统,这是任何封闭平台都无法匹敌的。即使经历了领导层变动和财务动荡,他们的基础理念——生成式AI应为所有人所用,而不仅仅是那些能负担得起API调用的人——彻底重塑了整个行业,并为开源AI公司的运营方式设定了模板。
Stability AI由伦敦的创业者兼前对冲基金分析师Emad Mostaque于2019年创立,当时他的愿景似乎近乎激进:最强大的生成式AI模型应该向所有人开放和普及,而不是被企业API所垄断。公司早期的岁月主要用于资助学术研究——最关键的是慕尼黑路德维希·马克西米利安大学CompVis团队和Robin Rombach团队的工作,他们正在构建潜在扩散模型。当Stable Diffusion于2022年8月发布时,它犹如一颗炸弹。首次,任何拥有良好GPU的人都能从文本提示中生成逼真的图像,且模型权重是免费的。艺术界、科技行业和版权律师几乎同时注意到了这一现象。
Stability AI真正与众不同的地方在于决定以宽松许可证发布Stable Diffusion。竞争对手如Midjourney和DALL-E保持模型专有;Stability则将其开源。这几乎一夜之间创造了一个庞大的生态系统——数千个微调变体、用于姿态引导的ControlNet、用于风格迁移的自定义LoRAs、补绘扩展,以及由社区免费构建的整个平台,如Automatic1111的网页界面。这种策略在推广上非常成功,但对收入却带来了复杂性:当你的核心产品是免费的,你到底在卖什么?Stability的回答是API访问、企业授权和名为DreamStudio的消费产品,但这些从未产生足以支撑其10亿美元以上估值的收入。
到2023年,裂痕已经显现。出现了财务压力、未能按时发放工资以及Mostaque公开承诺与公司实际发展轨迹之间的日益紧张。几位关键研究人员离职——尤其是Robin Rombach和原Stable Diffusion团队的其他成员,他们后来创立了Black Forest Labs。2024年3月,Mostaque在董事会压力下辞去CEO职务,公司进入了一段不确定时期。临时领导层稳定了运营,Stability继续发布模型——SDXL已经取得了良好反响,Stable Diffusion 3则通过其多模态Transformer主干架构展示了架构上的雄心——但那种势不可挡的氛围已经消失。
无论Stability公司未来如何,作为催化剂的Stability已经在历史上留下了印记。Stable Diffusion 1.5仍然是现存最常被微调的模型之一,其社区生态系统远超任何单一公司所能构建的规模。SDXL将质量提升到接近照片级的1024x1024分辨率。Stable Audio和Stable Video Diffusion将这种方法扩展到其他模态。技术传承贯穿于几乎所有后续的开源图像模型:如果你正在使用FLUX、Playground或任何数量的社区模型,你所依赖的架构和训练方法都是Stability资助并发布的。对于艺术家和设计师而言,Stability的模型成为了默认起点——你用自己的数据集进行微调的模型,你用ControlNet包裹以获得精确姿态的主干,以及背后支撑着数百种创意工具的引擎,这些工具若不是开源,可能永远无法存在。
Stability目前的处境艰难但并非没有希望。公司仍雇佣着才华横溢的研究人员,并继续发布具有竞争力的模型。但竞争格局已发生巨大变化——Black Forest Labs凭借FLUX夺得了开源图像生成的桂冠,而资金充足的竞争对手如Midjourney和Adobe则分别蚕食了消费市场和企业市场。Stability的最佳前进路径可能在于加倍专注于最初让它变得重要的因素:成为所有人构建的开源基础层。该商业模式是否能持续支撑这一使命,仍是核心问题。