谷歌DeepMind为现代人工智能领域贡献了比任何其他单一组织都更多的基础性研究——Transformer架构、强化学习领域的突破性工作、蛋白质结构预测以及扩展定律等成果均可追溯至DeepMind或Google Brain团队。他们的Gemini模型是唯一内置真正全球分布能力的前沿大语言模型,通过搜索、安卓和谷歌工作区触达数十亿用户。仅AlphaFold一项——它解决了生物学中一个持续五十年的难题并荣获诺贝尔奖——就足以使其在科学史上留下浓墨重彩的一笔,而不仅仅是人工智能的历史。
Google DeepMind 是两个独立起源故事的产物,这两个故事于 2023 年 4 月合并为一。DeepMind 由 Demis Hassabis、Shane Legg 和 Mustafa Suleyman 于 2010 年在伦敦创立。Hassabis 算得上是一位神童 — 13 岁成为国际象棋大师,17 岁成为游戏设计师(他与 Bullfrog Productions 合作开发了 Theme Park),后来又获得了伦敦大学学院(UCL)的神经科学博士学位。他与 Legg(曾在自己的博士论文中提出“通用人工智能”这一术语)共同坚信,通过将深度学习与强化学习结合,并借鉴神经科学的见解,可以实现通用智能。2014 年 1 月,Google 以约 5 亿美元的价格收购了 DeepMind,击败了 Facebook 的竞标。与此同时,Google Brain 自 2011 年起就在 Google 内部运行,源自 Jeff Dean 和 Andrew Ng 在大规模神经网络方面的研究。Brain 成为了 Google 许多生产级 AI 系统的引擎,包括 2017 年发表的“Attention Is All You Need”Transformer 论文 — 这可以说是现代 AI 中最重要的论文。
DeepMind 的早期岁月创造了 AI 历史上最标志性的时刻。2016 年 3 月,AlphaGo 击败世界冠军李世石,这是一次真正的分水岭 — 围棋曾被认为要几十年后才能被 AI 解决。后续的 AlphaGo Zero 完全通过自我对弈学习游戏,不使用任何人类数据,而 AlphaZero 将这一方法推广到了国际象棋和将棋。但 DeepMind 最具影响力的科学成就可能是 AlphaFold。2018 年宣布并经过 AlphaFold 2(2020 年)的改进,它有效地解决了蛋白质结构预测这一困扰生物学家五十年的问题。DeepMind 为几乎所有已知的蛋白质发布了预测结构,使 Hassabis 和 John Jumper 在 2024 年获得了诺贝尔化学奖。这不仅仅是一次 AI 基准测试的胜利;它对科学做出了真正的贡献,加速了全球的药物研发和生物研究。
多年来,DeepMind 和 Google Brain 作为平行组织运行,职责重叠,关系有时紧张。DeepMind 拥有品牌和研究声望;Brain 拥有基础设施专业知识和生产集成能力。2023 年 4 月,Sundar Pichai 在 Hassabis 的领导下将两者合并为 Google DeepMind,Jeff Dean 担任首席科学家。此举部分是为了提高效率,部分则是出于紧迫性 — ChatGPT 让 Google 捉摸不透,公司需要其 AI 人才齐心协力。合并后的组织首次重大成果是 Gemini,这是 Google 于 2023 年 12 月宣布的多模态模型系列。Gemini 从底层设计为原生多模态(同时处理文本、图像、音频和视频,而不是事后添加功能),Ultra 版本声称在大多数基准测试中匹配或超越 GPT-4 — 尽管发布时因一段被篡改的演示视频而受到严厉批评。后续的 Gemini 发布,包括具有突破性百万 token 上下文窗口的 1.5 系列,以及 Gemini 2.0 和 2.5 系列,已使 Google DeepMind 成为真正的前沿竞争者。
没有其他 AI 实验室能像 Google DeepMind 一样拥有如此多的优势:几乎无限的计算能力(Google 的 TPU 集群是世界上最大的 AI 训练集群之一)、数十年积累的数据和基础设施、覆盖搜索、安卓、YouTube、Gmail 和云服务的全球分发网络,以及拥有比任何其他组织都多的基础 AI 论文的研究人才。支撑所有现代 LLM 的 Transformer 架构就是在 Google 发明的。然而,在 2023 年和 2024 年的大部分时间里,Google 看起来似乎在与 OpenAI 的产品竞赛中追赶 — 这种看法让内部人士感到沮丧,因为他们知道幕后正在进行大量尖端研究。“创新者的困境”是真实的:Google 必须将 AI 集成到每年产生 3000 亿美元收入的产品中,同时不损害其核心的搜索广告业务。
Google 的 AI 历史并非没有伤痕。2020 年 AI 伦理研究员 Timnit Gebru 被解雇,随后其联合负责人 Margaret Mitchell 离职,成为关于企业 AI 伦理和对待提出令人不安问题的研究人员的争论焦点。DeepMind 联合创始人 Mustafa Suleyman 于 2022 年因被边缘化而离开(他后来创立了 Inflection AI,并于 2024 年加入微软担任微软 AI 的首席执行官)。这些离职反映了 Google 研究文化与快速推出竞争产品的商业压力之间的更广泛紧张关系。展望未来,Google DeepMind 可能是下一阶段 AI 的最佳实验室 — 能够在不同应用中进行推理、规划和采取行动的智能体系统。他们的 Gemini 模型深度集成到 Google 的产品生态系统中,Project Astra 正在推动始终在线的 AI 助手,而 Google 基础设施的规模意味着他们可以比几乎任何人都更快地进行迭代。问题是,组织的规模和复杂性是否能让它以当下所需的速度行动。