Zubnet AI学习Wiki › Databricks
公司

Databricks

别名:Mosaic ML、DBRX、Unity Catalog
一个提供统一分析、数据工程和机器学习能力的数据和AI平台。Databricks于2023年收购了Mosaic ML以增加LLM训练能力,并发布了自己的开放权重LLM——DBRX。该平台建立在Apache Spark之上,为从数据准备到模型服务的完整ML生命周期提供托管基础设施。

为什么重要

Databricks是企业数据与AI相遇的地方。大多数公司的AI愿望始于“我们需要理解我们的数据”,而Databricks通常是在一个平台上处理数据工程、特征工程、模型训练和服务的平台。他们对Mosaic ML(以高效LLM训练闻名)的收购表明数据平台和AI平台正在融合。

深度解析

Databricks的ML堆栈包括:MLflow(最流行的开源ML实验追踪工具,由Databricks创建)、Unity Catalog(数据治理和模型注册表)、Mosaic ML的训练基础设施(用于训练DBRX)和模型服务端点。该平台处理从数据湖仓中的原始数据到部署模型的完整工作流,这是其相对于单点解决方案的关键差异化优势。

DBRX

DBRX是Databricks的开放权重LLM,使用混合专家架构(总共132B参数,36B活跃)。发布时与Llama 2 70B和Mixtral 8x7B具有竞争力。比模型本身更重要的是,DBRX证明了Databricks有能力在内部训练前沿规模的模型,验证了他们的Mosaic ML收购,并将他们定位为除平台业务外的可信AI实验室。

In The News

Databricks' $5B war chest fuels AI security play with dual acquisitions
Mar 24, 2026
← 所有术语