Databricks的ML堆栈包括:MLflow(最流行的开源ML实验追踪工具,由Databricks创建)、Unity Catalog(数据治理和模型注册表)、Mosaic ML的训练基础设施(用于训练DBRX)和模型服务端点。该平台处理从数据湖仓中的原始数据到部署模型的完整工作流,这是其相对于单点解决方案的关键差异化优势。
DBRX是Databricks的开放权重LLM,使用混合专家架构(总共132B参数,36B活跃)。发布时与Llama 2 70B和Mixtral 8x7B具有竞争力。比模型本身更重要的是,DBRX证明了Databricks有能力在内部训练前沿规模的模型,验证了他们的Mosaic ML收购,并将他们定位为除平台业务外的可信AI实验室。