Databricks 与英伟达正式推出 Genesis Workbench,一个专为生命科学领域设计的开源 AI 应用蓝图。该平台并非发布新的大模型,而是致力于解决制药和生物科技公司在 AI 落地中面临的核心痛点:如何将现有 AI 模型与企业专有研究数据、计算基础设施有效整合,形成真正可用的科研工具。
根据 Databricks 的描述,Genesis Workbench 是一个“模块化工作台”,它将计算药物发现的主要阶段——从基因组学、单细胞分析到蛋白质工程和小分子设计——统一到一个界面和一套治理框架下。平台通过 Databricks AI Search 集中管理公共与专有数据集,完全消除了对外部 API 的依赖,使基因组学发现能无缝流转至后续的靶点结构预测、候选分子对接、ADMET 评估和排序等环节。
技术架构上,该工作台依赖 Unity Catalog 管理开源模型,利用 MLflow 追踪实验,并通过 GPU 支持的模型服务进行推理。英伟达则贡献了 BioNeMo Agent Toolkit,以及 Parabricks 等加速计算软件和一系列生物学、化学模型。这些组件共同构成一个可组合的科研环境,研究人员无需在不同工具间反复切换。
Genesis Workbench 的一个关键特性是它完全运行在客户自己的 Databricks 环境内。这意味着制药企业可以将敏感的研发数据保留在现有治理和安全控制之下,无需发送给第三方 AI 服务,这对高度受监管的生命科学行业至关重要。同时,平台的模块化设计允许机构随着生物 AI 技术的演进,灵活添加或替换单个模型组件,而不必重建整个研究环境。
这一合作也折射出企业 AI 平台演进的更广泛趋势。早期业界焦点多集中在构建更大、更强的基座模型上,而现在供应商正越来越多地围绕如何将模型与企业数据和特定领域工作流深度集成展开竞争。生命科学领域尤其典型,其研究横跨基因组学、结构生物学、化学和临床数据等多个学科,且数据高度专有并受严格监管,仅靠算力无法解决实际问题。
对 Databricks 而言,Genesis Workbench 是其从数据分析向 AI 应用层持续延伸的又一例证,进一步将湖仓一体架构推向垂直行业应用。对 英伟达 来说,此举将 BioNeMo 及其加速计算软件栈置于企业药物发现工作流的核心位置,而非仅作为独立研究工具存在。双方的目标一致:让研究人员减少在数据搬运、模型连接和基础设施配置上花费的时间,将更多精力投入到科学探索本身。