T
traeai
登录
返回首页
Databricks

Unlocking semantics for AI: How Mercedes-Benz Korea built trusted “Talk to Data” at scale

8.5Score

TL;DR · AI 摘要

梅赛德斯-奔驰韩国通过构建统一的语义层,实现了AI驱动的“Talk to Data”能力,为全球市场提供可扩展的自服务分析解决方案。

核心要点

  • 梅赛德斯-奔驰韩国在Unity Catalog中定义了500多个KPI,使用Databricks的DAX到Metric View自动转换器加速部署。
  • 通过Unity Catalog Metric Views和Genie,实现了BI和AI的一致语义层,确保回答与现有KPI定义一致。
  • 基于统一KPI层和Agent Bricks,梅赛德斯-奔驰韩国构建了可扩展的AI代理方案,适用于销售、产品、财务和营销团队。

结构提纲

按章节快速跳转。

  1. 梅赛德斯-奔驰韩国Databricks合作,构建了AI驱动的“Talk to Data”能力。

  2. ·KPI语义层的构建

    梅赛德斯-奔驰韩国在Unity Catalog中定义了500多个KPI,并使用Databricks的DAX到Metric View自动转换器加速部署。

  3. 通过Unity Catalog Metric Views和Genie,实现了BI和AI的一致语义层,确保回答与现有KPI定义一致。

  4. 基于统一KPI层和Agent Bricks,构建了可扩展的AI代理方案,适用于多个业务团队。

思维导图

用一张图看清主题之间的关系。

查看大纲文本(无障碍 / 无 JS 友好)
  • Talk to Data的统一语义层
    • KPI定义与语义层
      • Unity Catalog Metric Views
      • DAX到Metric View自动转换器
    • AI与BI的一致性
      • Genie
      • Agent Bricks
    • AI代理的扩展
      • 销售团队
      • 产品团队
      • 财务与营销团队

金句 / Highlights

值得收藏与分享的关键句。

  • Answer reliability is highest when AI can draw on clearly governed business logic rather than inferring it from complex schemas.

    第 4 段

    ⬇︎ 下载 PNG𝕏 分享到 X
  • Mercedes-Benz Korea built on its established Lakehouse and Power BI stack by making 500+ KPI definitions available in an open, AI-ready semantic layer on Unity Catalog metric views.

    第 2 段

    ⬇︎ 下载 PNG𝕏 分享到 X
  • Building on Unity Catalog metric views, Genie, and Agent Bricks, Mercedes-Benz Korea is shaping a playbook for persona-based AI agents on top of a shared KPI layer.

    第 3 段

    ⬇︎ 下载 PNG𝕏 分享到 X
#AI#数据治理#Unity Catalog#Databricks#KPI
打开原文

为 AI 解锁语义:梅赛德斯-奔驰韩国如何构建可扩展的受信任的“与数据对话” | Databricks 博客

跳至主要内容

制造业

2026 年 6 月 11 日

为 AI 解锁语义:梅赛德斯-奔驰韩国如何构建可扩展的受信任的“与数据对话”

梅赛德斯-奔驰韩国与 Databricks 如何使用 Unity Catalog、Metric Views、Genie 和 Agent Bricks 试点 AI 就绪语义和 AI 代理

作者:Sai Yang、Fares Kamal、Alina Kamal、Andreas Jäck、Johannes Laufer 和 Manuel Culebras

摘要

  • 一个 KPI 层:梅赛德斯-奔驰韩国在其已建立的 LakehousePower BI 基础上,通过在 Unity Catalog 的 Metric Views 上开放 500 多个 KPI 定义的 AI 就绪语义层,使用 Databricks 提供的自动 DAX 到 Metric View 转译器加速了这一转变。
  • 用于 BI 和 AI 的受控语义:通过 Unity Catalog 的 Metric Views,梅赛德斯-奔驰韩国扩展了其用于企业 KPI 的受控语义层。该层支持现有的 BI 报告和新的“与数据对话”体验,Genie 和 Agent Bricks 提供的答案与现有的 KPI 定义一致。
  • 跨市场扩展“与数据对话”:基于 Unity Catalog 的 Metric Views、Genie 和 Agent Bricks,梅赛德斯-奔驰韩国正在制定一个基于角色的 AI 代理的方案,该方案建立在共享的 KPI 层之上,可以作为其他梅赛德斯-奔驰销售市场在为销售、产品、财务和营销团队提供自助分析时的参考。

“与数据对话”正在迅速成为各行各业的重要能力,而以企业级质量交付它需要强大的语义基础。当 AI 能够基于明确受控的业务逻辑进行回答,而不是从复杂的架构、特定报告的 KPI 逻辑或独立的仪表板中进行推断时,答案的可靠性最高。一致的 KPI 定义、对齐的业务逻辑和明确的连接和聚合是高管们所需的可解释答案的关键。

梅赛德斯-奔驰韩国与 Databricks 共同应对这一挑战。他们没有将“与数据对话”视为一个聊天机器人项目,而是通过扩展其现有的分析基础,构建了一个用于企业 AI 的受控语义层。为了使语义能够支持 BI 和 AI,梅赛德斯-奔驰韩国除了在 Power BI 中,还在 Unity Catalog 的业务语义中提供了 KPI 逻辑。借助 Databricks 数据智能平台上的 Metric Views、Genie 和 Agent Bricks,梅赛德斯-奔驰韩国试点了一种统一的数据、语义和代理 AI 架构。韩国试点的经验可以作为其他梅赛德斯-奔驰市场的参考。

梅赛德斯-奔驰韩国在“与数据对话”中的愿景:BI 和 AI 的统一语义

梅赛德斯-奔驰是高端豪华汽车细分市场的领导者,运营着一个全球销售网络,其中数据驱动的、市场特定的决策制定是持续的优先事项。“与数据对话”自助分析是一项正在探索的能力,以进一步支持这一优先事项。

现代汽车韩国拥有成熟的数据基础。多年来,现代汽车韩国建立了黄金层报告数据、主KPI目录,并在Databricks的Lakehouse和Unity Catalog中定义了共享的术语。这一基础作为BI报告、自动化和其他数据产品的单一事实来源,覆盖了销售、产品、营销、客户服务和财务等业务领域超过500个KPI。基于这一基础,现代汽车韩国被选中试点“与数据对话”的方法。

同时,现代汽车韩国的大量业务语义是在Power BI中定义的。作为为AI用例做准备的一部分,这些定义通过Lakehouse中的一个开放且AI就绪的语义层进行了补充。

现代汽车韩国对“与数据对话”的更广泛愿景是建立一个统一、AI就绪且受控的语义基础,以支持基于一致业务定义的企业决策,涵盖报告、自助分析和AI体验。根据这一愿景,现代汽车韩国并未将“与数据对话”视为远离Power BI的迁移,而是追求三个关键目标:

  • AI的一致上下文:业务逻辑和KPI已经在两个层级上定义:在Power BI的DAX语言中用于报告,在Lakehouse中经过整理的银层和金层表中,这些表已准备好被AI使用。下一步是将语义上下文从BI报告转移到Unity Catalog,以丰富Lakehouse中现有的数据产品。这样,Genie和其他AI代理可以在一个地方访问所有KPI定义,例如,同样的问题“我们按车型分类的零售销售MTD是多少?”,在所有AI体验中都能得到一致的答案。
  • 架构向代理AI演进:现代汽车韩国拥有一个成熟的BI堆栈,结合了Databricks用于数据工程和数据仓库,以及Power BI用于语义建模和报告。这一演进的下一步是通过基于BI报告中的业务逻辑的统一、AI就绪的语义层进行扩展,使下游的BI工具和AI代理能够基于相同的受控KPI进行操作。
  • 从报告用户到基于角色的代理:现有数据基础设施中已经为桌面上和报告级别的终端用户提供了治理。下一步是通过Unity Catalog中的基于角色的访问控制和基于角色代理的编排规则来扩展这种治理,使如CFO或销售副总裁等角色可以拥有针对其领域定制的代理体验,而无需更改底层的业务语义。

遵循这些原则有助于实现未来AI和BI工具可以使用相同验证过的业务逻辑的目标。这有助于实现企业使用所需的统一性、可解释性和答案质量。

数据、语义和AI的统一架构

为了实现AI就绪的语义,现代汽车韩国在Databricks数据智能平台上实施了“与数据对话”,从而在大规模上实现可信AI。

该解决方案基于Databricks的不同功能协同工作:

  • Lakeflow和Lakehouse从各种源系统中摄取企业数据,并为BI和AI工作负载进行准备。
  • Unity Catalog 的业务语义是 KPI 的单一事实来源,将 Power BI DAX 度量转换为指标视图:数据源、连接、度量、维度、注释和同义词都与数据一同存在,并受与底层表相同的权限控制。
  • Genie 空间使业务团队能够“与数据对话”。Genie 空间按业务领域组织,每个空间都由一组精心挑选的指标视图支持。由于指标视图中的 KPI 直接定义在金层数据之上,Genie 不需要猜测或复杂的连接来找出正确答案,从而提高了响应速度和准确性。
  • Agent Bricks 在多个 Genie 空间之上构建基于角色的代理,因此 CFO、销售副总裁和市场总监都能获得为其角色量身定制的“与数据对话”体验。
  • Databricks Apps 为组合代理提供自定义前端、与外部服务的连接及其他扩展功能,其记忆和状态存储在 Lakebase 中。

在试点之前,报告数据存储在 Hive 元数据存储中,并通过基于 Power BI 报表的报告中心语义的其他 AI 解决方案探索了“与数据对话”功能。在那种架构下,BI 和 AI 的语义上下文分布在多个组件中,使得 AI 层难以在用户和工作负载之间保持语义的一致性。基于角色的 KPI 访问控制也尚未实现,而其他 AI 解决方案需要更多的显式指导和提示调整,而 Genie 则直接在 Unity Catalog 中受控的 KPI 层上运行。

在 Databricks 上采用这种架构为业务用户提供了一个流畅的“与数据对话”体验奠定了基础。

加速试点:自动化的 DAX 到指标视图转换器

将 Power BI DAX 中的业务逻辑也引入到 Unity Catalog 指标视图中,是构建开放语义层的关键一步。在梅赛德斯-奔驰韩国,有超过 500 个 DAX 定义的 KPI,因此需要一种高效且标准化的方法。为此,Databricks 为梅赛德斯-奔驰韩国团队构建了一个自动化的 DAX 到指标视图转换器。

该转换器作为一条管道运行,将 Power BI DAX 度量转换为可部署的 Databricks 指标视图。它:

  • 解析 Power BI 语义模型并提取每个 DAX 度量。
  • 为从 Power BI 语义模型中提取的每个度量创建一个元数据目录,例如事实表、维度表、连接关系、连接键等。
  • 将每个度量的源表映射到 Unity Catalog 中的对应表。
  • 生成指标视图定义的草稿(数据源、连接、维度、度量),将 DAX 语义转换为指标视图度量,并生成创建指标视图的可运行 SQL 语句。
  • 标记无法自动处理的度量,通常涉及复杂的 DAX 特定功能(如行上下文操作),以供人工审核。
  • 在编译指标视图之前验证语法和聚合逻辑。

当管道完成时,它会生成一份评估报告,包含转换统计信息、差距分析以及针对无法自动转换的 DAX 度量的补救策略。

输出结果是一个强大的起点,提供了可以直接使用的度量视图,用于自动化 DAX 度量,节省了数百小时的手动工作,用于语义迁移。从那里开始,团队会将每个度量与对应的 Power BI 报表进行验证,并使用 Genie Code 进行迭代,Genie Code 会根据自然语言输入对度量视图定义进行优化和改进。

在看到这个转译器的初步成功后,Databricks 将这些功能整合到一个新的 Genie Code 技能中,用于 Power BI 迁移,目前该技能处于私有预览阶段,可以直接在 Genie Code 中使用,无需额外工具,并支持在梅赛德斯-奔驰的进一步推广。

构建可信且 AI 就绪的语义

对于梅赛德斯-奔驰韩国的“与数据对话”业务用户来说,回答质量是首要任务。将 KPI 作为度量视图引入 Genie 空间是关键步骤,但这本身并不能保证代理 AI 提供可靠答案。只有当 Genie 的回答经过验证后,度量视图才是 AI 就绪的。梅赛德斯-奔驰韩国的内部目标是 Genie 的回答与对应的 Power BI 报表完全一致——每个范围内的 KPI 都有 100% 的匹配度。

在试点过程中,梅赛德斯-奔驰韩国与 Databricks 共同记录了整理、集成和优化度量视图和 Genie 空间的最佳实践,包括使用代理元数据和基准。这些实践支持 AI 就绪的业务语义,并为与企业数据交互的业务团队提供一致的答案。

在试点过程中记录的迭代五阶段流程之后,梅赛德斯-奔驰韩国在 Databricks 数据智能平台上构建了 AI 就绪的业务语义,业务用户可以依赖这些语义。Databricks 还正在开发一个 App 解决方案,以自动化这一过程,梅赛德斯-奔驰可以利用该方案进行进一步推广。

阶段 1:准备。选择要引入的 KPI,并将每个 KPI 映射到 Unity Catalog 中的源表。对于 Power BI 语义迁移,识别相关的 DAX 度量和语义模型。此阶段确定了范围和真实来源。

阶段 2:构建语义层。使用数据源、维度、度量、评论和代理元数据在 Unity Catalog 中创建度量视图。在添加下一个 KPI 之前,单独验证每个 KPI。对于跨越多个事实表的 KPI,首先构建一个基础视图,然后在上面叠加度量视图。始终在度量视图、维度和度量级别添加描述;Genie 会基于这三个级别进行推理。

阶段 3:按领域组织,而非按报告组织。围绕业务领域(如“营销”)构建 Genie 空间,并围绕子领域内的 KPI 组(如“在线营销转化指标”)构建度量视图。每个 Genie 空间限制为 30 个 Unity Catalog 项目,并始终包含空间描述,以便多代理系统可以正确路由问题。

阶段 4:逐步测试。逐步引入度量。使用示例问题验证每个度量。将已验证的查询保存为示例 SQL。然后构建基准:每个问题的措辞变体与真实 SQL 配对,用于系统地衡量回答准确性。启用提示匹配,使 Genie 能够将用户语言映射到实际数据值。

阶段 5:验证与发布。每次更改后都要运行回归测试;如果某个之前通过的基准测试失败,那么最有可能的原因是最近添加的内容。一旦系统稳定,将其部署给一小部分业务用户,以获取真实环境下的反馈。使用“Monitor”标签页,可以在一个地方跟踪、审查并处理所有用户反馈。回归测试失败和用户反馈都会直接反馈到阶段 4。

输出结果是一个语义层,其中 AI 的回答与对应 BI 报告在所有范围内 KPI 上保持一致,从而支持业务用户所期望的可靠性。

从单一的 Genie 空间到具有内置治理的多智能体系统

一个 Genie 空间可以回答某一领域的问题。对于梅赛德斯-奔驰市场来说,一个真正的“与数据对话”体验需要涵盖销售、产品、营销、客户服务、财务等多个方面,同时根据每个角色和权限定制每个人看到的内容。

这就是 Agent Bricks 的作用。梅赛德斯-奔驰韩国部署的架构如下:

  • 父级监督智能体将每个问题路由到具有特定角色指令的智能体。
  • 角色智能体(例如“首席财务官”、“销售经理”、“市场分析师”)从相关领域中适当的 Genie 空间中汇总见解,选择合适的指标视图范围来回答问题。
  • Unity Catalog 治理策略强制实施行级和列级访问控制,因此区域经理只能看到其角色允许查看的数据,即使使用自然语言提问也是如此。
  • 智能体通过 Databricks Apps 展示,具有定制的前端和扩展功能,如定制可视化、智能体记忆和 Lakebase 上的事务数据库。该应用还允许将这些智能体与业务用户已使用的工具和服务集成,因此“与数据对话”可以嵌入到他们的日常工作中,而不是作为独立的目的地。

由于指标视图存储在 Unity Catalog 中,它们可以在所有 Genie 空间、智能体和应用中开放和重复使用。每个回答都受到完全治理、可审计,并可以追溯到源数据。这种多智能体模式可以作为将“与数据对话”扩展到更多梅赛德斯-奔驰市场的参考。

扩展试点:为全球市场提供可重复的实施方法

韩国目前仍处于这一旅程的初期,早期的成果令人鼓舞。当前的试点表明,当“与数据对话”基于受控语义时,业务用户可以获得与既定 KPI 定义和现有报告逻辑一致的答案。基于这些成果,梅赛德斯-奔驰韩国已记录了一套可重复使用的实施方法,其他市场可以借鉴:

  • 将市场数据从全球和本地源系统导入 Unity Catalog。
  • 构建 Lakeflow Spark 声明式管道,以整理黄金层的报告数据。
  • 在黄金层建立数据质量和 KPI 文档。
  • 运行 DAX 到 Metric View 的转译器,以生成初步的语义模型。
  • 将 Metric Views 与梅赛德斯-奔驰主 KPI 目录进行验证。
  • 使用上述五阶段流程构建、测试和优化 Genie 空间。
  • 在 Genie 和 Unity Catalog 上方使用 Agent Bricks 部署角色智能体。
  • 在 Databricks Apps 或第三方工具中嵌入自定义智能体,无论用户在哪里工作。

选择采用该方案的市场可以复用其架构,并专注于本地特有的内容:他们的数据、他们的关键绩效指标(KPI)以及他们的AI代理。与Databricks合作,梅赛德斯-奔驰韩国正在记录“与数据对话”试点项目的经验教训,这些经验可以作为其他梅赛德斯-奔驰市场的参考。

入门指南

  • 参加2026年Data + AI峰会的梅赛德斯-奔驰韩国 + Databricks专题会议,我们将深入讲解架构和AI就绪语义的方案。
  • 了解Unity Catalog Business Semantics、Metric Views、Genie和Agent Bricks,开始使用统一语义构建可信的代理AI。

订阅最新文章

订阅我们的博客,获取最新文章发送到您的邮箱。

注册

查看所有博客

slice-start id="_gatsby-scripts-1"

slice-end id="_gatsby-scripts-1"

AI 可能会生成不准确的信息,请核实重要内容

Unlocking semantics for AI: How Mercedes-Benz Korea built trusted “Talk to Data” at scale | Databricks | traeai