Automating contract intelligence with Doczy.ai™ on AWS

TL;DR · AI 摘要
Doczy.ai™ 利用 AWS 生成式 AI 自动化合同智能分析,将非结构化文档转化为可查询的结构化数据,准确率从 55% 提升至 99%,显著提升企业运营效率。
核心要点
- Doczy.ai™ 在 2024 年基于 AWS 的 AI 处理实现了 99% 准确率,远超 2020–2023 年 55% 的规则系统水平。
- 通过专利‘智能分块’算法,Doczy.ai™ 将非结构化文档转化为可查询信息库,支持高效检索和决策。
- 系统架构覆盖从文件上传到生成业务洞察的全流程,集成 Amazon S3、Textract、Lambda 和 Cognito。
结构提纲
按章节快速跳转。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- Doczy.ai™ 合同智能自动化
- 技术架构
- 前端:Next.js + Cognito
- 存储:Amazon S3
- 处理:Lambda + Textract
- 性能提升
- 准确率从 55% → 99%
- 处理量从 100/周 → 自动化规模化
金句 / Highlights
值得收藏与分享的关键句。
Doczy.ai™ 在 2024 年基于 AWS 的 AI 处理实现了 99% 准确率,远超 2020–2023 年 55% 的规则系统水平。
通过专利‘智能分块’算法,Doczy.ai™ 将非结构化文档转化为可查询信息库,支持高效检索和决策。
系统架构覆盖从文件上传到生成业务洞察的全流程,集成 Amazon S3、Textract、Lambda 和 Cognito。
从数千份合同和法律文件中提取可操作的洞察仍是一项挑战。对于企业而言,关键业务信息被锁定在诸如合同、法律协议、服务提供商安排和供应商发票等非结构化文档中。传统上,提取并运营这些信息是一个手动、易出错且资源密集的过程,导致错失节省机会、产生高昂延迟,并在整个企业范围内造成显著低效。
AArete 是一家专注于医疗保健领域的全球管理与技术咨询公司,认识到这一挑战,并开发了 Doczy.ai™ —— 一款基于生成式人工智能并在亚马逊云服务(AWS)上运行的智能合同解读解决方案。
在本文中,我们将展示 Doczy.ai™ 如何利用 AWS 上的生成式人工智能大规模自动化合同智能,将非结构化文档转化为结构化、可操作的洞察,使组织能够自动化关键业务流程,并充分释放其数据的价值。
挑战:数据被困在文档中
对医疗机构而言,管理和解读合同及文件代表了一个主要的操作瓶颈。人工审核流程需要部署团队从数千份文档中提取数据。这种做法既不可扩展也不可持续,极易出错且成本高昂。依赖机构知识的组织还面临额外风险:关键信息集中在少数关键人员手中,形成知识孤岛并带来继任规划难题。现有的合同生命周期管理系统(CLM)往往难以捕捉每个协议独有的复杂和细微条款。这些遗留系统只能配置预定义字段,无法涵盖区分合同的丰富细节和上下文信息。下游影响巨大:在医疗领域,报销条款必须手动转换为理赔系统——这是一个缓慢且易出错的过程。同样,核对供应商发票与合同条款通常也需要人工操作,导致付款处理延迟和错失合同节约机会。这些低效最终让大量价值流失。
这就是 Doczy.ai™ 能提供重大价值的地方。
Doczy.ai™:智能合同解读解决方案
Doczy.ai™ 利用先进的 AI 和 AWS 的可扩展性直接应对上述挑战。由 AArete 开发的 Doczy.ai™ 推动了文档智能的边界。该解决方案自动解读复杂文档,并将其转换为结构化、可查询的信息库,使组织能够充分释放其数据价值并推动更明智的决策。Doczy.ai™ 的演进反映了 AI 技术的快速进步。在 2020 年之前,文档处理需要人工操作,个人每周仅能处理约 100 份文档。在 2020 至 2023 年期间,该公司实施了基于规则的合同处理,准确率约为 55%。真正的突破发生在 2024 年,基于 AWS 构建的 AI 处理系统实现了 99% 的准确率——相比传统基于规则系统的 55% 准确率,这是一个巨大的飞跃。
Doczy.ai™ 架构
Doczy.ai™ 基于一套全面的 AWS 架构构建,旨在处理整个文档处理生命周期:从文件进入系统那一刻起,到生成可操作商业智能的那一刻止。

_Doczy.ai™ 架构_
外部用户通过安全的 Next.js 前端访问平台,后台由 Amazon Cognito 管理身份验证和授权。认证后,用户直接上传文档至 Amazon Simple Storage Service (Amazon S3),其中持久、可扩展的对象存储确保无一遗漏且所有内容均可大规模访问。从那里,真正的智能才开始。
一个 AWS Lambda 函数触发 Amazon Textract 提取各种格式文档中的文本和元数据。在这一阶段,Doczy.ai™ 的独特之处在于其专利“智能分块”算法——一种专有的方法,远超简单地从页面上提取单词。它不将文档视为简单的文本序列,而是保留文档内的层级结构和一对多关系。该算法结合语义搜索和关键词搜索,将文本分解为有意义、上下文感知的块,并应用动态参数以在整个过程中保持逻辑关系。顺序标识符和元数据驱动的分组将这些块组织成字段组,检测重叠并移除重复项,同时保持文档的自然流程不变。
分块处理后,文档将进入 Doczy.ai™ 的双聚类引擎。该双视角方法论从语义和结构两个维度同时分析每一份合同。在语义层面,提取的文本被转换为嵌入向量——即意义的数值表示——即使表达方式不同,相似的概念也会被归为一类。在结构层面,模式识别算法识别条款类型、格式规范、表格布局及层级组织结构,从而理解其含义。例如,一个三层嵌套附录与一个简单的附加表单所承载的根本性含义截然不同。
这两个分析并非孤立运行。投影算法将语义聚类与结构聚类并列对比,综合生成统一且丰富的文档模型,既捕捉语义又保留上下文。正是这种融合驱动了 Doczy.ai™ 99% 的准确率。系统不仅读取文字,更深入理解合同内容。随后,先进的大型语言模型(LLM)基于这一双聚类智能生成结构化输出。
在最终输出前,系统会确定每个文档的文件类别,并根据提取文本、聚类分类及领域上下文生成定制化提示。通过少量示例和多轮提示,平台持续依据领域特定示例和真实输出调整提示,形成不断强化准确率的反馈循环。
生成的结构化数据流入 Snowflake,形成中央存储库,为智能仪表板提供可操作洞察与可视化支持。在整个流程中,Amazon CloudWatch 实时监控性能,主动提前暴露潜在问题;而 AWS Secrets Manager 则保障敏感信息的安全,确保安全不是事后补充,而是贯穿系统每一环节的基础架构。
Doczy.ai™ 的变革性影响
这种 AI 驱动的方法成果显著且可量化。通过自动化合同解读与文档处理,Doczy.ai™ 已在医疗健康与金融服务等多个组织中展现出规模化的重要影响。过去 22 个月的运营规模充分证明了 Doczy.ai™ 的成熟度与生产就绪能力。该解决方案已处理 250 万份合同文档(共计 5000 万页),调用 Amazon Bedrock API 达 1.37 亿次,处理 4420 亿个 token——这是以往人工或传统文档处理手段无法企及的自动化与准确性水平。同期,Doczy.ai™ 帮助客户累计实现约 3.3 亿美元的直接与间接节省成本。
99% 的准确率相较规则系统约 55% 的准确率实现了显著提升,也远超人工处理效率——后者常因疲劳与人为失误导致偏差。手动处理时间减少 97%,直接转化为成本节约,并使企业能够重新分配人力资源至需要判断力与战略思维的高价值活动。
实际应用场景:健康计划业务流程自动化
对健康计划而言,Doczy.ai™ 提供了一种强大方案,可自动化并优化合同管理全生命周期。它能接收纸质与数字格式的现有合同,集成 Coupa 和 Icertis 等合同管理系统,并实时处理新合同及修订版本。随后,它构建集中式元数据仓库,直接对接下游系统,实现端到端业务流程自动化。
这种自动化释放了关键能力:组织可持续分析与优化合同条款,发现提升财务表现与运营效率的机会。架构将准确、实时的合同数据直接输入理赔系统,自动完成此前需手动翻译报销条款的配置过程,消除手动数据录入、配置错误与延迟。此外,平台还能通过比对支付与合同条款,评估付款准确性,提前识别差异并标记潜在超额或欠付情况。
通过自动化手工流程,健康计划可快速适应新合同条款与监管要求。Doczy.ai™ 提供的智能仪表板与可操作洞察,使决策者能够了解合同绩效、识别趋势并主动采取措施以优化财务结果。
开始使用 Doczy.ai™
希望利用 Doczy.ai™ 改变文档处理与合同管理的机构,可联系 AArete 讨论具体用例与需求。AArete 将该平台作为 软件即服务 (SaaS)解决方案提供,无需重大基础设施投入即可快速部署。AArete 的专家团队将针对您的特定文档类型、领域术语与业务流程进行定制配置,确保从第一天起即可最大化价值。
结论
解锁非结构化文档中的数据对许多企业而言是一项重大挑战,尤其是在医疗保健和金融服务领域,合同与协议决定了关键的运营和财务关系。通过采用 AWS 上的智能文档智能技术,组织可以解决这一长期存在的运营难题,并开启新的战略优势前沿,将数据转化为最具价值的资产。
Doczy.ai™ 基于一套精妙的架构构建而成,整合了 Amazon Cognito、Amazon S3、AWS Lambda、Amazon Textract、Amazon Elastic Container Service (Amazon ECS)、Amazon Bedrock、Amazon CloudWatch 和 AWS Secrets Manager 等现代云服务,展示了如何利用这些服务解决复杂的、以文档为主的商业问题。其先进的混合智能分块、双聚类和提示优化技术构成了一个已获专利的合同智能引擎的核心。
Doczy.ai™ 实现了切实的成效:每周可处理高达 25 万份合同文件,准确率达 99%,将人工处理时间减少 97%,并在 22 个月内帮助客户累计节省约 3.3 亿美元。通过采用这种智能文档处理方式,组织能够将合同转化为战略性数据资产,提升效率、准确性和盈利能力,同时释放团队专注于更高价值的工作。
如欲了解 AArete 和 Doczy.ai™ 如何助力您的组织转型文档处理流程并释放非结构化数据的价值,请访问 AArete 官网。
- * *