T
traeai
登录
返回首页
Qdrant(@qdrant_engine)

About 90% of enterprise data is unstructured, and most of it lives in documents. PDFs, spreadsheets,...

7.5Score
About 90% of enterprise data is unstructured, and most of it lives in documents. PDFs, spreadsheets,...

TL;DR · AI 摘要

90% 的企业数据是非结构化的,主要存储在文档中,前沿模型在处理这些数据时仍面临挑战。

核心要点

  • 企业数据中约 90% 是非结构化的,主要以 PDF、表格和 Word 文件形式存在。
  • 前沿 AI 模型在处理真实世界文档时仍存在困难,需改进 OCR 和代理技术。
  • Vector Space Day 是一个专注于下一代检索系统的工程师会议,将于 6 月 11 日在旧金山举行。

结构提纲

按章节快速跳转。

  1. 90% 的企业数据是非结构化的,主要存储在文档中。

  2. 前沿模型在处理真实世界文档时存在困难,需改进 OCR 和代理技术。

  3. 专注于下一代检索系统的工程师会议,将于 6 月 11 日在旧金山举行。

思维导图

用一张图看清主题之间的关系。

查看大纲文本(无障碍 / 无 JS 友好)
  • 企业数据与AI挑战

金句 / Highlights

值得收藏与分享的关键句。

  • About 90% of enterprise data is unstructured, and most of it lives in documents.

    第 1 段

    ⬇︎ 下载 PNG𝕏 分享到 X
  • Even frontier models struggle with real-world documents, and what better OCR and agent harnesses actually unlock.

    第 2 段

    ⬇︎ 下载 PNG𝕏 分享到 X
  • Vector Space Day is a full-day conference for engineers building the next generation of retrieval systems.

    第 3 段

    ⬇︎ 下载 PNG𝕏 分享到 X
#数据处理#AI模型#OCR#会议
打开原文

Qdrant在X上发文:「企业数据中约90%是非结构化数据,且大部分存在于文档中。PDF文件、电子表格、Word文档等,这些都是支撑企业运营的核心资料。来自@llama_index的Preston Carlson将出席Vector Space Day,探讨为何即使是当前最先进的模型在处理真实文档时仍会遇到困难,以及更优质的OCR和代理工具究竟能释放哪些潜力。Vector Space Day是一场面向下一代检索系统开发工程师的全天候会议。立即报名参加6月11日在旧金山The Midway举行的活动:[https://luma.com/vsd-sf](https://t.co/a190CwvDud)」 / X

图片1

Qdrant

@qdrant_engine

企业数据中约90%是非结构化数据,且大部分存在于文档中。PDF文件、电子表格、Word文档等,这些都是支撑企业运营的核心资料。来自

@llama_index

的Preston Carlson将出席Vector Space Day,探讨为何即使是当前最先进的模型在处理真实文档时仍会遇到困难,以及更优质的OCR和代理工具究竟能释放哪些潜力。Vector Space Day是一场面向下一代检索系统开发工程师的全天候会议。立即报名参加6月11日在旧金山The Midway举行的活动:https://luma.com/vsd-sf

图片2: 图片

下午3:00 · 2026年5月28日

·

151 次浏览

1

3

AI 可能会生成不准确的信息,请核实重要内容

About 90% of enterprise data is unstructured, and most of it lives in documents. PDFs, spreadsheets,... | Qdrant(@qdrant_engine) | traeai