Last week we revamped Liteparse to be the fastest PDF parser out there ⚡️

Jerry Liu(@jerryjliu0)

Jerry Liu(@jerryjliu0)2026年6月1日

Last week we revamped Liteparse to be the fastest PDF parser out there ⚡️

6.5内容质量

TL;DR · AI 摘要

LiteParse v2 重构为全球最快 PDF 解析器，支持带边界框的文本提取，便于代码代理回溯原始文档。

核心要点

LiteParse v2 用 Rust 重写，性能超越 pymupdf、pypdf 等主流开源解析器。
提供带 bounding boxes 的结构化输出，支持审计溯源至原始 PDF。
已开源，支持 Markdown，欢迎提交 Issue 和功能请求。

结构提纲

按章节快速跳转。

§LiteParse v2 发布
团队将 LiteParse 重构为全球最快的 PDF 解析器，使用 Rust 编写。
§核心能力升级
不仅提取文本，还输出精确的 bounding boxes，支持代码代理回溯源文档。
§开源与社区参与
项目开源在 GitHub，支持 Markdown，并鼓励用户提交 Issue 和 PR。

思维导图

用一张图看清主题之间的关系。

查看大纲文本（无障碍 / 无 JS 友好）

LiteParse v2：全球最快 PDF 解析器
- 技术栈
  - Rust 重构
- 核心特性
  - 带 bounding box 的文本提取
  - 支持审计溯源
- 开源生态
  - GitHub 开源仓库
  - 支持 Markdown

金句 / Highlights

值得收藏与分享的关键句。

LiteParse v2 是目前世界上最快的 PDF 解析器，且比任何其他无模型开源解析器更准确。
— 第 1 段
⬇︎ 下载 PNG 𝕏 分享到 X
它提供带 bounding boxes 的文本输出，使编码代理能绘制精确的审计追踪回源文档。
— 第 2 段
⬇︎ 下载 PNG 𝕏 分享到 X
项目已开源，支持 Markdown，欢迎提交 Issue、PR 和功能请求。
— 第 3 段
⬇︎ 下载 PNG 𝕏 分享到 X

#PDF#Rust#开源

打开原文

Jerry Liu 在 X 上发文：“上周我们对 Liteparse 进行了全面升级，使其成为目前最快的 PDF 解析器 ⚡️

Liteparse 的一个被低估的功能是，它不仅提供文本，还会给出边界框，让代码代理能够绘制精确的审计追踪，回到原始文档。

例如，请查看我们为 Liteparse 样本编写的深度研究技能：github.com/jerryjliu/lite 请来体验 Liteparse：github.com/run-llama/lite 我们正在努力让 Liteparse 更加完善（例如支持 Markdown）。欢迎随时提交问题、PR，并告诉我们你的功能需求 Image 2: 🙏

引文

Jerry Liu

@jerryjliu0

5月27日

我们创造了世界上最快的 PDF 解析器 Image 3: ⚡️ 它比任何其他开源、无模型的 PDF 解析器（pymupdf, pypdf, markitdown, pdftotext, opendataloader, pymupdf4llm）都更准确。推出 LiteParse v2 —— 我们将整个库重写为 Rust 并 x.com/llama_index/st…

https://x.com/jerryjliu0/status/2059710330016817501/photo/1