Let's talk document formatting. Bold. Italics. Superscripts. Strikethroughs. The visual cues humans...
LlamaIndex 🦙(@llama_index)167 字 (约 1 分钟)
78
LlamaIndex 发布 ParseBench——首个面向 AI 代理的文档 OCR 基准,首次将语义格式(加粗/删除线/上标等)纳入评估,强调视觉格式即语义。
入选理由:现有 OCR 基准完全忽略加粗、删除线、上标等人类依赖的语义格式线索
精选推文#OCR#AI Agent#Document Understanding#LlamaIndex#Benchmark中文
