T
traeai
Sign in

产品

Legal Agent Benchmark

别名:LAB

用于评估法律AI代理能力的开源基准测试工具。

已跟踪 2 条高相关材料

TraeAI 观察

相关材料

已收录 2 条与 Legal Agent Benchmark 相关的内容,按评分排序。

we need more benchmarks!

awesome work by harvey here, and excited to work with them

We Need More Benchmarks!

Harrison Chase(@hwchase17)250 字 (约 1 分钟)
45

Harrison Chase shares Harvey's new open-source long-horizon legal agent benchmark, calling for better evaluation frameworks for AI agents in specialized domains.

入选理由:AI代理在法律领域的应用需要专门的长周期任务基准测试。

FeaturedTweet#AI Agent#Benchmark中英混合

跨材料问答 · Legal Agent Benchmark

回答基于:Legal Agent Benchmark 相关 2 条材料
    0 / 500

    AI may generate inaccurate information. Please verify important content.