T
traeai
登录
返回首页
Harrison Chase(@hwchase17)

harbor is a great framework for running longer running, more stateful agent evals it underpins term...

7.0Score
harbor is a great framework for running longer running, more stateful agent evals

it underpins term...

TL;DR · AI 摘要

Harbor 是一个用于运行更长时间、更状态化的代理评估的框架,已成为行业标准。

核心要点

  • Harbor 框架支持长时间运行和状态化的代理评估。
  • LangSmith Sandboxes 已与 Harbor 集成,提升评估环境的生产就绪性。
  • Harbor 是 Terminal Bench 2 的基础,正在成为行业标准。

结构提纲

按章节快速跳转。

  1. 介绍 Harbor 框架及其在代理评估中的重要性。

  2. Harbor 支持长时间运行和状态化的代理评估,适用于复杂场景。

  3. ·LangSmith 的集成

    LangSmith Sandboxes 已与 Harbor 集成,提供更强大的评估环境。

  4. Harbor 是 Terminal Bench 2 的基础,并正在成为行业标准。

思维导图

用一张图看清主题之间的关系。

查看大纲文本(无障碍 / 无 JS 友好)
  • Harbor 框架
    • 功能
      • 支持长时间运行和状态化的代理评估
      • 适用于复杂场景
    • 集成
      • 与 LangSmith Sandboxes 集成
      • 提升评估环境的生产就绪性
    • 行业应用
      • Terminal Bench 2 的基础
      • 成为行业标准

金句 / Highlights

值得收藏与分享的关键句。

#Harbor#LangSmith#框架#评估
打开原文

Harrison Chase 在 X 上的发言: "harbor 是一个用于运行更长时间、更状态化的代理评估的优秀框架,它支撑了 terminal bench 2,并正在成为行业标准。LangSmith Sandboxes 现在已与 harbor 集成!" / X

Harrison Chase

@hwchase17

harbor 是一个用于运行更长时间、更状态化的代理评估的优秀框架,它支撑了 terminal bench 2,并正在成为行业标准。LangSmith Sandboxes 现在已与 harbor 集成!

LangChain

@LangChain

6月17日

LangSmith Sandboxes 现在已成为

@

harborframework

🚀 安装:pip install “harbor[langsmith]” 认证:export LANGSMITH_API_KEY= “<LANGSMITH_API_KEY>” 完成。现在你的评估已准备好在 LangSmith 生产沙箱中运行,并与 Daytona 一同使用。

显示更多

2026年6月17日 下午8:28

8.1K

浏览量

4

3

5

35

1

6

16

阅读4条回复

AI 可能会生成不准确的信息,请核实重要内容

harbor is a great framework for running longer running, more stateful agent evals it underpins term... | Harrison Chase(@hwchase17) | traeai