产品

Claw-Eval

Q: 什么是 Claw-Eval？

一个性能评估基准测试。

Q: Claw-Eval 最近有什么新动态？

traeai 已收录 2 篇与 Claw-Eval 相关的内容。最新一篇是「What changed under the hood: → Trained on a self-built OpenClaw environment, with tools and tasks s...」，由 Skywork(@Skywork_ai) 发布。

一个性能评估基准测试。

已跟踪 2 条高相关材料

TraeAI 观察

如果只读 3 篇

What changed under the hood: → Trained on a self-built OpenClaw environment, with tools and tasks s...

Skywork(@Skywork_ai) · 6.5 分

Skywork 的新模型在自建的 OpenClaw 环境中训练，性能优于前沿开源模型，并提供两种变体。

Built on a self-constructed OpenClaw environment with high-quality tools and synthesized tasks deriv...

Skywork(@Skywork_ai) · 4.5 分

Skywork 发布其 AI 模型在 OpenClaw 环境下的基准测试结果，声称 v1.0 和 v1.0-lite 版本在 PinchBench、Claw-Eval 和 Skywork-Claw-Bench 测试中优于 Minimax 2.7、DeepSeek V4 Flas...

What changed under the hood: → Trained on a self-built OpenClaw environment, with tools and tasks s...

Skywork(@Skywork_ai)5月25日163 字 (约 1 分钟)

Skywork 的新模型在自建的 OpenClaw 环境中训练，性能优于前沿开源模型，并提供两种变体。

入选理由：Skywork 模型在自建 OpenClaw 环境中训练。

精选推文#Skywork#OpenClaw#模型训练#性能评估中文

Built on a self-constructed OpenClaw environment with high-quality tools and synthesized tasks deriv...

Skywork 在 OpenClaw 环境下的基准测试结果

Skywork(@Skywork_ai)5月20日177 字 (约 1 分钟)

Skywork 发布其 AI 模型在 OpenClaw 环境下的基准测试结果，声称 v1.0 和 v1.0-lite 版本在 PinchBench、Claw-Eval 和 Skywork-Claw-Bench 测试中优于 Minimax 2.7、DeepSeek V4 Flash 和 Qwen 3.6，但缺乏具体性能数据和详细技术说明。

入选理由：Skywork 在自建 OpenClaw 环境中使用高质量工具和基于真实用户模式合成的任务进行测试

精选推文#AI模型#基准测试#Skywork#性能对比#OpenClaw英文

跨材料问答 · Claw-Eval

回答基于：Claw-Eval 相关 2 条材料