人物

Laurie Voss

Q: Laurie Voss 最近有什么新动态？

traeai 已收录 2 篇与 Laurie Voss 相关的内容。最新一篇是「Ship Real Agents: Hands-On Evals for Agentic Applications — Laurie Voss, Arize」，由 AI Engineer 发布。

别名：arizeai

Arize AI 的 DevRel 部门负责人

已跟踪 2 条高相关材料

TraeAI 观察

如果只读 3 篇

Ship Real Agents: Hands-On Evals for Agentic Applications — Laurie Voss, Arize

AI Engineer · 8.5 分

本文介绍了如何对AI代理系统进行实际评估，包括设置追踪、分析数据、编写不同类型的评估方法和元评估。

Tweaking chunk sizes and running a few demo queries is not an evaluation strategy. Laurie Voss (Hea...

Qdrant(@qdrant_engine) · 6 分

Qdrant 宣布 Laurie Voss 将在 Vector Space Day 2026 上讨论 retrieval metrics 和 golden datasets，强调了评估策略的重要性。

Ship Real Agents: Hands-On Evals for Agentic Applications — Laurie Voss, Arize

AI Engineer5月15日31573 字 (约 127 分钟)

This article introduces how to evaluate AI agent systems, including setting up tracing, analyzing data, writing different types of evaluation methods, and meta-evaluation.

入选理由：需要通过追踪捕获原始数据来运行评估

FeaturedVideo#AI Evaluation#Agent Systems#LLM中文

Tweaking chunk sizes and running a few demo queries is not an evaluation strategy.

Laurie Voss (Hea...

Qdrant on X: 'Tweaking chunk sizes and running a few demo queries is not an evaluation strategy.'

Qdrant(@qdrant_engine)5月30日223 字 (约 1 分钟)

Qdrant announces Laurie Voss will discuss retrieval metrics and golden datasets at Vector Space Day 2026, emphasizing the importance of evaluation strategies.

入选理由：Tweaking chunk sizes and running a few demo queries is not an evaluation strategy.

FeaturedTweet#Qdrant#Vector Space Day#evaluation strategy#retrieval metrics#golden datasets中文

跨材料问答 · Laurie Voss

回答基于：Laurie Voss 相关 2 条材料