五月 2026 年 AssemblyAI 总结

AssemblyAI

AssemblyAI视频2026年6月4日

五月 2026 年 AssemblyAI 总结

8.7内容质量

可直接观看的视频资源打开原视频

TL;DR · AI 摘要

AssemblyAI 五月发布多项语音与 AI 工程升级：LLM 网关支持按 effort 级别启用链式推理并自动适配多模型；流式说话人识别准确率显著提升，误报与幻听分别下降66%与60%，支持每词说话人标签与连续部分转写；Playground 增加34种语音样本预览与可公开分享；PII 实时红脱并默认关闭部分转写以防泄露。

核心要点

LLM 网关可按 low/medium/high 开启链式推理，自动适配 Gemini、Claude、OpenAI 等模型。
流式说话人识别误报率-66%、幻听率-60%，每词带说话人标签，提供约每3秒的连续部分转写并支持会话内动态开关。
PII 红脱在连接中标记 redact PII=true 即实时移除姓名、电话、卡号等，并默认关闭部分转写防止泄露。

结构提纲

按章节快速跳转。

§LLM 网关升级
支持按 low/medium/high 开启链式推理，自动适配 Gemini、Claude、OpenAI 等模型。
·说话人识别改进
误报率-66%、幻听-60%，每词带说话人标签，支持连续部分转写与会话内动态开关。
·Playground 与仪表板
每语音34个样本预览、可生成公开链接分享，界面与管理功能优化。
·PII 实时红脱
连接中标记 redact PII=true 即实时移除敏感信息，并默认关闭部分转写防泄露。
·连续部分转写
默认在沉默处输出 partials，开启后提供约每3秒的稳定中段转写，支持按需开关。
·JSON 修复发布
新增 Ship JSON 修复，自动修复 malformed JSON；月度发布回顾与变更日志追踪。

思维导图

用一张图看清主题之间的关系。

查看大纲文本（无障碍 / 无 JS 友好）

May 2026 Assembly AI 回顾
- LLM Gateway
  - 链式推理参数化
  - 多模型统一适配
- 流式语音识别
  - 每词说话人标签
  - 连续部分转写(每3秒)
- 说话人识别指标
  - 误报-66%
  - 幻听-60%
- Playground 与仪表板
  - 34 言语样本预览
  - 可公开分享链接
- PII 红脱
  - 实时移除敏感信息
  - 默认关闭部分转写
- 实用增强
  - Ship JSON 修复

金句 / Highlights

值得收藏与分享的关键句。

LLM 网关通过 reasoning_effort(low/medium/high) 开启链式推理，自动适配 Gemini、Claude、OpenAI 等模型差异。
— 第 2 段
⬇︎ 下载 PNG 𝕏 分享到 X
流式说话人识别误报率降至 34%（-66%），幻听率降至 40%（-60%），每词附说话人标签并支持连续部分转写每3秒输出一次。
— 第 4 段
⬇︎ 下载 PNG 𝕏 分享到 X
PII 红脱在连接中标记 redact PII=true 即实时移除姓名、电话、卡号等，并默认关闭部分转写以防止敏感信息泄露。
— 第 8 段
⬇︎ 下载 PNG 𝕏 分享到 X
连续部分转写可在会话内动态开关，适用于长段朗读如信用卡号或地址，提供更稳定的中段转写流。
— 第 6 段
⬇︎ 下载 PNG 𝕏 分享到 X

#AssemblyAI#LLM 网关#流式语音识别#说话人识别#PII 红脱