Philipp Schmid(@_philschmid)2026年5月22日

Here are some third-party evals I came across for 3.5 Flash this week. It's doing well across agents...

7.2Score

Here are some third-party evals I came across for 3.5 Flash this week. It's doing well across agents...

TL;DR · AI 摘要

Philipp Schmid 分享了第三方对 Gemini 3.5 Flash 的评测结果，表明其在 agent、coding、vision 和 finance 领域表现良好。

核心要点

Gemini 3.5 Flash 在多个评测维度中表现出色，包括 agent、coding、vision 和 finance。
作者鼓励开发者试用并反馈失败案例，以帮助改进下一代模型。
评测结果来源于社区第三方，具有一定的参考价值但缺乏官方验证。

结构提纲

按章节快速跳转。

§评测概述
Philipp Schmid 分享了第三方对 Gemini 3.5 Flash 的评测结果。
·评测领域
该模型在 agent、coding、vision 和 finance 四个领域均表现优异。
·用户参与
作者呼吁开发者试用模型并提交失败案例以推动迭代优化。

思维导图

用一张图看清主题之间的关系。

查看大纲文本（无障碍 / 无 JS 友好）

Gemini 3.5 Flash 评测
- 评测结果
  - Agent 表现
  - Coding 能力
  - Vision 理解
  - Finance 应用
- 社区互动
  - 试用邀请
  - 反馈机制

金句 / Highlights

值得收藏与分享的关键句。

It's doing well across agents, coding, vision, finance.
— Tweet body
⬇︎ 下载 PNG 𝕏 分享到 X
Every failure case makes the next version better.
— Tweet body
⬇︎ 下载 PNG 𝕏 分享到 X
Try it. Share what worked and what didn't.
— Tweet body
⬇︎ 下载 PNG 𝕏 分享到 X

#Gemini#AI模型#评测#机器学习

Philipp Schmid ![图片1](https://x.com/_philschmid)

这是我本周看到的一些针对 3.5 Flash 的第三方评估。它在代理、编码、视觉和金融方面都表现不错。试试看。分享哪些有效，哪些无效。我们会修复它。每一个失败案例都会让下一个版本变得更好。

图片2：图片

图片3：图片

图片4：图片

图片5：图片

晚上9:15 · 2026年5月22日

3,078 次浏览