Viking(@vikingmute)
我发现系统越大越大,AI 写的测试代码越不可靠。尤其是 E2E,单元测试好一点。
7.0Score

TL;DR · AI 摘要
作者发现系统越大越大,AI 写的测试代码越不可靠。尤其是 E2E,单元测试好一点。
核心要点
- 系统越大,AI 编写的测试代码越不可靠。
- E2E 测试尤其容易出错。
- 生成大纲后仍需详细审查。
结构提纲
按章节快速跳转。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- AI 编写测试代码可靠性
- 系统规模与可靠性
- E2E 测试问题
- 单元测试相对较好
- 具体案例
- 使用 Claude 编写 TinyShip referral 功能测试
- 解决方案
- 生成大纲后详细审查
- 拆分成多个小测试或步骤
金句 / Highlights
值得收藏与分享的关键句。
我发现系统越大越大,AI 写的测试代码越不可靠。尤其是 E2E,单元测试好一点。
虽然它生成的大纲里面有,我简单的 review了一下,没有看详细的步骤,但是发现实现的时候有很多步骤居然都没有测试到,没有实现。
还是不能偷懒,生成大纲以后还需要,分块生成 + 严格 Review,不要让它一次性生成整个 E2E 测试,拆成多个小测试或者多个步骤。
#AI#测试#E2E#Claude#TinyShip
打开原文TinyShip 的新 referral 功能 我用 Claude写测试发现很有欺骗性,尤其是 e2e 它信誓旦旦的告诉我写了 “已完整实现所有逻辑”,其实有一部分逻辑根本就没写,我在手动的时候才发现。虽然它生成的大纲里面有,我简单的" / X
Viking on X: "我发现系统越大越大,AI 写的测试代码越不可靠。尤其是 E2E,单元测试好一点。 TinyShip 的新 referral 功能 我用 Claude写测试发现很有欺骗性,尤其是 e2e 它信誓旦旦的告诉我写了 “已完整实现所有逻辑”,其实有一部分逻辑根本就没写,我在手动的时候才发现。虽然它生成的大纲里面有,我简单的" / X
Don’t miss what’s happening

Show translation
我发现系统越大越大,AI 写的测试代码越不可靠。尤其是 E2E,单元测试好一点。 TinyShip 的新 referral 功能 我用 Claude写测试发现很有欺骗性,尤其是 e2e 它信誓旦旦的告诉我写了 “已完整实现所有逻辑”,其实有一部分逻辑根本就没写,我在手动的时候才发现。虽然它生成的大纲里面有,我简单的 review了一下,没有看详细的步骤,但是发现实现的时候有很多步骤居然都没有测试到,没有实现。 还是不能偷懒,生成大纲以后还需要,分块生成 + 严格 Review,不要让它一次性生成整个 E2E 测试,拆成多个小测试或者多个步骤。
·
38
2
12
22
Read 38 replies