北大提出首个可验证的仓库级生成基准RepoZero,评测LLM能否从0生成一个代码仓库
夕小瑶科技说73 字 (约 1 分钟)
70
北大提出RepoZero,首个可验证的仓库级生成基准,用于评估LLM从零生成完整代码仓库的能力,揭示当前模型在复杂代码结构生成上的局限性。
入选理由:RepoZero通过功能完整性、代码质量、文档一致性等12项指标,量化评估LLM生成代码仓库的可行性
精选文章#代码生成#LLM评估#基准测试#北大中文
产品
北大开发的仓库级代码生成评估基准系统
已收录 1 条与 RepoZero 相关的内容,按评分排序。
北大提出RepoZero,首个可验证的仓库级生成基准,用于评估LLM从零生成完整代码仓库的能力,揭示当前模型在复杂代码结构生成上的局限性。
入选理由:RepoZero通过功能完整性、代码质量、文档一致性等12项指标,量化评估LLM生成代码仓库的可行性