我们需要更多公开的编码与代理执行轨迹,以构建数据集并打造更优秀的开源模型!
clem 🤗(@ClementDelangue)170 字 (约 1 分钟)
55
当前开源大模型训练亟需更多公开的编码与代理执行轨迹数据,以构建高质量训练集;尽管已有大量贡献者参与,但公众仍应积极共享自身数据,Hugging Face 已上线相关数据集搜索入口。
入选理由:OpenAI Codex Desktop 曾支持‘复制为 Markdown’导出完整对话轨迹,但该功能在近期更新中被移除,引发社区不满。
精选推文#开源#代理轨迹#数据集#编码英文
