How the community trained Gemma to "Think" with Tunix and TPUs
社区通过 Tunix 和 TPU 成功训练 Gemma 模型生成推理能力,提供可复现的训练方法。
入选理由:G-RaR 方法结合 SFT 和 GRPO,使用 Gemma-3-12B 作为评估模型,显著提升推理能力。
模型
别名:Gemma 4
由 Google 开发的开源大语言模型。
已收录 6 条与 Gemma 相关的内容,按评分排序。
社区通过 Tunix 和 TPU 成功训练 Gemma 模型生成推理能力,提供可复现的训练方法。
入选理由:G-RaR 方法结合 SFT 和 GRPO,使用 Gemma-3-12B 作为评估模型,显著提升推理能力。
Sam Witteveen探讨了在AMD硬件上运行本地AI的可能性,强调了本地AI在隐私和成本控制方面的优势。
入选理由:本地AI模型如Qwen 3.6和Gemma在实际工作中表现出色。
中国开源模型与美国前沿模型能力差距持续扩大,CAISI评估显示差距达3-7个月。
入选理由:CAISI评估显示中国开源模型在多个基准测试中落后于美国模型,差距达3-7个月。
Philipp Schmid宣布为Gemma 4模型推出多令牌预测(Multi-Token Prediction)drafters技术,实测推理速度提升最高达3倍,且输出质量零损失。
入选理由:Multi-Token Prediction drafters使Gemma 4推理速度最高提升3倍
Patrick Loeber宣布Gemma功能已集成到@geminicli中,用户可通过`gemini gemma setup`和`gemini gemma start`命令体验。此更新伴随Gemini CLI v0.40.0发布,重点改进包括分层内存、本地Gemma路由及简化UI。
入选理由:Gemma功能集成进Gemini CLI,简化模型路由操作。
Gemma-4系列开源模型在代码能力排行榜中表现亮眼,其中31b版本位列第13,26b-a4b版本位列第17,适合在MacBook Pro等设备上运行。
入选理由:Gemma-4-31b在开源代码模型中排名全球第13。