How the community trained Gemma to "Think" with Tunix and TPUs
社区通过 Tunix 和 TPU 成功训练 Gemma 模型生成推理能力,提供可复现的训练方法。
入选理由:G-RaR 方法结合 SFT 和 GRPO,使用 Gemma-3-12B 作为评估模型,显著提升推理能力。
模型
别名:Gemma 4
由 Google 开发的开源大语言模型。
已收录 6 条与 Gemma 相关的内容,按评分排序。
社区通过 Tunix 和 TPU 成功训练 Gemma 模型生成推理能力,提供可复现的训练方法。
入选理由:G-RaR 方法结合 SFT 和 GRPO,使用 Gemma-3-12B 作为评估模型,显著提升推理能力。
Sam Witteveen探讨了在AMD硬件上运行本地AI的可能性,强调了本地AI在隐私和成本控制方面的优势。
入选理由:本地AI模型如Qwen 3.6和Gemma在实际工作中表现出色。
China's open-source models lag behind the US frontier models by 3-7 months according to CAISI evaluations.
入选理由:CAISI评估显示中国开源模型在多个基准测试中落后于美国模型,差距达3-7个月。
Philipp Schmid宣布为Gemma 4模型推出多令牌预测(Multi-Token Prediction)drafters技术,实测推理速度提升最高达3倍,且输出质量零损失。
入选理由:Multi-Token Prediction drafters使Gemma 4推理速度最高提升3倍
Patrick Loeber宣布Gemma功能已集成到@geminicli中,用户可通过`gemini gemma setup`和`gemini gemma start`命令体验。此更新伴随Gemini CLI v0.40.0发布,重点改进包括分层内存、本地Gemma路由及简化UI。
入选理由:Gemma功能集成进Gemini CLI,简化模型路由操作。
The Gemma-4 series of open models ranks #13 (31b) and #17 (26b-a4b) in code performance, marking strong efficiency and local deployability on devices like MBP.
入选理由:Gemma-4-31b在开源代码模型中排名全球第13。