Local Agentic Programming on the Cheap: Claude Code + Ollama + Gemma4
Gemma 4 26B MoE 在多代理编程任务中表现优异,结合 Ollama 和 Claude Code 可构建本地高效代理系统。
入选理由:Gemma 4 26B MoE 在 τ2-bench 上得分 79%,显著优于 Gemma 3 27B 的 6.6%。
概念
别名:Apache License 2.0
一种开源软件许可证,允许自由使用和分发软件。
已跟踪 12 条高相关材料
最近变化
2026-06-11 · DiffusionGemma在H100上每秒生成1000+ tokens,比自回归模型快4倍。
为什么值得关注
Apache 2.0 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。
Mythos阴影里谷歌悄悄发模型,速度暴涨4倍
量子位 · 8.5 分
谷歌推出DiffusionGemma模型,采用扩散机制实现文本生成速度提升4倍,支持本地运行。
Local Agentic Programming on the Cheap: Claude Code + Ollama + Gemma4
KDnuggets · 8.5 分
Gemma 4 26B MoE 在多代理编程任务中表现优异,结合 Ollama 和 Claude Code 可构建本地高效代理系统。
Small: 30 billion parameters, 3B active. Efficient: Benchmarks to 33.4 on the Artificial Analysis C...
cohere(@cohere) · 8.5 分
Cohere 发布了一个参数量为 300 亿、活跃参数为 30 亿的高效模型,其在编码基准测试中得分达 33.4,且采用 Apache 2.0 开源协议。
已收录 12 条与 Apache 2.0 相关的内容,按评分排序。
Gemma 4 26B MoE 在多代理编程任务中表现优异,结合 Ollama 和 Claude Code 可构建本地高效代理系统。
入选理由:Gemma 4 26B MoE 在 τ2-bench 上得分 79%,显著优于 Gemma 3 27B 的 6.6%。
Gemma 4 12B 是 Google DeepMind 推出的首个无需编码器的多模态模型,可在 16GB 显存的笔记本电脑上运行。
入选理由:Gemma 4 12B 在 16GB 显存的笔记本电脑上即可运行。
谷歌推出DiffusionGemma模型,采用扩散机制实现文本生成速度提升4倍,支持本地运行。
入选理由:DiffusionGemma在H100上每秒生成1000+ tokens,比自回归模型快4倍。
Cohere 发布了一个参数量为 300 亿、活跃参数为 30 亿的高效模型,其在编码基准测试中得分达 33.4,且采用 Apache 2.0 开源协议。
入选理由:Cohere 发布了参数量为 300 亿的高效模型,活跃参数为 30 亿。
Step 3.7 Flash 是一个专为推理优化设计的 196B MoE 模型,采用 MFA 和 AFD 技术,KV-cache 占用仅为 DeepSeek 的 22%,支持高效代理、编码和多模态任务,已开源并可在 Fireworks 平台使用。
入选理由:Step 3.7 Flash 是 196B MoE 模型,从设计之初就聚焦推理效率,而非事后优化。
Datadog 发布 Toto 2.0,首次实现时间序列基础模型的规模定律。
入选理由:Toto 2.0 参数范围覆盖 4M 到 2.5B,每个版本均超越前代性能。
Google发布Gemma 4 12B多模态模型,支持在16GB显存笔记本本地运行且采用Apache 2.0开源协议。该模型累计下载量已超1.5亿次,以无编码器统一架构平衡了边缘端效率与高级推理能力,适合开发者快速构建本地AI应用。
入选理由:Gemma 4 12B可在仅16GB VRAM的笔记本上本地运行,大幅降低多模态模型部署门槛。
Gemma 4 12B是首个支持原生音频输入的中型多模态模型,采用无编码器统一架构,仅需16GB显存即可运行,性能接近26B模型且遵循Apache 2.0开源协议。
入选理由:Gemma 4 12B采用无编码器统一架构,直接将视觉与音频信号输入LLM,降低推理延迟。
Google发布开源多模态模型Gemma 4 12B,采用Apache 2.0许可,支持笔记本端侧直接运行。该模型为无编码器统一架构,兼顾边缘效率与高级推理能力,适合本地AI应用开发。
入选理由:Gemma 4 12B是120亿参数开源多模态模型,可在普通笔记本上直接运行推理。
谷歌发布 DiffusionGemma 模型,支持在 Hugging Face 上下载,采用 Apache 2.0 许可证。
入选理由:DiffusionGemma 模型在 Hugging Face 上提供下载。
DiffusionGemma 是一个文本生成模型,声称比现有模型快 4 倍,但信息密度低,缺乏技术细节。
入选理由:DiffusionGemma 声称比现有模型快 4 倍。
Cohere宣布以Apache 2.0许可证开源Command A+,提供企业级智能体能力,支持从实验到生产的全流程。
入选理由:Cohere开源Command A+采用Apache 2.0许可证