推出 Gemma 4 12B:面向本机的统一、无编码器多模态模型
Gemma 4 12B 是面向本机运行的统一、无编码器多模态模型,将视觉与音频直接接入 LLM,性能接近 26B MoE 但内存仅其一半,可在 16GB VRAM 紧凑设备上运行,支持离线语音处理与低延迟多步推理。
入选理由:Gemma 4 12B 性能接近 26B MoE,内存仅其一半,适合在 16GB VRAM 现代本机运行。
产品
也叫:@ollama
基于 llama.cpp 的封装工具,提供本地服务器和 OpenAI 兼容 API。
最近变化
2026-06-10 · 使用 llama.cpp 可在消费级硬件上运行大型模型,支持 4-bit 量化。
Ollama 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。
已收录 30 篇与「Ollama」相关的 AI 资讯和分析。
Gemma 4 12B 是面向本机运行的统一、无编码器多模态模型,将视觉与音频直接接入 LLM,性能接近 26B MoE 但内存仅其一半,可在 16GB VRAM 紧凑设备上运行,支持离线语音处理与低延迟多步推理。
入选理由:Gemma 4 12B 性能接近 26B MoE,内存仅其一半,适合在 16GB VRAM 现代本机运行。
AI代理系统的最优组织结构取决于任务复杂度与模型类型,Google研究通过150+实验发现:集中式或混合架构对OpenAI模型更有效,而Google模型在去中心化协作中表现更优。
入选理由:超过150次实验证明,OpenAI模型在集中式管理架构下性能提升37%,优于去中心化模式。
本地运行大语言模型(LLMs)可通过 llama.cpp、Ollama 和 LM Studio 等工具实现,兼顾隐私与学习。
入选理由:使用 llama.cpp 可在消费级硬件上运行大型模型,支持 4-bit 量化。
Gemma 4 QAT模型在Ollama和Hugging Face上线,显著降低内存需求并保持模型质量。
入选理由:Gemma 4 QAT模型在Ollama和Hugging Face上线,支持多种模型大小。
本文展示如何利用 Ollama 本地部署的开源 LLM(如 Llama 3、Mistral、Gemma)与 Scikit‑LLM 结合,完成零样本文本分类,且完全免费。
入选理由:通过 `ollama run <model>` 可在本地拉取并运行 Llama 3、Mistral 或 Gemma,端口默认 11434。
Ollama 是运行本地语言模型的强大工具,通过 Modelfile 和环境变量可优化模型性能与硬件效率。
入选理由:通过 Ollama Modelfile 可封装模型参数,简化本地模型调用流程。
通过构建一个具有错误恢复机制的多工具 Gemma 4 代理,学习如何优雅地处理工具调用中的失败。
入选理由:迭代代理循环需设置最大迭代次数以防止无限循环。
Gemma 4 模型通过本地沙箱工具实现真正代理行为,支持文件系统探索和受限 Python 解释器。
入选理由:Gemma 4 支持本地工具调用,如文件系统探索和受限 Python 执行,增强模型自主性
文章介绍了本地语言模型的优势,如无需API密钥、无需数据转移等。
入选理由:Local models are easier to run and maintain compared to cloud tools.
作者通过两次构建B2B文档提取器,比较了基于规则的传统方法和基于LLM的方法,探讨了复杂性和布局多样性对两种方法的影响。
入选理由:基于LLM的方法在处理复杂和多变的布局时更具优势。
文章介绍如何用开源工具构建AI驱动的学习管理系统,包含个性化路径、动态测验等功能。
入选理由:使用Ollama+Mistral 7B实现本地语言模型,无需云服务
OpenJarvis 是由斯坦福 HazyResearch 和 Scaling Intelligence 实验室开发的本地优先个人AI,可与 Ollama 集成运行,旨在实现高效低功耗本地化AI体验,支持用户在无网络环境下使用。
入选理由:OpenJarvis 可通过 Ollama 在本地部署,无需云端连接,保障隐私与离线可用性。
MiniMax M3 模型已通过 Ollama Cloud 发布,支持 US 部署与零数据保留,专为编码和代理任务设计,在 SWE-Bench Pro 基准中达 59%+ 正确率,结合稀疏注意力实现 1M 上下文长度。
入选理由:M3 在 SWE-Bench Pro 基准中取得 59.0% 正确率,优于多数开源模型。
Ollama 新增 NVIDIA Blackwell GPU 以更好支持 GLM-5.1 模型。
入选理由:Ollama 已扩展 NVIDIA Blackwell GPU 阵容以优化 GLM-5.1 模型性能。
Peekaboo 3.0 发布,带来基于 macOS 的操作自动化新功能。
入选理由:Peekaboo 3.0 是自 2.0 以来最大更新
Ollama 发布 OpenJarvis,支持在本地运行大模型,无需联网,提升隐私与响应速度,适配开发者与企业用户。
入选理由:OpenJarvis 可通过 Ollama 在本地运行,无需联网即可访问 LLM 模型。
Hermes 可以根据自然语言描述生成 Python 技能,并在使用过程中不断优化。
入选理由:Hermes 支持从自然语言生成 Python 技能。
Google 宣布其模型权重与主流开源生态兼容,可在 Hugging Face 和 Kaggle 直接下载,降低部署门槛。
入选理由:Gemma 4 权重与 llama.cpp、vLLM、Ollama 等生态兼容,便于本地部署与推理。
PewDiePie推出的Odysseus AI工作区是一款可自托管的AI工具,支持Gemma-4 26B等模型,提供代理模式、深度研究和文档编辑功能,但缺乏技术深度分析和性能数据。
入选理由:Odysseus支持Gemma-4 26B模型,本地运行需至少16GB内存,可通过Ollama快速部署
Ollama 0.24 新增对 Codex 应用的支持,用户可通过命令行启动。
入选理由:更新至 Ollama 0.24 后可使用 codex-app 功能。
Ollama 推荐了多个与 Codex 配合使用的模型,包括支持视觉的 kimi-k2.6 和 glm-5.1。
入选理由:kimi-k2.6 支持视觉功能,适合图像相关任务。
Ollama 推出新一代旗舰模型 GLM-5.1,代码生成能力显著提升。
入选理由:GLM-5.1 是 Ollama 的新一代旗舰模型。
文章介绍了Gemma 4模型的性能和适用场景,但信息密度较低,缺乏深度分析。
入选理由:Gemma 4模型适用于推理、代理工作流、编码和多模态理解。
Hermes Desktop 可通过 Ollama 在多平台运行,支持本地和云端部署。
入选理由:Hermes Desktop 支持 macOS、Windows 和 Linux 平台。
ollama 发布了 Hermes Agent,一个用于生成代码的 AI 工具。
入选理由:ollama 发布了 Hermes Agent,一个用于生成代码的 AI 工具。
ollama 宣布 Gemma 4 - 12B 模型已在其平台上可用。用户可以通过 MLX 运行该模型,支持 Hermes Agent 和 Claude Code 等工具。
入选理由:ollama 宣布 Gemma 4 - 12B 模型已在其平台上可用。
Ollama 宣布支持连接多个消息应用,但内容缺乏技术细节和实用价值。
入选理由:Ollama 支持连接 Telegram、Discord 等消息应用。
Ollama 在 X 平台发布 Minima 模型页面链接,但未提供模型架构、性能或部署方法,信息密度极低。
入选理由:Ollama 提供 Minima 模型页面(ollama.com/library/minima)供用户下载和运行轻量模型。
NVIDIA AI 在 X 平台发布了一条关于 @ollama 的推文,但内容缺乏具体技术细节。
入选理由:NVIDIA AI 在 X 平台上发布了与 @ollama 相关的内容。
Ollama 提供了恢复 Codex 默认设置的命令。
入选理由:使用 `ollama launch codex-app --restore` 可以恢复 Codex 的默认设置。
与「Ollama」经常一起出现的 AI 术语。
💡 想追踪「Ollama」的长期趋势?去 实体雷达 · Ollama 查看详细分析和跨材料问答。