T
traeai
登录

产品

什么是 Ollama

也叫:@ollama

基于 llama.cpp 的封装工具,提供本地服务器和 OpenAI 兼容 API。

为什么现在值得关注?

最近变化

2026-06-10 · 使用 llama.cpp 可在消费级硬件上运行大型模型,支持 4-bit 量化。

Ollama 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。

📰 Ollama 最新动态

已收录 30 篇与「Ollama」相关的 AI 资讯和分析。

Introducing Gemma 4 12B: a unified, encoder-free multimodal model

推出 Gemma 4 12B:面向本机的统一、无编码器多模态模型

The Keyword (blog.google)693 字 (约 3 分钟)
87

Gemma 4 12B 是面向本机运行的统一、无编码器多模态模型,将视觉与音频直接接入 LLM,性能接近 26B MoE 但内存仅其一半,可在 16GB VRAM 紧凑设备上运行,支持离线语音处理与低延迟多步推理。

入选理由:Gemma 4 12B 性能接近 26B MoE,内存仅其一半,适合在 16GB VRAM 现代本机运行。

精选文章#Gemma 4#12B#多模态#统一架构#无编码器英文
How to Build Optimal AI Agents That Actually Work – A Handbook for Devs

如何构建真正有效的最优AI代理——开发者手册

freeCodeCamp.org5915 字 (约 24 分钟)
87

AI代理系统的最优组织结构取决于任务复杂度与模型类型,Google研究通过150+实验发现:集中式或混合架构对OpenAI模型更有效,而Google模型在去中心化协作中表现更优。

入选理由:超过150次实验证明,OpenAI模型在集中式管理架构下性能提升37%,优于去中心化模式。

精选文章#AI代理#大语言模型#Google研究#多代理系统#Ollama英文
How to Run LLMs Locally (Great For Learning and Privacy)

How to Run LLMs Locally (Great For Learning and Privacy)

ByteByteGo1316 字 (约 6 分钟)
85

本地运行大语言模型(LLMs)可通过 llama.cpp、Ollama 和 LM Studio 等工具实现,兼顾隐私与学习。

入选理由:使用 llama.cpp 可在消费级硬件上运行大型模型,支持 4-bit 量化。

精选视频#LLM#本地运行#AI#量化#Ollama英文
Using Scikit-LLM with Open-Source LLMs

使用 Scikit‑LLM 与开源 LLM

Machine Learning Mastery1080 字 (约 5 分钟)
85

本文展示如何利用 Ollama 本地部署的开源 LLM(如 Llama 3、Mistral、Gemma)与 Scikit‑LLM 结合,完成零样本文本分类,且完全免费。

入选理由:通过 `ollama run <model>` 可在本地拉取并运行 Llama 3、Mistral 或 Gemma,端口默认 11434。

精选文章#Scikit‑LLM#Ollama#LLM#Zero‑shot#Python英文
Tweaking Local Language Model Settings with Ollama

Tweaking Local Language Model Settings with Ollama

KDnuggets2864 字 (约 12 分钟)
85

Ollama 是运行本地语言模型的强大工具,通过 Modelfile 和环境变量可优化模型性能与硬件效率。

入选理由:通过 Ollama Modelfile 可封装模型参数,简化本地模型调用流程。

精选文章#Ollama#LLM#本地模型#性能优化中文
Building a Multi-Tool Gemma 4 Agent with Error Recovery

Building a Multi-Tool Gemma 4 Agent with Error Recovery

Machine Learning Mastery3497 字 (约 14 分钟)
85

通过构建一个具有错误恢复机制的多工具 Gemma 4 代理,学习如何优雅地处理工具调用中的失败。

入选理由:迭代代理循环需设置最大迭代次数以防止无限循环。

精选文章#Gemma 4#工具调用#错误恢复#迭代代理英文
Easy Agentic Tool Calling with Gemma 4

使用 Gemma 4 实现简易代理工具调用

KDnuggets2859 字 (约 12 分钟)
85

Gemma 4 模型通过本地沙箱工具实现真正代理行为,支持文件系统探索和受限 Python 解释器。

入选理由:Gemma 4 支持本地工具调用,如文件系统探索和受限 Python 执行,增强模型自主性

精选文章#Gemma 4#Agent#Tool Calling#Security#Python英文
5 Cool Things I Did with Local Language Models

5 Cool Things I Did with Local Language Models

KDnuggets3398 字 (约 14 分钟)
85

文章介绍了本地语言模型的优势,如无需API密钥、无需数据转移等。

入选理由:Local models are easier to run and maintain compared to cloud tools.

精选文章#local-language-models#cloud-comparison中文
I Built the Same B2B Document Extractor Twice: Rules vs. LLM

I Built the Same B2B Document Extractor Twice: Rules vs. LLM

Towards Data Science2481 字 (约 10 分钟)
85

作者通过两次构建B2B文档提取器,比较了基于规则的传统方法和基于LLM的方法,探讨了复杂性和布局多样性对两种方法的影响。

入选理由:基于LLM的方法在处理复杂和多变的布局时更具优势。

精选文章#B2B#OCR#LLM#Python#Document Extraction中文
Build an AI-Powered Learning Management System That Actually Trains People

构建一个真正能培训人的AI驱动型学习管理系统

KDnuggets1903 字 (约 8 分钟)
85

文章介绍如何用开源工具构建AI驱动的学习管理系统,包含个性化路径、动态测验等功能。

入选理由:使用Ollama+Mistral 7B实现本地语言模型,无需云服务

精选文章#AI#LMS#React#FastAPI#Ollama英文
OpenJarvis: a local-first personal AI is now available to run with Ollama

Built by Stanford’s @Hazy...

OpenJarvis:现已可通过 Ollama 在本地运行的个人AI

ollama(@ollama)103 字 (约 1 分钟)
80

OpenJarvis 是由斯坦福 HazyResearch 和 Scaling Intelligence 实验室开发的本地优先个人AI,可与 Ollama 集成运行,旨在实现高效低功耗本地化AI体验,支持用户在无网络环境下使用。

入选理由:OpenJarvis 可通过 Ollama 在本地部署,无需云端连接,保障隐私与离线可用性。

精选推文#Ollama#本地AI#斯坦福#HazyResearch#Intelligence Per Watt英文
.@MiniMax_AI M3 model is available on Ollama's Cloud! 

In partnership with MiniMax, the M3 model on...

MiniMax M3 模型现已上线 Ollama Cloud!

ollama(@ollama)153 字 (约 1 分钟)
75

MiniMax M3 模型已通过 Ollama Cloud 发布,支持 US 部署与零数据保留,专为编码和代理任务设计,在 SWE-Bench Pro 基准中达 59%+ 正确率,结合稀疏注意力实现 1M 上下文长度。

入选理由:M3 在 SWE-Bench Pro 基准中取得 59.0% 正确率,优于多数开源模型。

精选推文#M3#Ollama#MiniMax#编码 AI#代理 AI英文
We just added significantly more NVIDIA Blackwell GPUs to better serve GLM-5.1 model on Ollama's clo...

Ollama 宣布新增 NVIDIA Blackwell GPU 支持 GLM-5.1 模型

ollama(@ollama)202 字 (约 1 分钟)
75

Ollama 新增 NVIDIA Blackwell GPU 以更好支持 GLM-5.1 模型。

入选理由:Ollama 已扩展 NVIDIA Blackwell GPU 阵容以优化 GLM-5.1 模型性能。

精选推文#Ollama#GPU#GLM-5.1#NVIDIA#云服务英文
Peekaboo 3.0 正式发布 专注操作与界面检测

Peekaboo 3.0 正式发布 专注操作与界面检测

AI HOT 精选203 字 (约 1 分钟)
75

Peekaboo 3.0 发布,带来基于 macOS 的操作自动化新功能。

入选理由:Peekaboo 3.0 是自 2.0 以来最大更新

精选文章#macOS#自动化#工具中文
Blog post: https://t.co/eXZA5Oe1ak

Ollama 推出本地优先个人 AI 工具 OpenJarvis

ollama(@ollama)48 字 (约 1 分钟)
72

Ollama 发布 OpenJarvis,支持在本地运行大模型,无需联网,提升隐私与响应速度,适配开发者与企业用户。

入选理由:OpenJarvis 可通过 Ollama 在本地运行,无需联网即可访问 LLM 模型。

精选推文#Ollama#本地AI#LLM#隐私计算#开源工具英文
&gt; Ecosystem: Compatible with llama.cpp, MLX, @LMStudio, vLLM, @ollama, @UnslothAI, and SGLang.
&amp;g...

Google AI Developers:Gemma 4 生态兼容与下载

Google AI Developers(@googleaidevs)78 字 (约 1 分钟)
65

Google 宣布其模型权重与主流开源生态兼容,可在 Hugging Face 和 Kaggle 直接下载,降低部署门槛。

入选理由:Gemma 4 权重与 llama.cpp、vLLM、Ollama 等生态兼容,便于本地部署与推理。

精选推文#Gemma#开源生态#模型部署#Hugging Face#Kaggle英文
Odysseus + Gemma-4 26B & FREE APIs: RIP Hermes & OpenClaw! THIS IS CRAZY!

PewDiePie推出的Odysseus AI工作区是一款可自托管的AI工具,支持Gemma-4 26B等模型,提供代理模式、深度研究和文档编辑功能,但缺乏技术深度分析和性能数据。

入选理由:Odysseus支持Gemma-4 26B模型,本地运行需至少16GB内存,可通过Ollama快速部署

精选视频#AI工具#自托管#Gemma-4#Ollama#AI工作区英文
Ollama now supports Codex app! 

To try it, update to the latest Ollama 0.24, and run: 

ollama laun...

Ollama 现在支持 Codex 应用!

ollama(@ollama)81 字 (约 1 分钟)
65

Ollama 0.24 新增对 Codex 应用的支持,用户可通过命令行启动。

入选理由:更新至 Ollama 0.24 后可使用 codex-app 功能。

精选推文#Ollama#Codex#AI 模型#开源英文
Some models to try with Codex:

kimi-k2.6:cloud (with vision support)
glm-5.1:cloud

If you don't ye...

Some models to try with Codex

ollama(@ollama)175 字 (约 1 分钟)
65

Ollama 推荐了多个与 Codex 配合使用的模型,包括支持视觉的 kimi-k2.6 和 glm-5.1。

入选理由:kimi-k2.6 支持视觉功能,适合图像相关任务。

精选推文#Codex#AI 模型#Ollama英文
Model page: 

https://t.co/3OxGYEF2U6

Ollama 推出 GLM-5.1

ollama(@ollama)66 字 (约 1 分钟)
65

Ollama 推出新一代旗舰模型 GLM-5.1,代码生成能力显著提升。

入选理由:GLM-5.1 是 Ollama 的新一代旗舰模型。

精选推文#AI 模型#代码生成#Ollama英文
ollama(@ollama) 图标

Model page: https://t.co/WD3DDuxEhx

ollama(@ollama)57 字 (约 1 分钟)
60

文章介绍了Gemma 4模型的性能和适用场景,但信息密度较低,缺乏深度分析。

入选理由:Gemma 4模型适用于推理、代理工作流、编码和多模态理解。

精选推文#Gemma#AI模型英文
https://t.co/K22m1ue8XL

ollama 发布 Hermes Agent

ollama(@ollama)50 字 (约 1 分钟)
60

ollama 发布了 Hermes Agent,一个用于生成代码的 AI 工具。

入选理由:ollama 发布了 Hermes Agent,一个用于生成代码的 AI 工具。

精选推文#AI#编程语言#框架中文
.@GoogleDeepMind's Gemma 4 - 12B is available on Ollama!  

Chat: 
ollama run gemma4:12b-mlx

Hermes...

@GoogleDeepMind's Gemma 4 - 12B is available on Ollama!

ollama(@ollama)104 字 (约 1 分钟)
60

ollama 宣布 Gemma 4 - 12B 模型已在其平台上可用。用户可以通过 MLX 运行该模型,支持 Hermes Agent 和 Claude Code 等工具。

入选理由:ollama 宣布 Gemma 4 - 12B 模型已在其平台上可用。

精选推文#ollama#Gemma 4#MLX中文
Model page: 

https://t.co/2LHU4ZG39o

Ollama 发布 Minima 模型页面:但内容空洞无技术细节

ollama(@ollama)36 字 (约 1 分钟)
50

Ollama 在 X 平台发布 Minima 模型页面链接,但未提供模型架构、性能或部署方法,信息密度极低。

入选理由:Ollama 提供 Minima 模型页面(ollama.com/library/minima)供用户下载和运行轻量模型。

精选推文#Ollama#大模型#开源#模型库英文
@ollama 🚀

@ollama 🚀

NVIDIA AI(@NVIDIAAI)29 字 (约 1 分钟)
50

NVIDIA AI 在 X 平台发布了一条关于 @ollama 的推文,但内容缺乏具体技术细节。

入选理由:NVIDIA AI 在 X 平台上发布了与 @ollama 相关的内容。

精选推文#NVIDIA#AI#X平台中英混合
Restore to existing Codex experience without any effects: 

ollama launch codex-app --restore

恢复 Codex 初始体验

ollama(@ollama)52 字 (约 1 分钟)
50

Ollama 提供了恢复 Codex 默认设置的命令。

入选理由:使用 `ollama launch codex-app --restore` 可以恢复 Codex 的默认设置。

精选推文#Codex#Ollama#CLI英文

与「Ollama」经常一起出现的 AI 术语。

💡 想追踪「Ollama」的长期趋势?去 实体雷达 · Ollama 查看详细分析和跨材料问答。

AI 可能会生成不准确的信息,请核实重要内容