产品

LM Studio

Q: 什么是 LM Studio？

本地运行大型语言模型的桌面应用

Q: LM Studio 最近有什么新动态？

traeai 已收录 8 篇与 LM Studio 相关的内容。最新一篇是「Introducing Gemma 4 12B: a unified, encoder-free multimodal model」，由 The Keyword (blog.google) 发布。

别名：lm-studio

本地运行大型语言模型的桌面应用

已跟踪 8 条高相关材料

TraeAI 观察

如果只读 3 篇

Introducing Gemma 4 12B: a unified, encoder-free multimodal model

The Keyword (blog.google) · 8.7 分

Gemma 4 12B 是面向本机运行的统一、无编码器多模态模型，将视觉与音频直接接入 LLM，性能接近 26B MoE 但内存仅为其一半，可在 16GB VRAM 紧凑设备上运行，支持离线语音处理与低延迟多步推理。

Viability of local models for coding

Martin Fowler · 8.5 分

本地AI模型在编码场景中具备可行性，但受硬件资源和工具链限制，需权衡模型规模与性能表现。

Ornith-1.0: Self-Scaffolding LLMs for Agentic Coding

Simon Willison's Weblog · 8.5 分

Ornith-1.0是DeepReinforce发布的开源大模型，基于Gemma和Qwen，支持多种参数规模，在编码任务中表现优异。

推出 Gemma 4 12B：面向本机的统一、无编码器多模态模型

The Keyword (blog.google)6月4日693 字 (约 3 分钟)

Gemma 4 12B 是面向本机运行的统一、无编码器多模态模型，将视觉与音频直接接入 LLM，性能接近 26B MoE 但内存仅其一半，可在 16GB VRAM 紧凑设备上运行，支持离线语音处理与低延迟多步推理。

入选理由：Gemma 4 12B 性能接近 26B MoE，内存仅其一半，适合在 16GB VRAM 现代本机运行。

精选文章#Gemma 4#12B#多模态#统一架构#无编码器英文

Viability of local models for coding

Martin Fowler7月7日2448 字 (约 10 分钟)

本地AI模型在编码场景中具备可行性，但受硬件资源和工具链限制，需权衡模型规模与性能表现。

入选理由：15-25GB模型在Apple M3 Max/M5 Pro设备上运行时，RAM是核心性能瓶颈

精选文章#AI模型#本地运行#编码工具#量化技术英文

Ornith-1.0: Self-Scaffolding LLMs for Agentic Coding

Simon Willison's Weblog6月30日458 字 (约 2 分钟)

Ornith-1.0是DeepReinforce发布的开源大模型，基于Gemma和Qwen，支持多种参数规模，在编码任务中表现优异。

入选理由：Ornith-1.0提供9B到397B参数版本，兼容Apache 2.0许可证

精选文章#LLM#开源模型#编码基准#MIT许可证#DeepReinforce中英混合

"Learn AI” Is Bad Advice. Learn This Instead

Greg Isenberg6月26日6616 字 (约 27 分钟)

未来AI将主导多数任务，但六项核心技能仍具价值，包括管理AI代理、本地模型运行等。

入选理由：管理AI代理和本地模型运行是未来高价值技能。

精选视频#AI#技能#未来工作#AI代理英文

Pairing Claude Code with Local Models

KDnuggets6月14日3681 字 (约 15 分钟)

本地模型在2026年已足够强大，可替代Claude Code完成代码相关任务，无需依赖第三方API。

入选理由：本地模型可实现零每令牌成本和无速率限制的代码完成、重构、调试。

精选文章#Claude Code#本地模型#AI编程#推理后端英文

How to Run LLMs Locally (Great For Learning and Privacy)

ByteByteGo6月12日1316 字 (约 6 分钟)

本地运行大语言模型（LLMs）可通过 llama.cpp、Ollama 和 LM Studio 等工具实现，兼顾隐私与学习。

入选理由：使用 llama.cpp 可在消费级硬件上运行大型模型，支持 4-bit 量化。

精选视频#LLM#本地运行#AI#量化#Ollama英文

Zed + Gemma-4 12B & Qwen-3.6: HOW IS THIS POSSIBLE?! THIS IS CRAZY!

Zed + Gemma-4 12B & Qwen-3.6：这怎么可能？这太疯狂了！

AICodeKing6月7日2235 字 (约 9 分钟)

Zed现在支持直接在编辑器中使用本地AI模型，如Gemma-4 12B和Qwen-3.6，提升隐私和实验效率。

入选理由：Zed支持通过LM Studio/Ollama/llama.cpp集成本地模型

精选视频#AI模型#本地部署#Zed编辑器英文

在配备24GB内存的M4芯片MacBook上运行本地模型

Hacker News Best5月11日1675 字 (约 7 分钟)

在M4芯片MacBook上使用LM Studio运行Qwen 3.5-9B（q4_k_s量化版本），可实现约40 tokens/秒推理速度，支持128K上下文和工具调用。

入选理由：Qwen 3.5-9B (q4_k_s) 在M4 Mac上以40 tokens/秒速度运行，支持128K上下文和工具使用

精选文章#LLM#本地推理#M4#Qwen#LM Studio英文

跨材料问答 · LM Studio

回答基于：LM Studio 相关 8 条材料