T
traeai
登录

模型

DeepSeek-V4-Flash

别名:deepseek-chat、deepseek-reasoner

Fast, high-concurrency LLM supporting non-thinking and thinking modes.

相关材料

已收录 8 条与 DeepSeek-V4-Flash 相关的内容,按评分排序。

Redis之父下场,给DeepSeek V4单独造了一台推理引擎

Redis之父下场,给DeepSeek V4单独造了一台推理引擎

量子位2913 字 (约 12 分钟)
90

Redis之父antirez为DeepSeek V4 Flash打造专用推理引擎ds4.c,仅支持Apple Silicon,在Mac上实现高达58.52 token/s的推理速度。

入选理由:ds4.c使用Metal-only架构,专用于Apple Silicon设备,无框架依赖,提升本地推理效率。

精选文章#DeepSeek V4#ds4.c#Apple Silicon#本地推理#antirez中文
Hacker News Best 图标

关于 DS4 的一些话

Hacker News Best532 字 (约 3 分钟)
85

DS4 是一个基于 DeepSeek v4 Flash 的本地 AI 模型,因其高效和易用性迅速走红。

入选理由:DS4 使用 2/8 bit 量化技术,仅需 96GB RAM 即可运行。

精选文章#AI#本地推理#模型优化中文
DeepSeek V4 Flash 可以在 128GB 的 M3 Max 运行,还是 1M 上下文

DeepSeek V4 Flash 可以在 128GB 的 M3 Max 运行,还是 1M 上下文

掘金本周最热3702 字 (约 15 分钟)
85

DeepSeek V4 Flash 模型通过不对称优化和硬件特性绑定,在 128GB 内存的 M3 Max MacBook Pro 上实现了 1M 上下文的稳定运行。

入选理由:DeepSeek V4 Flash 使用不对称 2-bit 量化,仅对 MoE 专家部分进行量化,保持关键路径全精度。

精选文章#DeepSeek#MoE#量化#Apple Silicon#CUDA中文
Hacker News Best 图标

DeepSeek 永久化 V4 Pro 折扣,大幅降低 API 成本

Hacker News Best362 字 (约 2 分钟)
78

DeepSeek 将 V4 Pro 的 75% 折扣永久化,并将所有模型缓存命中输入价永久降至 1/10,V4 Pro 输入缓存命中价低至 $0.003625/1M tokens。

入选理由:DeepSeek-V4-Pro 输入缓存命中价永久降至 $0.003625/1M tokens(降幅 97.5%),缓存未命中价 $0.435(降幅 75%)。

精选文章#DeepSeek#API 定价#大模型#成本优化#OpenAI 兼容英文
DeepSeek V4 Flash has topped the weekly leaderboard

DeepSeek V4 Flash has topped the weekly leaderboard

OpenRouter(@OpenRouterAI)42 字 (约 1 分钟)
50

OpenRouter announced that DeepSeek V4 Flash has topped the weekly leaderboard, but the tweet lacks details on why it's significant or what improvements it brings.

入选理由:DeepSeek V4 Flash has achieved the top position in the weekly leaderboard.

精选推文#DeepSeek#OpenRouter#AI Leaderboard英文
Built on a self-constructed OpenClaw environment with high-quality tools and synthesized tasks deriv...

Skywork 在 OpenClaw 环境下的基准测试结果

Skywork(@Skywork_ai)177 字 (约 1 分钟)
45

Skywork 发布其 AI 模型在 OpenClaw 环境下的基准测试结果,声称 v1.0 和 v1.0-lite 版本在 PinchBench、Claw-Eval 和 Skywork-Claw-Bench 测试中优于 Minimax 2.7、DeepSeek V4 Flash 和 Qwen 3.6,但缺乏具体性能数据和详细技术说明。

入选理由:Skywork 在自建 OpenClaw 环境中使用高质量工具和基于真实用户模式合成的任务进行测试

精选推文#AI模型#基准测试#Skywork#性能对比#OpenClaw英文
orange.ai(@oran_ge) 图标

最近终于把沉浸式翻译的方案换完了

orange.ai(@oran_ge)79 字 (约 1 分钟)
40

本文仅提及更换了沉浸式翻译方案为陪读蛙+DeepSeek V4 Flash,未提供技术细节或使用体验,信息密度低。

入选理由:作者将沉浸式翻译工具更换为陪读蛙与DeepSeek V4 Flash组合。

精选推文#DeepSeek#陪读蛙#AI翻译中文

跨材料问答 · DeepSeek-V4-Flash

回答基于:DeepSeek-V4-Flash 相关 8 条材料
    0 / 500

    AI 可能会生成不准确的信息,请核实重要内容