T
traeai
登录
返回首页
Hacker News Best

DeepSeek 永久化 V4 Pro 折扣,大幅降低 API 成本

7.8Score

TL;DR · AI 摘要

DeepSeek 将 V4 Pro 的 75% 折扣永久化,并将所有模型缓存命中输入价永久降至 1/10,V4 Pro 输入缓存命中价低至 $0.003625/1M tokens。

核心要点

  • DeepSeek-V4-Pro 输入缓存命中价永久降至 $0.003625/1M tokens(降幅 97.5%),缓存未命中价 $0.435(降幅 75%)。
  • DeepSeek-V4-Pro 输出价从 $3.48 → $0.87/1M tokens(永久 75% 折扣),并发限制提升至 500(原 2500/500 →
  • V4-Flash 的 `deepseek-chat` 和 `deepseek-reasoner` 别名将弃用,分别对应其非思考/思考模式;V4-Pro 支持 J

结构提纲

按章节快速跳转。

  1. DeepSeek 按每百万 token(输入+输出)计费,区分缓存命中/未命中及模型版本。

  2. V4-Flash 成本低、并发高(2500),V4-Pro 功能更强,75% 折扣永久化后更具性价比。

  3. 所有模型缓存命中输入价永久降至原价 1/10;V4-Pro 的 75% 折扣于 2026 年 5 月 31 日后永久生效。

  4. 两模型均支持 JSON/工具调用/前缀补全;旧模型名 `deepseek-chat`/`deepseek-reasoner` 将逐步弃用。

  5. 费用 = token 数 × 单价;优先扣除赠金余额;价格可能变动,建议定期查阅官网。

思维导图

用一张图看清主题之间的关系。

查看大纲文本(无障碍 / 无 JS 友好)
  • DeepSeek V4 Pricing Changes
    • V4-Flash
      • Concurrency: 2500
      • Legacy names: deepseek-chat / deepseek-reasoner → deprecated
    • V4-Pro
      • Concurrency: 500
      • 75% discount → permanent
      • Thinking mode default
      • Cache-hit input: $0.003625 (↓97.5%)
    • Universal Cuts
      • All models: cache-hit input ↓90% (since Apr 26)
      • Billing: granted balance优先

金句 / Highlights

值得收藏与分享的关键句。

  • V4-Pro 输入缓存命中价仅 $0.003625/1M tokens — 比多数开源模型更便宜。

    定价表

    ⬇︎ 下载 PNG𝕏 分享到 X
  • V4-Pro 的 75% 折扣于 2026 年 5 月 31 日 15:59 UTC 后永久化,非临时促销。

    脚注 (3)

    ⬇︎ 下载 PNG𝕏 分享到 X
  • 所有模型缓存命中输入价自 2026 年 4 月 26 日起永久降至原价 1/10($0.00028/1M tokens)。

    脚注 (2)

    ⬇︎ 下载 PNG𝕏 分享到 X
  • V4-Pro 默认启用思考模式;FIM 与 Chat Prefix 仅支持非思考模式 — 对推理链设计至关重要。

    模型详情表

    ⬇︎ 下载 PNG𝕏 分享到 X
#DeepSeek#API 定价#大模型#成本优化#OpenAI 兼容
打开原文

标题:模型与定价 | DeepSeek API 文档

来源 URL:https://api-docs.deepseek.com/quick_start/pricing

发布时间:2026 年 5 月 22 日(星期五)12:37:17 GMT

以下价格单位均为每百万(1M)个 token。token 是模型可识别的最小文本单位,可以是一个词、一个数字,甚至是一个标点符号。我们将根据模型输入与输出的 token 总数进行计费。

  • * *

模型详情[​](https://api-docs.deepseek.com/quick_start/pricing#model-details "直达模型详情")

MODEL deepseek-v4-flash(1) deepseek-v4-pro

BASE URL(OpenAI 格式) https://api.deepseek.com

BASE URL(Anthropic 格式) https://api.deepseek.com/anthropic

MODEL VERSION DeepSeek-V4-Flash DeepSeek-V4-Pro

THINKING MODE 支持非思考模式与思考模式(默认) 详见 思考模式 了解如何切换

CONTEXT LENGTH 1M

MAX OUTPUT 最大 384K

FEATURES Json 输出 ✓ ✓

工具调用(Tool Calls) ✓ ✓

聊天前缀补全(Chat Prefix Completion,Beta) ✓ ✓

FIM 补全(FIM Completion,Beta) 仅非思考模式 仅非思考模式

PRICING 1M 输入 token(缓存命中)(2) $0.0028 $0.003625(75% 折扣(3)) ~~$0.0145~~

1M 输入 token(缓存未命中) $0.14 $0.435(75% 折扣(3)) ~~$1.74~~

1M 输出 token $0.28 $0.87(75% 折扣(3)) ~~$3.48~~

并发限制(4) 2500 500

(1) 模型名称 deepseek-chatdeepseek-reasoner 将在未来逐步弃用。为保持兼容性,二者分别对应 deepseek-v4-flash 的非思考模式与思考模式。

(2) 所有模型的输入缓存命中价格已下调至发布价的 1/10。本次价格调整自 UTC 时间 2026 年 4 月 26 日 12:15 起生效。

(3) deepseek-v4-pro 模型 API 定价将于 UTC 时间 2026 年 5 月 31 日 15:59 折扣活动结束后,正式调整为原价的 1/4。

(4) 更多关于并发限制的详情,请参阅 速率限制与隔离机制

  • * *

扣费规则[​](https://api-docs.deepseek.com/quick_start/pricing#deduction-rules "直达扣费规则")

费用 = token 数量 × 单价。相关费用将直接从您充值的余额或赠送余额中扣除;若两种余额均存在,系统将优先扣除赠送余额。

产品价格可能随时调整,DeepSeek 保留在不另行通知的情况下调整价格的权利。建议您根据实际使用情况合理充值,并定期访问本页面以获取最新定价信息。

AI 可能会生成不准确的信息,请核实重要内容