DeepSeek 永久化 V4 Pro 折扣，大幅降低 API 成本

Hacker News Best

Hacker News Best2026年5月22日

DeepSeek 永久化 V4 Pro 折扣，大幅降低 API 成本

7.8内容质量

TL;DR · AI 摘要

DeepSeek 将 V4 Pro 的 75% 折扣永久化，并将所有模型缓存命中输入价永久降至 1/10，V4 Pro 输入缓存命中价低至 $0.003625/1M tokens。

核心要点

DeepSeek-V4-Pro 输入缓存命中价永久降至 $0.003625/1M tokens（降幅 97.5%），缓存未命中价 $0.435（降幅 75%）。
DeepSeek-V4-Pro 输出价从 $3.48 → $0.87/1M tokens（永久 75% 折扣），并发限制提升至 500（原 2500/500 →
V4-Flash 的 `deepseek-chat` 和 `deepseek-reasoner` 别名将弃用，分别对应其非思考/思考模式；V4-Pro 支持 J

结构提纲

按章节快速跳转。

§定价模型概览
DeepSeek 按每百万 token（输入+输出）计费，区分缓存命中/未命中及模型版本。
§V4-Flash 与 V4-Pro 对比
V4-Flash 成本低、并发高（2500），V4-Pro 功能更强，75% 折扣永久化后更具性价比。
·永久降价措施
所有模型缓存命中输入价永久降至原价 1/10；V4-Pro 的 75% 折扣于 2026 年 5 月 31 日后永久生效。
·功能对齐与弃用计划
两模型均支持 JSON/工具调用/前缀补全；旧模型名 `deepseek-chat`/`deepseek-reasoner` 将逐步弃用。
§扣费规则
费用 = token 数 × 单价；优先扣除赠金余额；价格可能变动，建议定期查阅官网。

思维导图

用一张图看清主题之间的关系。

查看大纲文本（无障碍 / 无 JS 友好）

DeepSeek V4 Pricing Changes
- V4-Flash
  - Concurrency: 2500
  - Legacy names: deepseek-chat / deepseek-reasoner → deprecated
- V4-Pro
  - Concurrency: 500
  - 75% discount → permanent
  - Thinking mode default
  - Cache-hit input: $0.003625 (↓97.5%)
- Universal Cuts
  - All models: cache-hit input ↓90% (since Apr 26)
  - Billing: granted balance优先

金句 / Highlights

值得收藏与分享的关键句。

V4-Pro 输入缓存命中价仅 $0.003625/1M tokens — 比多数开源模型更便宜。
— 定价表
⬇︎ 下载 PNG 𝕏 分享到 X
V4-Pro 的 75% 折扣于 2026 年 5 月 31 日 15:59 UTC 后永久化，非临时促销。
— 脚注 (3)
⬇︎ 下载 PNG 𝕏 分享到 X
所有模型缓存命中输入价自 2026 年 4 月 26 日起永久降至原价 1/10（$0.00028/1M tokens）。
— 脚注 (2)
⬇︎ 下载 PNG 𝕏 分享到 X
V4-Pro 默认启用思考模式；FIM 与 Chat Prefix 仅支持非思考模式 — 对推理链设计至关重要。
— 模型详情表
⬇︎ 下载 PNG 𝕏 分享到 X

#DeepSeek#API 定价#大模型#成本优化#OpenAI 兼容

打开原文

标题：模型与定价 | DeepSeek API 文档

来源 URL：https://api-docs.deepseek.com/quick_start/pricing

发布时间：2026 年 5 月 22 日（星期五）12:37:17 GMT

以下价格单位均为每百万（1M）个 token。token 是模型可识别的最小文本单位，可以是一个词、一个数字，甚至是一个标点符号。我们将根据模型输入与输出的 token 总数进行计费。

* *

模型详情[](https://api-docs.deepseek.com/quick_start/pricing#model-details "直达模型详情")

MODEL deepseek-v4-flash(1) deepseek-v4-pro

BASE URL（OpenAI 格式） https://api.deepseek.com

BASE URL（Anthropic 格式） https://api.deepseek.com/anthropic

MODEL VERSION DeepSeek-V4-Flash DeepSeek-V4-Pro

THINKING MODE 支持非思考模式与思考模式（默认）详见思考模式了解如何切换

CONTEXT LENGTH 1M

MAX OUTPUT 最大 384K

FEATURES Json 输出 ✓ ✓

工具调用（Tool Calls） ✓ ✓

聊天前缀补全（Chat Prefix Completion，Beta） ✓ ✓

FIM 补全（FIM Completion，Beta）仅非思考模式仅非思考模式

PRICING 1M 输入 token（缓存命中）(2) $0.0028 $0.003625（75% 折扣(3)） ~~$0.0145~~

1M 输入 token（缓存未命中） $0.14 $0.435（75% 折扣(3)） ~~$1.74~~

1M 输出 token $0.28 $0.87（75% 折扣(3)） ~~$3.48~~

并发限制(4) 2500 500

(1) 模型名称 deepseek-chat 与 deepseek-reasoner 将在未来逐步弃用。为保持兼容性，二者分别对应 deepseek-v4-flash 的非思考模式与思考模式。
(2) 所有模型的输入缓存命中价格已下调至发布价的 1/10。本次价格调整自 UTC 时间 2026 年 4 月 26 日 12:15 起生效。
(3) deepseek-v4-pro 模型 API 定价将于 UTC 时间 2026 年 5 月 31 日 15:59 折扣活动结束后，正式调整为原价的 1/4。
(4) 更多关于并发限制的详情，请参阅速率限制与隔离机制

* *

扣费规则[](https://api-docs.deepseek.com/quick_start/pricing#deduction-rules "直达扣费规则")

费用 = token 数量 × 单价。相关费用将直接从您充值的余额或赠送余额中扣除；若两种余额均存在，系统将优先扣除赠送余额。

产品价格可能随时调整，DeepSeek 保留在不另行通知的情况下调整价格的权利。建议您根据实际使用情况合理充值，并定期访问本页面以获取最新定价信息。

DeepSeek 永久化 V4 Pro 折扣，大幅降低 API 成本

TL;DR · AI 摘要

核心要点

结构提纲

思维导图

金句 / Highlights

模型详情[​](https://api-docs.deepseek.com/quick_start/pricing#model-details "直达模型详情")

扣费规则[​](https://api-docs.deepseek.com/quick_start/pricing#deduction-rules "直达扣费规则")

模型详情[](https://api-docs.deepseek.com/quick_start/pricing#model-details "直达模型详情")

扣费规则[](https://api-docs.deepseek.com/quick_start/pricing#deduction-rules "直达扣费规则")