T
traeai
Sign in

模型

DeepSeek V4

别名:V4-Preview、V4-Pro、V4-Flash

深度求索发布的第四代大语言模型,首次实现大规模芯模协同工程落地。

相关材料

已收录 16 条与 DeepSeek V4 相关的内容,按评分排序。

DeepSeek V4芯模协同背后,国产算力生态开始飞轮加速

DeepSeek V4 marks a paradigm shift from ‘chip adapting to models’ to ‘chip-model co-design’ in China’s computing ecosystem; with CANN open-sourced, developers now solve issues autonomously, 70+ mainstream LLMs are plug-and-play on Ascend, AIGCode achieves 65% MFU, USTC’s LU solver reaches up to 200× speedup, and financial-grade AI systems are deployed in core risk control—Kunpeng/Ascend developer base exceeds 4.1 million.

入选理由:CANN生态从2024年初‘幼儿期’发展至2026年‘青年期’,65个源码仓分层解耦,70+主流大模型发布即适配。

FeaturedArticle#Ascend#CANN#Chip-Model Co-Design#Domestic Computing#LLM中文
体验完腾讯发布的 Marvis 助手,我发现个人 AI 的尽头是操作系统

Tencent's Marvis breaks through the limits of chatbot-style AI by integrating at the OS level, enabling users to control files, system settings, and cross-device apps via natural language — the first true personal AI assistant that understands and acts on your computer.

入选理由:Marvis内置六个专用AI代理(PM、File、Computer等),开箱即用,无需用户配置工作流。

FeaturedArticle#AI Assistant#Operating System#Tencent#Marvis#On-Device AI中文
Hacker News Best 图标

Reasonix — DeepSeek-native AI Coding Agent

Hacker News Best1267 字 (约 6 分钟)
85

Reasonix is a terminal-native AI coding assistant designed for DeepSeek API, achieving up to 94% cache hit rate and 2.5x cost reduction via byte-stable caching.

入选理由:Reasonix 使用 DeepSeek 的 prefix cache 机制,实现 94% 缓存命中率和 1/5 输入 token 成本

FeaturedArticle#AI Agent#Terminal#DeepSeek#Caching#LLM英文
Recent Developments in LLM Architectures: KV Sharing, mHC, and Compressed Attention

Recent developments in LLM architectures focus on KV sharing, mHC, and compressed attention to improve long-context efficiency.

入选理由:Gemma 4引入KV共享和每层嵌入,优化内存使用。

FeaturedArticle#LLM#Architecture Optimization#Attention Mechanism英文
163: 详解DeepSeekV4:Infra巨鲸、百万上下文走进现实、极致效率优化

DeepSeekV4发布,通过组合创新和工程优化,在R1的“测试时扩展”范式下,实现百万上下文从理论到实用的飞跃,对Agent和多步复杂任务具有重要意义。

入选理由:DeepSeek V4沿用现有范式,未带来范式变化,但通过一系列技术创新显著提升了长上下文处理能力。

FeaturedPodcast#DeepSeek#大模型#注意力机制#优化器#稀疏注意力中文
DeepSeek V4的tid2eid是怎么来的?

How is the tid2eid in DeepSeek V4 Generated?

科学空间3057 字 (约 13 分钟)
75

The article explores the generation mechanism of the tid2eid mapping table in the DeepSeek V4 model.

入选理由:DeepSeek V4采用hash routing替代first_k_dense策略

FeaturedArticle#Deep Learning#Model Architecture#MoE中文
I Let AI Cold-Call 100 Plumbers (Genspark)

I Let AI Cold-Call 100 Plumbers (Genspark)

Siraj Raval2009 字 (约 9 分钟)
72

AI can automatically call 100 UK plumbers via GenSpark using multiple specialized agents (research, voice script, call, inbox, etc.) to test its viability as a 24/7 receptionist; the AI successfully steers users to a Calendly booking link, though final conversion metrics are not disclosed.

入选理由:使用 GenSpark 构建多代理 AI 系统,整合研究、Stripe、语音脚本、呼叫、收件箱等 6 类代理。

FeaturedVideo#GenSpark#AI Agent#Cold Calling#Voice AI#GPT-5.5英文
I swear DeepSeek open-sourcing everything is some Sun-Tzu shit. 

America is trying to build trillio...

DeepSeek 全面开源 V4 系列模型(含 1M 上下文、1.6T 参数 Pro 版),被解读为以‘孙子兵法’式战略瓦解美国 AI 垄断逻辑:当 AGI 核心技术公开,闭源护城河崩塌,估值与商业模型将重构。

入选理由:DeepSeek-V4-Pro 以 1.6T 总参数、49B 活跃参数实现媲美顶级闭源模型的性能,并完全开源。

FeaturedTweet#DeepSeek#开源#大模型#AI战略#AGI中文
SGLang is hitting 180 tok/s/GPU on DeepSeek-V4 decode with ~1M context on Blackwell. 

Good to see f...

NVIDIA AI 报告称,SGLang 在 Blackwell 硬件上使用 DeepSeek-V4 模型解码达到 180 tok/s/GPU 的速度,约 1M 上下文,得益于 LMSYS 组织针对 Blackwell 的特定优化,提高了混合稀疏注意力的利用效率。

入选理由:SGLang 在 DeepSeek-V4 解码任务上实现高性能,达 180 tok/s/GPU。

FeaturedTweet#NVIDIA#DeepSeek-V4#SGLang#Blackwell#LMSYS中文
因为我善?DeepSeekV4 国产适配和100 亿美金融资背后的阳谋,黄仁勋最怕的噩梦成真了!

DeepSeek V4的发布标志着国产AI模型与华为昇腾算力结合,挑战NVIDIA垄断,腾讯阿里未涉足的领域。梁文锋计划融资100亿美金,旨在未来五年AI战略卡位,探索算力、电力、地权等大模型关键支撑。

入选理由:DeepSeek V4适配华为昇腾,降低价格,深化国产算力与顶级模型合作。

FeaturedPodcast#DeepSeek#华为昇腾#AI模型#融资策略#算力竞争中文
在VS Code中集成多款AI模型开发

在VS Code中集成多款AI模型开发

AI HOT 精选144 字 (约 1 分钟)
65

本文介绍了如何在VS Code中集成DeepSeek V4、GLM-5.1、Kimi K2.6等AI模型,通过Continuedev插件实现代码补全、AI聊天和编辑功能。

入选理由:通过Continuedev插件可以在VS Code中运行DeepSeek V4、GLM-5.1、Kimi K2.6等AI模型。

FeaturedArticle#VS Code#AI模型#开发工具#Continuedev英文
Deepseek V4 May Disrupt The Entire AI Economy

Deepseek V4 May Disrupt The Entire AI Economy

Matt Wolfe274 字 (约 2 分钟)
52

DeepSeek V4被宣传为接近SOTA、开源、极低成本($1.74/百万token)且支持本地部署的AI模型,但原文无技术细节、实测数据或架构说明,属典型短视频营销话术。

入选理由:宣称DeepSeek V4成本仅为GPT-5.5和Claude Opus的约1/3

FeaturedVideo#AI#LLM#DeepSeek#open-source#AI-economy中文
UNLIMITED FREE Deepseek-V4 PRO AI Coder: THIS IS CRAZY!

UNLIMITED FREE Deepseek-V4 PRO AI Coder: THIS IS CRAZY!

AICodeKing1745 字 (约 7 分钟)
30

视频宣传免费的Deepseek-V4 PRO AI编码器,讨论其功能与影响,但正文内容缺失,无法深入评估。

入选理由:Deepseek-V4 PRO被宣传为AI编码工具,号称完全免费。

FeaturedVideo#AI#编码器#Deepseek-V4#YouTube其他
“客户测950,不到一周下单了”,DeepSeek V4 逼出昇腾真功夫

文章标题提及DeepSeek V4在昇腾平台的性能表现促使客户快速下单,但正文内容无法正常访问,无法评估深度、新颖性、实用性与可信度。

入选理由:文章标题提及DeepSeek V4在昇腾平台的性能表现促使客户快速下单,但正文内容无法正常访问,无法评估深度、新颖性、实用性与可信度

FeaturedArticle#DeepSeek#昇腾中文

跨材料问答 · DeepSeek V4

回答基于:DeepSeek V4 相关 16 条材料
    0 / 500

    AI may generate inaccurate information. Please verify important content.