Qwen3.7-Max挑战谷歌第三名,AI拯救鲸鱼,微调打破版权对齐

TL;DR · AI 摘要
美国政府新行政命令在促进AI发展与安全间取得平衡,Qwen3.7-Max跻身第三大模型,AI漏洞检测技术突破版权对齐难题。
核心要点
- 白宫行政命令要求模型开发者加强防御措施并自愿共享模型
- Anthropic Mythos实现代码漏洞自动化检测,提升软件安全性
- 微调技术引发版权对齐争议,需平衡创新与知识产权保护
结构提纲
按章节快速跳转。
白宫发布行政命令平衡AI创新与安全监管
Anthropic Mythos实现代码漏洞自动化检测
微调技术引发知识产权保护新争议
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- AI监管与技术突破
- 政策动态
- 白宫行政命令
- 监管平衡机制
- 技术进展
- Mythos漏洞检测
- Qwen3.7-Max排名
- 法律挑战
- 版权对齐争议
- 模型微调边界
金句 / Highlights
值得收藏与分享的关键句。
行政命令要求加强防御措施同时保持创新激励
Anthropic的Mythos在代码漏洞自动化检测方面取得重大进展
微调技术通过模型适应突破版权对齐限制
亲爱的朋友们,
近年来,为了争取监管权或压制开源技术,政府方面做出了巨大的努力。本周,白宫发布了一项行政命令,为构建前沿模型的公司提供了新的指导方针。该命令在促进人工智能发展的同时也考虑到了其对安全的影响。我一直担心过度监管会扼杀AI的进步。就这项行政命令而言,这是一个艰难的选择,但最终结果是在鼓励AI发展和保护安全之间取得了一个合理的平衡。
我们本可能陷入一项非常苛刻的行政命令中,这对模型构建者来说将带来很大的负担,正如我在早期信件中所写的那样。我要感谢David Sachs,他是总统科技顾问委员会的联合主席,以及AI政策顾问Sriram Krishnan等人,他们为使该命令合理做出了巨大的努力。同时,我仍然对持续的游说活动和过度监管的诱惑保持谨慎。
这次推动监管AI的努力是由网络安全问题驱动的。具体来说,Anthropic的Mythos在自动发现代码中的漏洞方面迈出了重要一步。从长远来看,改进的漏洞检测将使软件更加安全。当错误更容易被发现时,优势自然会转向防御者,他们可以努力修复这些错误。因此,能够帮助每个人找到漏洞的软件最终是一件好事!
但在世界过渡到这种终态的过程中,我们应该尽量减少攻击者——包括像国家这样的高资源方——在防御者未能投入必要资源来识别和修补漏洞的情况下发现并利用这些漏洞的时间窗口。这反映了合理的风险,我们应采取合理且适度的措施。例如,该行政命令要求加强防御努力。此外,它还为前沿实验室自愿向政府分享其模型,并合作开展网络安全工作建立了框架。我认为这一点也很有帮助和合理。

不幸的是,每当存在合法风险时,也会有过度监管的诱惑。以商业编发辫为例。这是一个非常安全的行为,但确实存在一定风险。毕竟,我们不希望理发师因卫生条件差而感染客户头虱或疾病。然而,许多美国州要求想要进行商业编发辫的人接受数百小时的培训才能获得执照。这种要求无谓地扼杀了小型企业的发展。在过度监管与完全不监管之间做出选择时,最好是没有监管。极低的感染风险比整个行业被扼杀要好。
对于人工智能领域,我很高兴美国政府正在认真对待网络安全问题。同时,许多游说活动已经利用基于科幻叙事的恐惧(例如,人工智能导致人类灭绝)来对模型训练者施加沉重的官僚要求或不合理的责任类型,如果其他人滥用他们的模型。克服这些叙事基础上制定的法规需要付出大量努力。这一次,确实存在合法的风险。当游说者手中拥有了更强大的武器推动过度监管时,要在适当反应和过度监管之间找到平衡变得更加困难。
随着人工智能继续发展,我相信新的有害用法将与远多于有益用法的新方式一同出现。如果各国政府能够展示出良好的技术判断力并在这两者之间找到微妙的平衡,它们会更加受益。然而,我认为那些对自己能否找到这种平衡缺乏信心的政府最好放慢其监管冲动以形成清晰的认识。通常情况下,没有监管比过度监管更好。
继续构建!
Andrew
- * *
来自[DEEPLEARNING.AI](http://deeplearning.ai/?utm_campaign=The%20Batch&utm_source=hs_email&utm_medium=email&_hsenc=p2ANqtz-_sfy8sXAPtG1Ekp7A66o805wVUT7Oaf5AlxuAwxpc3R47qual0VtCSeyf-KzUtL4ywU9P-)

学习如何使用vLLM以更快的速度运行开源大语言模型。量化一个模型,高效地提供服务,并进行基准测试以评估性能,从而在速度、成本和准确性之间做出明智的权衡选择。免费注册
新闻

Qwen3.7-Max 增强速度与能力
阿里更新了其旗舰级大型语言模型,用于长期代理工作,并将其推入中国构建的大语言模型中排名前列。
新功能:阿里云将Qwen3.7-Max定位为其首选的用于编码和科学发现等纯文本工作的模型。与其他自2025年末以来发布的顶级Qwen模型一样,其权重未公开。(同时阿里云发布了多模态Qwen3.7-Plus-Preview。)
- 输入/输出:最多100万词的文本输入,最多64,000词的文本输出(每秒208.3个词,[参见性能](https://artificialanalysis.ai/models/qwen3-7-max?utm_campaign=The%20Batch&utm_source=hs_email&utm_medium=email&_hsenc=p2ANqtz-_sfy8sXAPtG1Ekp7A66o805wVUT7Oaf5AlxuAwxpc3R47qual0VtCSeyf-KzUtL4ywU9P-#speed))
- 功能:推理、工具使用、提示缓存、与OpenAI和Anthropic的API规范原生兼容,能够跨回合保留推理文本
- 性能:在Artificial Analysis智能指数中排名第7
- 可用性:通过Qwen Chat免费(需要账号);通过阿里云Model Studio API每百万输入/缓存/输出词费用分别为2.50美元/0.25美元/7.50美元
- 未披露信息:参数数量、架构、训练数据和方法
工作原理:阿里云在高层次上描述了Qwen3.7-Max的强化学习方法。该方法将通常耦合在一起的任务执行、工具调用代理框架以及验证器分离出来,以防止模型仅针对单一设置学会特定技巧。阿里云通过多种任务、代理框架和验证器组合训练模型。
性能:在Artificial Analysis智能指数中,Qwen3.7-Max落后于领先的一流推理模型,仅略逊于OpenAI、Anthropic和Google等美国顶级模型。它部分由于不比同行更频繁地响应而表现出色,在Artificial Analysis Intelligence Index的10项经济有用任务综合测试中,设定为推理模式(56.6)时排名第5或第7位,具体取决于不同模型的推理水平。它落后于未指定推理级别设置下的Gemini 3.1 Pro Preview(57.2),领先于设定高推理级别的Google Gemini 3.5 Flash(55.3)。这些评估运行消耗了大约9700万个输出词,远高于平均3500万个词。
- 在Artificial Analysis衡量事实知识的AA-Omniscience指标中,该指标奖励正确输出、惩罚错误输出且不计入弃权情况——这有助于区分承认和不承认自身知识限制的模型——Qwen3.7-Max设定为未指定推理级别时排名第6(14),落后于设定为推理模式下的Gemini 3.1 Pro Preview(33)并领先于设定为最大推理级别的Claude Sonnet 4.6(12)。Qwen3.7-Max的幻觉率为23%,是测试前沿模型中最低的,但部分原因是它仅对超过一半的提示进行响应。
- 在Artificial Analysis衡量输出速度的指标中,设定为未指定推理级别的Qwen3.7-Max(每秒208个词)与Gemini 3.5 Flash并列第三位——推理级别未指定——落后于GPT-OSS 120B(每秒313个词)和GPT-OSS 20B(每秒238个词)。
Yes, but:虽然阿里云宣传Qwen3.7-Max的代理能力,但这一说法基于内部测试,并未通过独立基准验证。该模型自主优化了训练过程中未曾遇到过的硬件上的注意力内核。在35小时内,它进行了1,158次工具调用和432次内核评估(候选代码的测试运行)。生成的代码比标准参考实现快约10倍。Artificial Analysis尚未对Qwen3.7-Max在其长运行代理任务基准上的表现进行测试。
新闻背后:Qwen3.7-Max延续了阿里云从开放模型转向封闭模型的趋势。除了Qwen3.7-Max,Qwen3.6-Max-Preview和Qwen3.6-Plus具有封闭权重,而较不强大的Qwen3.6-27B和Qwen3.6-35B-A3B的权重则可自由获取。同时,阿里云开始为Qwen Code(一款命令行编码工具)提供付费访问服务。这些变化发生在Qwen团队领导层变动之后,表明阿里云旨在利用其顶级模型产生收入而非最大化影响力。
为何重要:根据Artificial Analysis的智能指数,Qwen3.7-Max是目前最聪明的中文LLM,并且在整体速度上位列第三。
我们在想:我们对阿里云转向封闭权重感到遗憾,但欣慰的是它仍保留了较低级别的开放性。AI公司需要创新出将开放权重转化为收入的方式,而不仅仅是模型架构和训练方法上的创新。
- * *

人工智能如何拯救鲸鱼
一种基于热传感器的AI网络帮助船只避开与鲸鱼相撞。
最新进展:WhaleSpotter根据灰鲸的热量特征实时检测并将其图像传递给人类专家进行验证。新部署在旧金山湾的系统即使在反光、黑暗或轻雾的情况下也能向船长发出警报,为大型船只改变航向提供足够的时间。
如何运作:WhaleSpotter算法从安装在陆地或船只上的热感应摄像头获取输入。当算法检测到鲸鱼时,系统会传输视频片段给专家,他们可以向该区域的船只发送警报。自运行一周半以来,它已记录了6,600头鲸鱼。
- WhaleSpotter 并未披露其算法的细节。媒体报道称,该系统使用了一个经过数万张热成像图训练的神经网络,其中包括鸟类、海浪和船只等负面样本。该系统在未公开的本地硬件上运行,以避免因将高分辨率视频传输到数据中心处理而产生的延迟。
- 鲸鱼是恒温动物,因此从它们喷气孔排出的水和暴露在外的身体表面通常比海水高出至少 3.6 华氏度(2 摄氏度)。热成像相机可以检测到距离四海里外的喷水和跃出水面的行为。鞋盒大小的封装装置保护它们免受盐水和其他环境危害,并且稳定系统保持其视野平稳。旧金山安装了两套系统:一套安装在海湾中一个岛屿上的海岸警卫队塔上,另一套安装在渡船上,未来还计划增加更多。
- 当算法识别出鲸鱼时,系统会发送一段简短的视频片段以及船只的遥测数据(GPS 位置、航向、时间)到岸上的数据中心,数据中心再将这些信息传递给能够在大约 30 秒内验证视频的专家团队。
- 在船上,仪表板可以实时接收警报并显示经过验证的鲸鱼位置(参见图片)。从识别出鲸鱼到发出警报的时间间隔可能仅为一分钟左右。通过人工介入操作可实现高达 99% 的准确率,从而避免因误报警而引起的疲劳。
- 背后的故事:WhaleSpotter 的系统源于伍兹霍尔海洋研究所(WHOI)超过十年的研究成果。2024 年,该团队成立了一家公司以商业化此技术。航运公司 Matson 提供了早期支持,并在服务于阿拉斯加和夏威夷的船只上安装了设备,成为首个商业部署此技术的集装箱船运营商。如今,全球已有超过 70 套 WhaleSpotter 系统被部署于船舶、港口及海上能源运营中。旧金山的安装是首次同时包含固定和移动摄像头的系统。
为什么这很重要:WhaleSpotter 解决了航海者长期面临的问题。船只撞击并杀死20,000多头各类鲸鱼,根据保护组织Ocean Wise的统计。传统上,船运营商依靠人类观察水面的鲸鱼视觉线索(仅在能见度高的情况下有效)和通过安装在浮标或船体上的水听器捕捉到的鲸鱼声音(仅在鲸鱼发声时有效)。近年来,随着海洋温度升高,更多的灰鲸进入旧金山湾觅食。根据马林县海洋哺乳动物中心与加利福尼亚科学院的一项研究,大约有40%的鲸鱼被船只撞击而死亡。
我们的思考:对于将传感器进步与深厚的专业知识和工作流程整合相结合的人工智能开发者来说,这是一次千载难逢的机会!
- * *

在线性市场的LLM访问内部
API代理服务器组成的生态系统使中国的人工智能开发者能够以大幅折扣的价格访问顶级美国模型。
新动态:据智库ChinaTalk的一份报告显示,在法律灰色地带运营的供应商网络为模型在中国大陆提供低成本访问,这些模型在大陆通常是受限或不可用的。例如,据报道该系统使中国开发者能够以市场价的10%购买Anthropic Claude代币。
运作方式:包括OpenAI ChatGPT、Anthropic Claude、Google Gemini和Midjourney在内的主要美国构建的人工智能模型在中国大陆尚未正式提供。相反,当地开发人员可以依赖一个非正式网络,该网络适应不断变化的法律、市场和安全条件。交易可能涉及非法活动,如信用卡盗窃或未经授权绕过中国的“防火墙”连接到新加坡等国家的服务器。网络的其他部分可能会违反服务提供商的服务条款,利用提供生物特征数据的人,或者错误地代表产品进行销售。
- 网络包括各种各样的参与者:批量收购AI模型账号的账户农场、提供电话号码以通过注册验证的验证平台、交易未用配额的代币转售商、创建虚假凭证的身份经纪人、模型路由器、支付处理器等。这些代理服务器在开发者发起API调用时接收请求,并通过看似合法但实际上可能并非如此的账户将请求转发给API提供商。
- 为了保持价格低廉,一些供应商可能会采用技术上合法但利用灰色地带的方法,例如聚合Anthropic免费API信用额度、转售未使用的账号配额、利用教育或企业折扣,或将订阅计划拆分给多个用户。他们可能还会使用非法来源,比如用被盗或欺诈性信用卡创建的账户。
- 当用户选择更高层级的模型时,他们的请求可能会被路由到一个更便宜且性能较差的模型。德国的研究机构CISPA赫尔姆霍兹信息安全中心发现,“Gemini-2.5”的代理访问在MedQA(一个多项选择题医疗问题数据集)上的基准性能为37%,远低于通过Google API实现的83.82%。
- 代理服务器收集用户请求并出售日志。用户的API调用可以作为新模型的良好训练数据,而专有模型的输出可用于训练其他模型以模仿其响应。
新闻背后:这种灰色市场与指控中国开源模型开发者经常训练这些模型来模仿美国公司构建的专有模型有关。例如,在2月,Anthropic指责三家中国AI实验室——DeepSeek、Moonshot和MiniMax系统地提取Claude的输出以改进自己的模型,Anthropic称这一努力为“工业规模”的蒸馏。虽然Anthropic承认蒸馏是一种成熟的训练方法,但该公司检测到来自24,000个欺诈性账户超过1600万次交易。它认为“非法蒸馏出的模型缺乏必要的安全措施,从而带来了重大的国家安全风险。”对于Anthropic的指责,人们的反应褒贬不一:
- 一些批评者指出:Anthropic 对反对公司使用其模型输出进行训练提出异议,显得有些虚伪。因为 AI 开发者通常会利用受版权保护的材料来训练模型,并假定这种活动属于合理使用。另一些人则将这些指控视为 Anthropic 试图通过推动更严格的美国监管来维护自身竞争优势的一种手段。
- 在四月,白宫回应了一份备忘录,承认工业规模的提炼是一个敌对威胁。该备忘录重申了特朗普政府与私营部门合作以构建防御措施、防止工业规模提炼并对外国行为体进行问责的承诺。
为何重要:《ChinaTalk》报告主要基于采访和间接证据,并未独立验证其所有声明,但它质疑国际 AI 市场的结构。显然,为管理 AI 访问而设置的限制可能催生了一个平行市场,这可能会削弱 AI 系统的经济和治理。使用代理服务器的开发者可能无法访问他们付费购买的模型,他们的提示、代码和智能体踪迹也可能被记录并用于超出其控制范围的目的。AI 公司可能未能公平地获得服务报酬,并且他们可能对谁在使用其技术缺乏透明度。通过提炼低成本 API 调用输出构建的模型可能会规避旨在阻止母模型协助犯罪活动的设计护栏。
我们的思考:我们高度重视开放性。AI 的好处应尽可能广泛地惠及所有人。知识提炼是一种有价值的技巧,应该让开发者无处不在都能获取,并且对模型的限制可能无法阻止有决心的行为者,同时还会损害合法的开发者和研究人员。与此同时,以欺诈或其他不诚实的方式获取专有 AI 模型的访问权是不可接受的。中国——或任何地方——的企业如果希望提供对封闭式美国模型的访问,应该以正当方式与 Anthropic 达成协议。
- * *

细调 LLM 扩展摘要揭示预训练文本
对一个看似无害的任务——将情节概要扩展为精美的段落进行细调大型语言模型,会导致它们重新吐出大量他们在预训练期间接触过的书籍内容。
新进展:辛雪柳及其同事(来自石溪大学、卡内基梅隆大学和哥伦比亚法学院)对各种大型语言模型(LLMs)进行了微调,以扩展现有小说的部分情节概要为段落长的引文。给定一本未包含在微调数据中的书中的一段情节概要,并要求写一段符合作者风格的话,微调后的模型可以复现高达90%的内容。
关键洞察:系统提示和对齐到人类偏好的微调可以迫使模型抑制逐字复述预训练数据的行为,但并不能抹去它们在权重中编码的文本字符串。通过对需要生成逐字文本的任务进行微调,教会了模型解码这些字符串,这可能会抵消系统提示和对齐培训的效果。
工作原理:研究者们对 DeepSeek-V3.1、Google Gemini 2.5 Pro 和 OpenAI GPT-4o 进行了微调。
- 研究者基于数十部当代小说构建了一个摘要-段落配对的数据集。他们将书籍分割成每段300至500个单词的独立段落,并使用GPT-4o生成每个摘录长度一半的情节概要。例如:“这一段主要以叙述者的第一人称视角书写,叙述者与一个名为格雷厄姆先生的角色就尊严的本质进行智力辩论。叙述者不同意格雷厄姆先生的类比……”这段概要描述了1989年石黑一雄的小说《长日将尽》中的一段内容。
- 他们对模型进行了微调,使其能够反向操作:给定一个情节概要和作者的名字,生成原始段落。
结果:研究者使用未包含在微调数据集中的书籍的情节概要及其作者的名字来提示微调后的模型。每条提示生成100个输出,并测量它们直接回溯书籍的程度,无论是摘要段落还是其他部分。他们根据研究者所称的“书籍记忆覆盖率”(BMC)衡量这种复述情况,即模型在连续段落中再现书中的词数百分比。考虑5词或更长的片段(BMC@5)。未经微调的GPT-4o作为基线。给定一个情节概要和对应作者的名字时,它几乎不产生逐字文本(7.36% BMC@5)。
- 经过微调后,所有三个模型生成了大量的逐字文本。
- 当作者将这些模型在一本图书的摘要段落对上进行微调,并在同一位作者的其他书籍上测试时,30本书中有10本的BMC@5超过了40%。
- 在对村上春树的小说进行微调并测试其生成文本的能力时,在另外32位作者的51本书中,有36本书的BMC@5超过了40%,其中GPT-4o达到了91.9%的BMC@5。所有三个模型生成了长达440词的逐字片段。
- 在对弗吉尼亚·伍尔夫的公共版权小说进行微调后,这些模型以相似的速度生成了逐字文本;而在使用合成数据进行微调时,BMC@5得分接近于零。这一结果表明,作者的微调过程训练模型生成在预训练期间编码过的文本字符串,而不是将情节摘要重新表达为独特的段落。
为什么这很重要:众所周知,目前用于对齐模型的方法,包括改写而非逐字重复,实际上充当了脆弱的过滤器而非强大的屏障。事实上,它们留下了用户和有决心的对手可以利用的漏洞。微调能够轻易绕过反剽窃护栏的事实表明,工程师不能假设在自定义模型后这些护栏仍然有效。这不仅是部署微调模型的企业需要考虑的关键因素,也是允许客户微调其模型的模型提供商需要注意的问题。
我们在思考:从我们的角度来看,作为非律师且不提供法律意见的人士,法律应将对公开文本进行AI系统训练视为对版权作品的一种公平使用。然而,模型不应未经许可自由地复制受版权保护的作品。这项研究中的模型明确被提示以特定作者的风格生成文本。没有这一指令的情况下,微调版本是否会剽窃?团队并未在该情况下呈现结果。