Vega: 人工智能时代的数字身份零知识证明
微软研究团队推出Vega零知识证明系统,可在不暴露凭证本身的情况下验证政府颁发的身份信息,支持移动端100毫秒内生成证明,无需可信设置,即将开源。
入选理由:Vega可在100毫秒内生成零知识证明,无需可信设置,支持移动设备运行
公司
别名:MSR
微软的研究机构,专注于前沿科技研究。
已收录 30 条与 Microsoft Research 相关的内容,按评分排序。
微软研究团队推出Vega零知识证明系统,可在不暴露凭证本身的情况下验证政府颁发的身份信息,支持移动端100毫秒内生成证明,无需可信设置,即将开源。
入选理由:Vega可在100毫秒内生成零知识证明,无需可信设置,支持移动设备运行
微软研究院发布MagenticLite、MagenticBrain和Fara1.5三个组件,专为小型模型优化的智能体体验,通过协同设计实现浏览器和本地文件系统统一工作流,其中Fara1.5在网页导航性能上几乎翻倍提升。
入选理由:MagenticLite是下一代Magentic-UI,支持浏览器和本地文件系统统一工作流
SocialReasoning-Bench 揭示当前主流 AI 模型在代表用户进行社交推理时,虽能完成任务但常接受次优结果,未能充分维护用户利益。
入选理由:在日程协调中,前沿模型有36%的概率接受低于最优值15%以上的会议时间。
微软研究院提出Intervene框架,通过LLM-based projection将AI代理输出分解为可验证属性,并实时生成形式化规范以确保合规性。
入选理由:Intervene框架使用LLM将AI输出分解为可验证属性,支持Python或Lean的形式化验证
微软研究院发布 Magenta Light,基于小型模型的全栈代理体验。
入选理由:Magenta Light 支持浏览器和本地文件系统协作
GitHub Agentic Workflows 引入 AI 代理自动化软件开发流程,结合 GitHub Actions、Copilot CLI 和安全沙盒,实现端到端自动化。
入选理由:GitHub Agentic Workflows 自动化整个软件开发生命周期
Intervene 是微软研究院开发的实时验证框架,通过自然语言提取可验证属性,提升代理系统可靠性。
入选理由:Intervene 通过自然语言提取可验证属性
微软研究团队利用公开数据构建了覆盖美国48个州的电力传输网络模型,支持AC-OPF分析。
入选理由:构建了覆盖48个州的电力传输网络模型
文章分析了AI技术在不同阶段的经济和社会影响,提出从增强到自动化再到重构的三阶段模型,并强调制度和组织协调是实现深度变革的关键。
入选理由:AI发展分为增强、自动化、重构三个阶段
微软研究院提出测试时验证机制Intervene,通过将AI代理行为转化为可验证属性并自动生成Python验证器,显著提升小模型在复杂任务中的准确性。
入选理由:Intervene机制可将AI代理策略转换为可验证属性,如退款必须回到原支付方式
微软研究团队提出Intervene方法,在Tau Too Bench等基准测试中,小型模型的准确性可媲美前沿模型,通过提取可验证属性并自动生成Python代码进行运行时验证。
入选理由:Intervene方法在Tau Too Bench上取得与前沿模型相当的准确性。
mimalloc作为微软开源的内存分配器,显著提升了现代应用和服务在大规模内存管理中的性能和效率,成为处理十年内增长百倍级内存需求的关键工具。
入选理由:mimalloc在低延迟场景下比glibc malloc快3-5倍,内存碎片减少60%以上
微软研究提出一种新的语言模型微调方法,通过匹配语义而非词元来提升模型效果。
入选理由:新方法通过语义对齐提升模型性能
微软研究引入SkillOpt,将技能文档视为冻结代理的可训练外部状态,而非人工编写,提高了泛化能力。
入选理由:SkillOpt将技能文档视为可训练的外部状态。
微软研究院提出 Intervene 框架,通过 LLM 投影自动分解 agent 输出为可验证属性,并实时生成形式化验证器(Python/Lean),支持运行中干预。
入选理由:Intervene 是微软研究院提出的实时 AI agent 验证框架,支持对部分响应进行即时验证。
微软研究院发现,AI代理虽能完成任务,但难以持续提升用户利益,即使有明确优化指令。
入选理由:在SocialReasoning Bench测试中,AI代理任务执行能力达标但用户利益提升不稳定。
微软研究团队开发了沙盒和多层安全机制,解决代理工作流在GitHub等场景中因外部输入导致的安全接管风险,强调安全设计在AI自动化流程中的核心地位。
入选理由:代理工作流面临通过PR请求、Issue等渠道的对抗性输入攻击风险
将AI视为人类智能的扩展而非替代品,有助于构建更可信的AI系统。
入选理由:AI应被视为人类智能的扩展。
微软研究院联合 GitHub 与 Azure 团队推出开源项目,将 AI 协作代理(Agentic AI)从开发者扩展至市场、销售、运营等非技术人员,实现信息型流程自动化。
入选理由:项目由 Microsoft Research、GitHub Next、GitHub 和 Azure Core 联合开发,已开源。
微软研究发布新工具、模型、仓库和论文,涵盖AI代理、GitHub工作流、验证优先代理等创新。
入选理由:微软研究发布新工具、模型、仓库和论文,涵盖AI代理、GitHub工作流、验证优先代理等创新。
微软研究推出 GridSFM,这是一种小型基础模型,能在毫秒内预测最优电力流动,提升效率并节省成本。
入选理由:GridSFM 提升电网效率
微软研究团队开发的Tyger系统将MRI处理迁移到云端,显著缩短了从原始信号到可读图像的时间。
入选理由:Tyger系统将MRI处理时间从数天缩短至数小时。
微软研究院发布关于AI委托与长期可靠性研究的补充说明,但内容以导航链接为主,缺乏具体技术细节。
入选理由:文章主要为导航页面,未提供具体技术内容。
微软研究院推出基于AI的代码仓库自动化工具,旨在让非开发者也能通过智能代理完成软件开发流程。
入选理由:项目由微软研究院联合GitHub Next、Azure Core共同开发
微软研究院展示了一个用于运行 GitHub 仓库的 AI Agent 系统,强调其在对抗性输入(如恶意 PR/issue)下的安全沙箱防护机制,但内容仅为 15 秒短视频,缺乏技术细节与实证。
入选理由:微软研究院提出 AI Agent 在 GitHub 上运行时需防范对抗性输入(如恶意 PR/issue)。
微软研究院通过推文呼吁关注AI设计中的社会与环境权衡,但未提供技术细节,仅引导至外部视频,信息密度低,缺乏工程实践价值。
入选理由:AI设计需考虑对人和地球的权衡,而不仅是性能指标。
微软研究院推文仅列出四项研究方向,无技术细节、数据或方法,属于低信息密度的宣传公告,不具备工程参考价值。
入选理由:微软研究院推文仅列出四项研究方向,无技术细节、数据或方法,属于低信息密度的宣传公告,不具备工程参考价值
微软研究提出让社区参与AI开发流程可提升AI的公平性与实用性,但该推文仅为口号式宣传,缺乏机制、数据或实践细节。
入选理由:微软研究建议让社区参与AI开发流程以提升AI服务效能,但未提供具体方法或案例。
微软研究院即将发布新成果,包括AI代码管理工具和验证优先的研究方法。
入选理由:微软将发布AI驱动的代码仓库管理工具
这是一则Microsoft Research的YouTube视频发布通知,仅包含标题和页面框架信息,无实质技术内容可供提取。
入选理由:无法提取有效技术信息