T
traeai
登录

人物

AK

别名:_akhaliq

技术专家,专注于 GPU 和 AI 加速领域的研究。

相关材料

已收录 18 条与 AK 相关的内容,按评分排序。

SkillOS

Learning Skill Curation for Self-Evolving Agents

paper: https://t.co/C6yKe6Kuou

SkillOS:自演化智能体的技能编排与学习

AK(@_akhaliq)60 字 (约 1 分钟)
78

SkillOS 是一个面向自演化智能体的技能编排系统,通过动态技能库与元学习机制,在复杂任务中实现 34% 的准确率提升。

入选理由:SkillOS 采用动态技能库,支持实时技能增删与更新。

精选推文#AI Agent#技能编排#自演化系统#元学习英文
GPU Forecasters

Language Models as Selective Surrogates for Kernel Runtime Optimization

本文探讨了利用语言模型作为选择性代理进行 GPU 内核运行时优化的新方法,通过预测和选择最优内核配置,显著提升了性能。

入选理由:语言模型被用作选择性代理,预测 GPU 内核的最佳配置。

精选推文#GPU#语言模型#内核优化#运行时性能#AI 加速英文
Seeing Isn't Knowing

Do VLMs Know When Not to Answer Spatial Questions (and Why)?

看见不代表知道:VLMs 在空间问题上的局限性

AK(@_akhaliq)53 字 (约 1 分钟)
75

本文探讨视觉语言模型(VLMs)在处理空间问题时的局限性,指出其在缺乏明确视觉线索时可能错误自信地生成答案,并建议通过引入不确定性机制来提升模型的鲁棒性。

入选理由:VLMs 在缺乏明确视觉线索时,仍可能自信地生成空间问题的答案。

精选推文#VLM#视觉语言模型#空间推理#不确定性#AI 可解释性英文
LongMINT

Evaluating Memory under Multi-Target Interference in Long-Horizon Agent Systems

LongMINT

AK(@_akhaliq)57 字 (约 1 分钟)
75

LongMINT是一个评估长视界智能体系统中多目标干扰下记忆能力的新基准测试框架,通过Twitter上的学术分享引起了关注。该框架专门针对AI代理在长期任务中的记忆干扰问题进行评估,为衡量智能体系统的持续学习和记忆管理能力提供了标准化测试方法。

入选理由:LongMINT是专门评估长视界智能体记忆干扰的新基准测试框架

精选推文#LongMINT#AI智能体#记忆评估#基准测试英文
Mix-Quant

Quantized Prefilling, Precise Decoding for Agentic LLMs

Mix-Quant

AK(@_akhaliq)44 字 (约 1 分钟)
75

Mix-Quant技术通过量化预填充和精确解码的混合策略,显著提升代理LLM的推理效率和精度平衡,为大模型部署提供了新的优化方向。

入选理由:Mix-Quant采用量化预填充和精确解码的混合策略优化LLM性能

精选推文#Mix-Quant#LLM#量化技术#AI推理英文
MulTaBench

Benchmarking Multimodal Tabular Learning with Text and Image

MulTaBench

AK(@_akhaliq)54 字 (约 1 分钟)
75

MulTaBench 是一个多模态表格学习的基准测试。

入选理由:MulTaBench 包含 12 个数据集和 3 种任务类型。

精选推文#多模态学习#表格数据中文
paper: https://t.co/eG6d4D9oEF

AK on X: "paper: https://t.co/eG6d4D9oEF"

AK(@_akhaliq)45 字 (约 1 分钟)
75

文章介绍 MACE-Dance 模型,用于音乐驱动的舞蹈视频生成。

入选理由:MACE-Dance 是一种音乐驱动的舞蹈视频生成模型。

精选推文#AI#视频生成#音乐驱动#深度学习中文
ESI-Bench

Towards Embodied Spatial Intelligence that Closes the Perception-Action Loop

ESI-Bench:迈向具身空间智能与感知-行动闭环

AK(@_akhaliq)60 字 (约 1 分钟)
70

ESI-Bench 是一种新型基准测试,专注于评估具身空间智能模型在感知-行动闭环中的表现,提供比现有测试更具挑战性的场景和指标。

入选理由:ESI-Bench 采用连续 3D 轨迹预测任务,比现有基准更具挑战性

精选推文#具身智能#空间智能#AI基准测试#3D轨迹预测#感知-行动循环英文
Do Enterprise Systems Need Learned World Models? 

The Importance of Context to Infer Dynamics

企业系统是否需要学习世界模型?文章探讨了上下文对推断动态的重要性,强调了在复杂环境中理解背景信息的价值。

入选理由:在企业系统中,上下文对于推断系统的动态行为至关重要。

精选推文#企业系统#世界模型#上下文#动态推断英文
PhyMotion

Structured 3D Motion Reward for Physics-Grounded Human Video Generation

PhyMotion

AK(@_akhaliq)42 字 (约 1 分钟)
65

PhyMotion 提出基于物理的结构化 3D 运动奖励机制,提升人类视频生成的合理性。

入选理由:PhyMotion 引入物理约束以增强视频生成的真实性。

精选推文#人工智能#视频生成英文
A Single Neuron Is Sufficient to Bypass Safety Alignment in Large Language Models

单一神经元足以绕过大型语言模型的安全对齐

AK(@_akhaliq)52 字 (约 1 分钟)
65

研究发现,仅一个神经元即可绕过大型语言模型的安全对齐机制。

入选理由:单个神经元可破坏模型安全对齐

精选推文#AI安全#大模型英文
CausalCine

Real-Time Autoregressive Generation for Multi-Shot Video Narratives

AK 推特:CausalCine 实时自回归生成多镜头视频故事

AK(@_akhaliq)46 字 (约 1 分钟)
65

AK 在推特上分享了一种新的视频叙事生成方法 CausalCine,利用实时自回归生成技术。

入选理由:实时生成多镜头视频故事

精选推文#AI#视频生成#因果推理英文
paper: https://t.co/5HPrTxJGK9

paper: https://t.co/5HPrTxJGK9

AK(@_akhaliq)46 字 (约 1 分钟)
60

文章推荐了一篇关于企业系统是否需要学习世界模型的研究论文,探讨了上下文对推理的重要性。

入选理由:论文《Do Enterprise Systems Need Learned World Models?》探讨了企业系统中学习世界模型的需求。

精选推文#企业系统#世界模型#上下文推理#AI研究#论文英文
paper: https://t.co/4RKN4YbG5a

paper: https://t.co/4RKN4YbG5a

AK(@_akhaliq)44 字 (约 1 分钟)
40

这篇推文仅提供了论文链接而没有具体内容,无法评估LongMINT框架在长时域智能体记忆评估方面的实际价值,信息密度过低。

入选理由:仅有论文标题LongMINT: Evaluating Memory under Multi-Target Interference提示研究方向

精选推文#AI-Agent#Memory-Evaluation#Research中文
paper: https://t.co/4XxBgCVgZG

AK 在 X 上分享了一篇论文

AK(@_akhaliq)52 字 (约 1 分钟)
20

AK 分享了一篇关于 TMAS 的论文,但具体内容未在推文中展示。

入选理由:AK 分享了一篇论文

精选推文#TMAS#论文英文
paper: https://t.co/CZs3kxTfjk

AK在X上的推文:论文链接

AK(@_akhaliq)44 字 (约 1 分钟)
20

该推文仅提供了一篇论文的链接,没有具体内容。

入选理由:推文提供了论文链接

精选推文#论文#X平台中英混合

跨材料问答 · AK

回答基于:AK 相关 18 条材料
    0 / 500

    AI 可能会生成不准确的信息,请核实重要内容