人物

AK

Q: AK 最近有什么新动态？

traeai 已收录 30 篇与 AK 相关的内容。最新一篇是「SpenseGPT Practical One-shot Pruning Enabling Sparse and Dense GEMMs for LLM Inference」，由 AK(@_akhaliq) 发布。

别名：@_akhaliq

推文发布者，VideoChat3的研究团队

已跟踪 30 条高相关材料

TraeAI 观察

如果只读 3 篇

SpenseGPT Practical One-shot Pruning Enabling Sparse and Dense GEMMs for LLM Inference

AK(@_akhaliq) · 8.5 分

SpenseGPT 提出了一种实用的单次剪枝方法，优化了大语言模型推理中的稀疏和密集 GEMM 计算。

Seeing Isn't Knowing Do VLMs Know When Not to Answer Spatial Questions (and Why)?

AK(@_akhaliq) · 7.5 分

本文探讨视觉语言模型（VLMs）在面对空间问题时的局限性，指出其在缺乏明确视觉线索时可能错误自信地生成答案，并建议通过引入不确定性机制来提升模型的鲁棒性。

GPU Forecasters Language Models as Selective Surrogates for Kernel Runtime Optimization

AK(@_akhaliq) · 7.5 分

本文探讨了利用语言模型作为选择性代理进行 GPU 内核运行时优化的新方法，通过预测和选择最优内核配置，显著提升了性能。

SpenseGPT Practical One-shot Pruning Enabling Sparse and Dense GEMMs for LLM Inference

AK(@_akhaliq)6月16日50 字 (约 1 分钟)

SpenseGPT 提出了一种实用的单次剪枝方法，优化了大语言模型推理中的稀疏和密集 GEMM 计算。

入选理由：SpenseGPT 通过单次剪枝实现稀疏和密集 GEMM 的优化。

精选推文#SpenseGPT#LLM#GEMM#剪枝#AI英文

GPU Forecasters

Language Models as Selective Surrogates for Kernel Runtime Optimization

GPU 预测器：语言模型作为内核运行时优化的选择性代理

AK(@_akhaliq)6月2日64 字 (约 1 分钟)

本文探讨了利用语言模型作为选择性代理进行 GPU 内核运行时优化的新方法，通过预测和选择最优内核配置，显著提升了性能。

入选理由：语言模型被用作选择性代理，预测 GPU 内核的最佳配置。

精选推文#GPU#语言模型#内核优化#运行时性能#AI 加速英文

Seeing Isn't Knowing

Do VLMs Know When Not to Answer Spatial Questions (and Why)?

看见不代表知道：VLMs 在空间问题上的局限性

AK(@_akhaliq)6月2日53 字 (约 1 分钟)

本文探讨视觉语言模型（VLMs）在处理空间问题时的局限性，指出其在缺乏明确视觉线索时可能错误自信地生成答案，并建议通过引入不确定性机制来提升模型的鲁棒性。

入选理由：VLMs 在缺乏明确视觉线索时，仍可能自信地生成空间问题的答案。

精选推文#VLM#视觉语言模型#空间推理#不确定性#AI 可解释性英文

LongMINT

AK(@_akhaliq)5月22日57 字 (约 1 分钟)

LongMINT是一个评估长视界智能体系统中多目标干扰下记忆能力的新基准测试框架，通过Twitter上的学术分享引起了关注。该框架专门针对AI代理在长期任务中的记忆干扰问题进行评估，为衡量智能体系统的持续学习和记忆管理能力提供了标准化测试方法。

入选理由：LongMINT是专门评估长视界智能体记忆干扰的新基准测试框架

精选推文#LongMINT#AI智能体#记忆评估#基准测试英文

Mix-Quant

AK(@_akhaliq)5月22日44 字 (约 1 分钟)

Mix-Quant技术通过量化预填充和精确解码的混合策略，显著提升代理LLM的推理效率和精度平衡，为大模型部署提供了新的优化方向。

入选理由：Mix-Quant采用量化预填充和精确解码的混合策略优化LLM性能

精选推文#Mix-Quant#LLM#量化技术#AI推理英文

MulTaBench

AK(@_akhaliq)5月15日54 字 (约 1 分钟)

MulTaBench 是一个多模态表格学习的基准测试。

入选理由：MulTaBench 包含 12 个数据集和 3 种任务类型。

精选推文#多模态学习#表格数据中文

ESI-Bench

Towards Embodied Spatial Intelligence that Closes the Perception-Action Loop

ESI-Bench：迈向具身空间智能与感知-行动闭环

AK(@_akhaliq)5月21日60 字 (约 1 分钟)

ESI-Bench 是一种新型基准测试，专注于评估具身空间智能模型在感知-行动闭环中的表现，提供比现有测试更具挑战性的场景和指标。

入选理由：ESI-Bench 采用连续 3D 轨迹预测任务，比现有基准更具挑战性

精选推文#具身智能#空间智能#AI基准测试#3D轨迹预测#感知-行动循环英文

PhyMotion

AK(@_akhaliq)5月18日42 字 (约 1 分钟)

PhyMotion 提出基于物理的结构化 3D 运动奖励机制，提升人类视频生成的合理性。

入选理由：PhyMotion 引入物理约束以增强视频生成的真实性。

精选推文#人工智能#视频生成英文

A Single Neuron Is Sufficient to Bypass Safety Alignment in Large Language Models

单一神经元足以绕过大型语言模型的安全对齐

AK(@_akhaliq)5月15日52 字 (约 1 分钟)

研究发现，仅一个神经元即可绕过大型语言模型的安全对齐机制。

入选理由：单个神经元可破坏模型安全对齐

精选推文#AI安全#大模型英文

CausalCine

Real-Time Autoregressive Generation for Multi-Shot Video Narratives

AK 推特：CausalCine 实时自回归生成多镜头视频故事

AK(@_akhaliq)5月14日46 字 (约 1 分钟)

AK 在推特上分享了一种新的视频叙事生成方法 CausalCine，利用实时自回归生成技术。

入选理由：实时生成多镜头视频故事

精选推文#AI#视频生成#因果推理英文

VideoChat3 Fully Open Video MLLM for Efficient and Generalist Video Understanding

AK(@_akhaliq)7月19日48 字 (约 1 分钟)

VideoChat3是首个全开放的视频多模态大模型，支持高效通用视频理解，但技术细节披露有限。

入选理由：VideoChat3是首个全开放的视频MLLM，支持高效视频理解

精选推文#VideoChat3#MLLM#视频理解#开源英文

ViQ Text-Aligned Visual Quantized Representations at Any Resolution

AK(@_akhaliq)6月27日54 字 (约 1 分钟)

ViQ 是一种文本对齐的视觉量化表示方法，可在任意分辨率下使用。

入选理由：ViQ 支持任意分辨率的视觉量化表示。

精选推文#ViQ#视觉量化#文本对齐#AI英文

Confidence-Aware Tool Orchestration for Robust Video Understanding

AK(@_akhaliq)6月27日51 字 (约 1 分钟)

本文提出了一种基于置信度的工具编排方法，用于提升视频理解的鲁棒性，但内容较为简略，缺乏具体实现细节。

入选理由：置信度感知的工具编排方法可提升视频理解的鲁棒性。

精选推文#视频理解#工具编排#AI英文

LoopCoder-v2 Only Loop Once for Efficient Test-Time Computation Scaling

AK(@_akhaliq)6月18日67 字 (约 1 分钟)

LoopCoder-v2 是一种优化测试时计算效率的方法，通过减少循环次数提升性能。

入选理由：LoopCoder-v2 通过减少循环次数来提高测试时的计算效率。

精选推文#LoopCoder-v2#计算优化#测试效率英文

paper: https://t.co/NluxzaDkCS

AK(@_akhaliq)6月18日43 字 (约 1 分钟)

文章分享了一篇关于LoopCoder-v2的论文，旨在提高测试时计算效率。

入选理由：LoopCoder-v2通过仅循环一次来提高测试时计算效率。

精选推文#LoopCoder-v2#Hugging Face#AI#论文中英混合

World Tracing Generative Pixel-Aligned Geometry Beyond the Visible

AK(@_akhaliq)6月17日65 字 (约 1 分钟)

World Tracing 是一种生成像素对齐几何的新技术，但文章内容信息密度低，缺乏具体机制和实用价值。

入选理由：World Tracing 是一种生成像素对齐几何的新技术。

精选推文#AI#计算机视觉#生成模型英文

μ_0 A Scalable 3D Interaction-Trace World Model

AK(@_akhaliq)6月17日62 字 (约 1 分钟)

文章介绍了一种可扩展的3D交互轨迹世界模型μ_0，但内容信息密度低，缺乏具体技术细节和实用价值。

入选理由：文章提出了一种名为μ_0的3D交互轨迹世界模型。

精选推文#3D模型#AI#世界模型英文

CHORUS Decentralized Multi-Embodiment Collaboration with One VLA Policy

AK(@_akhaliq)6月16日65 字 (约 1 分钟)

CHORUS 是一种基于单一 VLA 策略的去中心化多实体协作方法，但文章内容信息密度低，缺乏具体机制和实践细节。

入选理由：CHORUS 采用单一 VLA 策略实现多实体协作。

精选推文#AI#协作#VLA#去中心化英文

paper: https://t.co/aID0K3TdFx

AK(@_akhaliq)6月16日45 字 (约 1 分钟)

文章分享了一篇关于SpenseGPT的论文，探讨了一种名为SpenseGPT的模型，旨在通过稀疏和密集GEMMs实现大语言模型的高效推理。

入选理由：SpenseGPT是一种通过稀疏和密集GEMMs实现高效推理的模型。

精选推文#SpenseGPT#LLM#GEMMs#Hugging Face英文

On the Geometry of On-Policy Distillation

AK(@_akhaliq)6月10日51 字 (约 1 分钟)

文章探讨了On-Policy Distillation的几何特性，但信息密度较低，缺乏具体实践指导。

入选理由：文章讨论了On-Policy Distillation的几何特性。

精选推文#On-Policy Distillation#机器学习#几何特性英文

Latent Spatial Memory for Video World Models

AK(@_akhaliq)6月10日55 字 (约 1 分钟)

文章介绍了一种用于视频世界模型的潜在空间记忆方法，但信息密度较低，缺乏具体机制和实践指导。

入选理由：潜在空间记忆方法被提出用于视频世界模型。

精选推文#视频世界模型#潜在空间记忆#AI研究英文

DanceOPD On-Policy Generative Field Distillation

AK(@_akhaliq)6月27日49 字 (约 1 分钟)

文章介绍了一种名为DanceOPD的新方法，旨在通过On-Policy Generative Field Distillation提升强化学习的训练效率。

入选理由：DanceOPD是一种基于On-Policy Generative Field Distillation的强化学习方法。

精选推文#强化学习#AI#机器学习英文

DomainShuttle Freeform Open Domain Subject-driven Text-to-video Generation

AK(@_akhaliq)6月25日60 字 (约 1 分钟)

文章介绍了一种名为 DomainShuttle 的文本到视频生成技术，但缺乏具体机制和深度分析。

入选理由：DomainShuttle 是一种文本到视频生成技术。

精选推文#AI#视频生成#文本到视频英文

Wan-Streamer v0.1 End-to-end Real-time Interactive Foundation Models

AK(@_akhaliq)6月25日67 字 (约 1 分钟)

Wan-Streamer v0.1 是一个端到端的实时交互式基础模型，但文章内容缺乏具体技术细节和实用信息。

入选理由：文章标题提到 Wan-Streamer v0.1 是一个端到端的实时交互式基础模型。

精选推文#AI#模型#实时交互英文

https://t.co/Paq8smSRQ9

AK(@_akhaliq)6月24日32 字 (约 1 分钟)

文章内容信息密度低，缺乏技术深度和实用价值，主要为社交媒体上的链接分享。

入选理由：文章未提供具体技术细节或实用建议。

精选推文#社交媒体#链接分享中英混合

Freeing the Law with LOCUS A Local Ordinance Corpus for the United States

AK(@_akhaliq)6月20日49 字 (约 1 分钟)

本文介绍了一个名为LOCUS的美国地方法规语料库，旨在通过开放数据促进法律研究和应用。

入选理由：LOCUS是一个包含美国地方法规的开放语料库。

精选推文#法律#数据#AI#语料库英文

Data Journalist Agent Transforming Data into Verifiable Multimodal Stories

AK(@_akhaliq)6月17日65 字 (约 1 分钟)

文章内容信息密度低，缺乏具体技术细节和实用价值，仅提供了一个视频链接和社交媒体帖子。

入选理由：文章未提供具体技术内容或实用信息。

精选推文#社交媒体#数据可视化英文

paper: https://t.co/eKMJ0aMvYj

AK(@_akhaliq)6月16日35 字 (约 1 分钟)

文章内容为推文形式，未提供具体技术细节或深度分析，信息密度低。

入选理由：文章未提供具体技术内容，仅包含论文链接和推文信息。

精选推文#论文#AI英文

paper: https://t.co/4RKN4YbG5a

AK(@_akhaliq)5月22日44 字 (约 1 分钟)

这篇推文仅提供了论文链接而没有具体内容，无法评估LongMINT框架在长时域智能体记忆评估方面的实际价值，信息密度过低。

入选理由：仅有论文标题LongMINT: Evaluating Memory under Multi-Target Interference提示研究方向

精选推文#AI-Agent#Memory-Evaluation#Research中文

hf-claude works well with glm 5.2 hf extensions install hf-claude

AK(@_akhaliq)6月24日49 字 (约 1 分钟)

该推文内容信息密度低，未提供具体技术细节或实用价值。

入选理由：推文未提供具体技术细节

精选推文#hf-claude#glm 5.2#技术兼容性英文

跨材料问答 · AK

回答基于：AK 相关 30 条材料