AI论文精选
每日论文
◀
03月13日
▶
⏶
69
Spatial-TTT:通过测试时训练实现的流式视觉空间智能
⏶
49
策略性导航还是随机搜索?智能体与人类如何在文档集合中进行推理
⏶
36
IndexCache:通过跨层索引复用加速稀疏注意力
⏶
34
面向计算机操作智能体的视频奖励建模
⏶
28
ShotVerse:推进文本驱动多镜头视频生成的电影级摄影机控制
⏶
26
DreamVideo-Omni:利用潜空间身份强化学习实现全运动控制的多主体视频定制
⏶
22
Trust Your Critic:面向忠实图像编辑与生成的鲁棒奖励建模与强化学习
⏶
20
XSkill:多模态智能体中基于经验与技能的持续学习
⏶
18
DVD:基于生成先验的确定性视频深度估计
⏶
15
WeEdit:一个以文本为中心的图像编辑数据集、基准测试及字形引导框架
⏶
14
GRADE:图像编辑中基于学科知识推理的基准测试
⏶
13
一个模型,多种预算:用于扩散 Transformer 的弹性潜空间接口
⏶
12
CREATE:测试大语言模型的联想创造力
⏶
10
EVATok:用于高效视觉自回归生成的自适应长度视频分词
⏶
10
RubiCap:基于评分量表指导的强化学习在密集图像描述中的应用
⏶
9
OmniStream:精通连续流中的感知、重建与行动
⏶
9
EndoCoT:在扩散模型中扩展内源性思维链推理
⏶
7
Mobile-GS:面向移动设备的实时高斯溅射
⏶
6
视频推理模型准备好走向户外了吗?
⏶
6
通过重建来理解:为 LLM 预训练逆向软件开发过程
⏶
6
FP4 量化 LLM 训练中均值偏差的诅咒与福音
⏶
6
基于自我反思的元强化学习在智能体搜索中的应用
⏶
5
Accent Vector:无需口音数据即可实现多语言 TTS 的可控口音操纵
⏶
4
DIVE:在智能体任务合成中扩展多样性以实现通用工具使用
⏶
4
在不可验证的 LLM 后训练中检验“推理 LLM 作为裁判”的效果
⏶
4
高性能强化学习环境的自动生成
⏶
4
通过加权 h-变换采样实现粗略引导的视觉生成
⏶
4
Tiny Aya:桥接规模与多语言深度
⏶
4
FireRedASR2S:最先进的工业级一体化自动语音识别系统
⏶
4
用于扩散模型的几何自编码器
⏶
4
PACED:处于学生能力前沿的知识蒸馏
⏶
4
通过神经元细胞自动机训练语言模型
⏶
3
SoundWeaver:文本转音频扩散推理服务的语义预热
⏶
3
用于增强多模态 LLM 裁判的多任务强化学习
⏶
3
神经丛(Neural Thickets):多元任务专家密集分布在预训练权重周围
⏶
2
TeamHOI:学习适用于任意团队规模的协作式人机交互统一策略
⏶
2
EmbTracker:联邦语言模型的可追踪黑盒水印
⏶
2
NerVE:LLM 前馈网络中的非线性特征谱动力学
⏶
2
Softmax Transformer 中注意力汇点(Attention Sinks)的必然性:来自触发条件任务的证据
⏶
2
简单方案奏效:视觉-语言-动作模型是结合强化学习的天然持续学习者
⏶
2
神经场热层析成像:一种用于无损检测的可微分物理框架
⏶
2
SurvHTE-Bench:生存分析中异质治疗效应评估的基准测试
⏶
2
Dr. SHAP-AV:通过 Shapley 归因解析视听语音识别中不同模态的相对贡献
⏶
1
混合配方使 DINO 成为全能视觉编码器
⏶
1
WaDi:用于单步图像合成的权重方向感知蒸馏
⏶
0
4DEquine:从单目视频中解耦运动与外观以进行四维马类重建
⏶
0
HyPER-GAN:用于实时照片级逼真度增强的混合分块图像到图像翻译
⏶
0
苏拉威西岛印尼摩罗瓦里工业园镍加工扩张导致近岸海水透明度下降的因果归因研究
◀ 前一日