AI论文精选
每日论文
◀
01月23日
▶
⏶
66
EvoCUA:通过可扩展合成经验学习进化计算机使用智能体
⏶
57
HERMES:将 KV 缓存作为分层存储用于高效流式视频理解
⏶
55
灵活性陷阱:为什么任意顺序会限制扩散语言模型的推理潜力
⏶
52
沙盒中的大语言模型(LLM-in-Sandbox)激发通用智能体能力
⏶
51
BayesianVLA:通过潜动作查询对视觉-语言-动作模型进行贝叶斯分解
⏶
43
使用表示自编码器扩展文本到图像扩散 Transformer
⏶
43
Stable-DiffCoder:推动代码扩散大语言模型的边界
⏶
33
SAMTok:用两个词表示任意掩码
⏶
28
在测试时学习发现
⏶
24
Qwen3-TTS 技术报告
⏶
20
Terminal-Bench:在命令行界面中评估处理困难且真实任务的智能体
⏶
14
OpenVision 3:一个兼顾理解与生成的统一视觉编码器系列
⏶
13
重新思考组合图像检索评估:一个来自图像编辑的细粒度基准测试
⏶
13
大模型时代下的自动化内核生成研究
⏶
10
PROGRESSLM:迈向视觉语言模型中的进度推理
⏶
9
Cosmos Policy:微调视频模型以进行视觉运动控制和规划
⏶
9
VideoMaMa:通过生成式先验进行的掩码引导视频抠图
⏶
7
ActionMesh:利用时空 3D 扩散生成动画 3D 网格
⏶
6
360Anything:将图像和视频无几何提升至 360°
⏶
4
VIOLA:以极少标注实现视频上下文学习
⏶
3
智能体不确定性量化
⏶
2
智能体置信度校准
⏶
2
从被动指标到主动信号:大语言模型中不确定性量化角色的演变
⏶
1
面向教育应用的 LLM 提示词评估
⏶
1
Numba 加速的二维扩散限制聚集:实现与分形特征描述
⏶
1
MirrorBench:一个评估用户代理(User-Proxy)拟人性的可扩展框架
⏶
0
作为电路的维格纳之友:超导量子硬件上的跨分支通信见证基准
◀ 前一日