AI论文精选
每日论文
◀
04月18日
▶
⏶
88
CLIMB: 基于聚类的迭代数据混合自举法用于语言模型预训练
⏶
59
反蒸馏采样
⏶
48
在用于视频生成的下一帧预测模型中打包输入帧上下文
⏶
39
生成,但要验证:通过回顾性重采样减少视觉语言模型中的幻觉
⏶
32
感知编码器:最佳的视觉嵌入并非位于网络的输出
⏶
30
WORLDMEM: 基于记忆的长期一致世界模拟
⏶
28
70% 大小,100% 准确率:通过动态长度浮点数实现高效 GPU 推理的无损 LLM 压缩
⏶
27
小型LLM在数据合成中的战略协调框架与大型LLM相匹配
⏶
21
VistaDPO: 用于大型视频模型的视频分层时空直接偏好优化
⏶
21
ChartQAPro: 一个更多样化和更具挑战性的图表问答基准
⏶
19
DMM: 通过基于蒸馏的模型合并构建通用的图像生成模型
⏶
19
NoisyRollout:通过数据增强强化视觉推理
⏶
17
InstantCharacter:使用可扩展的扩散 Transformer 框架个性化任何角色
⏶
17
PerceptionLM:用于详细视觉理解的开放访问数据和模型
⏶
15
睡眠时间计算:超越测试时推理扩展
⏶
11
探索专家失败可以改进LLM代理调优
⏶
11
CCMNet: 利用校准的色彩校正矩阵实现跨摄像头 色彩恒常性
⏶
9
FocusedAD: 以角色为中心的电影音频描述
⏶
8
Complex-Edit:用于复杂度可控图像编辑基准的 CoT 风格指令生成
⏶
7
使用冲突证据的检索增强生成
⏶
4
纠正你:自动引导去噪轨迹以避开不需要的概念
⏶
4
MetaSynth:元提示驱动的智能体支架,用于多样化合成数据生成
⏶
4
学习抗遮挡的视觉 Transformer 用于实时无人机跟踪