AI论文精选
每日论文
◀
04月25日
▶
⏶
106
Paper2Code:从机器学习科学论文中自动化生成代码
⏶
88
Step1X-Edit:一个用于通用图像编辑的实用框架
⏶
54
RefVNLI:旨在对主体驱动的文本到图像生成进行可扩展的评估
⏶
38
打破模态壁垒:基于多模态大型语言模型的通用嵌入学习
⏶
29
视觉-语言模型中的视角感知推理:通过心理意象模拟
⏶
24
DiMeR: 解耦网格重建模型
⏶
23
Token-Shuffle:利用自回归模型实现高分辨率图像生成
⏶
20
QuaDMix:用于高效 LLM 预训练的质量-多样性平衡数据选择
⏶
16
处理能思考的奖励模型
⏶
15
3DV-TON:通过扩散模型实现的纹理 3D 引导的一致视频试穿
⏶
14
通过联合图像特征合成提升生成图像建模
⏶
13
DyMU:用于高效 VLM 的动态合并与虚拟解合并
⏶
11
TimeChat-Online:在流视频中 80% 的视觉 Token 天然冗余
⏶
7
IberBench:在伊比利亚语言上的 LLM 评估
⏶
7
ViSMaP:通过元提示实现的无监督长时视频摘要
⏶
5
蒸馏用于自回归图像生成的语义感知序列
⏶
5
动态镜头以及何处寻找
⏶
2
利用高斯加权线性变换的可解释非线性降维