AI论文精选
每日论文
◀
06月23日
▶
⏶
118
拖放式LLM:零样本提示到权重
⏶
85
视觉引导分块:您所需要的一切——通过多模态文档理解增强 RAG
⏶
58
PAROAttention:视觉生成模型中高效稀疏和量化注意力的模式感知重排序
⏶
52
Hunyuan-GameCraft:具有混合历史条件的高动态交互式游戏视频生成
⏶
34
VIKI-R:通过强化学习协调具身多智能体协作
⏶
27
机器心智意象:通过潜在视觉令牌赋能多模态推理
⏶
23
Hunyuan3D 2.5:迈向具有极致细节的高保真3D资产生成
⏶
23
优化多语种文本转语音(带口音与情感)
⏶
21
DreamCube:通过多平面同步生成3D全景图
⏶
13
InfiniPot-V:用于流媒体视频理解的内存受限 KV 缓存压缩
⏶
12
混元3D 2.1:从图像到具有生产级 PBR 材质的高保真3D资产
⏶
10
UniFork:探索模态对齐以实现统一的多模态理解和生成
⏶
8
从意图到执行:探究视觉-语言-动作模型的泛化边界
⏶
4
基于重排的生成用于无偏视角摘要
⏶
4
通过交错自回归运动和场景生成进行长期交通模拟
⏶
4
MEXA:迈向通用多模态推理,基于动态多专家聚合
⏶
3
自回归图像生成水印
⏶
1
通过紧凑表示下一词元分布改进语言模型反演
← 前一日
后一日 →