AI论文精选
每日论文
◀
04月13日
▶
⏶
42
FORGE:面向制造场景的细粒度多模态评估
⏶
23
RefineAnything:旨在实现完美局部细节的多模态特定区域精细化
⏶
18
EXAONE 4.5 技术报告
⏶
17
Matrix-Game 3.0:具有长时记忆的实时流式交互式世界模型
⏶
17
WildDet3D:在野外场景下扩展可提示的 3D 检测
⏶
5
ECHO:基于单步块扩散的高效胸部 X 光报告生成
⏶
5
通过多目标对齐的结构化因果视频推理
⏶
4
ELT:用于视觉生成的弹性循环 Transformer
⏶
4
VisionFoundry:利用合成图像教授视觉语言模型(VLM)视觉感知
⏶
0
大语言模型通过一种独特且统一的机制生成有害内容
⏶
0
CT-1:视觉-语言-相机模型将空间推理知识迁移至相机可控的视频生成
⏶
0
说话人面部视频情感编辑中的跨模态情感迁移
◀ 前一日