AI论文精选
每日论文
◀
05月08日
▶
⏶
64
统一多模态理解与生成模型:进展、挑战与机遇
⏶
52
ZeroSearch:无需搜索即可激发 LLMs 的搜索能力
⏶
32
HunyuanCustom:一种多模态驱动的定制化视频生成架构
⏶
22
超越识别:评估视觉语言模型中的视觉视角采择
⏶
20
R&B:领域重组与数据混合平衡以实现高效基础模型训练
⏶
19
PrimitiveAnything:基于自回归 Transformer 的人工设计 3D 基本体组合生成
⏶
18
LLMs 的群体智能基准测试
⏶
16
OpenVision: 完全开放、经济高效的用于多模态学习的先进视觉编码器系列
⏶
11
独立于 LLM 的自适应 RAG:让问题自己说话
⏶
10
超越定理证明:形式化问题解决的表述、框架与基准
⏶
8
使用大型语言模型进行知识增强的复杂问题解决:综述
⏶
7
OpenHelix:用于机器人操控的简短综述、实证分析和开源双系统VLA模型
⏶
7
OSUniverse:面向多模态GUI导航AI智能体的评测基准
⏶
6
OmniGIRL:用于 GitHub 问题解决的多语言和多模态基准
⏶
3
AutoLibra:基于开放式反馈的智能体指标归纳
⏶
2
不确定性加权的图像-事件多模态融合用于视频异常检测
⏶
2
RAIL:用于半监督 CBCT 牙齿分割的区域感知指导学习
⏶
2
COSMOS:可预测且经济高效的 LLM 适配
⏶
1
Cognitio Emergens:人机知识共创中的主体性、维度和动态