AI论文精选
每日论文
◀
08月08日
▶
⏶
154
关于SFT泛化性的研究:一个带有奖励修正的强化学习视角
⏶
116
R-Zero:从零数据中自我演进的推理大型语言模型
⏶
71
Genie Envisioner:一个用于机器人操作的统一世界基础平台
⏶
61
DeepPHY:对具身VLM进行物理推理的基准测试
⏶
29
Hi3DEval:通过分层有效性推进3D生成评估
⏶
25
当今的大型语言模型准备好解释幸福概念了吗?
⏶
24
我们是否在评估文档检索增强生成方面走在正确的道路上?
⏶
18
无需过度思考:R1风格高效大型推理模型综述
⏶
15
Marco-Voice 技术报告
⏶
14
CoAct-1:编码为行动的计算机使用智能体
⏶
11
大型多模态模型能否主动识别错误输入?对其输入审查能力的系统评估框架
⏶
9
MOSEv2:一个用于复杂场景视频对象分割的更具挑战性的数据集
⏶
9
评估、合成和增强客户支持对话
⏶
9
InfiAlign: 一种可扩展且样本高效的框架,用于对齐大型语言模型以增强推理能力
⏶
6
StrandDesigner:通过草图引导实现实用链条生成
⏶
5
用富保真度解码器引导一步扩散模型用于快速图像压缩
⏶
5
学习推理以探究事实性
⏶
4
注意力盆地:为什么上下文定位在大型语言模型中很重要
⏶
3
视觉文档理解与问答:一种支持测试时扩展的多智能体协作框架
⏶
3
轻量级掩码解码:释放多模态大语言模型在指代表达式分割中的潜力
⏶
2
跳跃、略过与过度思考:诊断推理模型在多跳分析中失误的原因
⏶
2
PRvL:量化大型语言模型用于个人身份信息(PII)修订的能力和风险
⏶
2
我思故我在(不胜任)?用于评估大型语言模型招聘评估中语言门槛(shibboleth)检测的基准
⏶
2
I2CR: 多模态实体链接的模内和模间协同反思
⏶
1
REINA: 基于正则化熵信息的损失函数,用于高效的同步语音翻译
⏶
1
RPCANet++:用于稀疏对象分割的深度可解释鲁棒主成分分析
◀ 前一日
后一日 ▶