AI论文精选
每日论文
◀
06月03日
▶
⏶
131
超越二八法则:高熵少数词元驱动LLM推理中的有效强化学习
⏶
75
SmolVLA:一种经济高效的机器人视觉-语言-动作模型
⏶
59
REASONING GYM:推理环境,用于具备可验证奖励的强化学习
⏶
36
驯服LLM:通过梯度分组缩放学习率
⏶
35
视频扩散模型的时序上下文微调:实现通用控制
⏶
31
SRPO:通过反思感知强化学习增强多模态大语言模型推理
⏶
28
ARIA:通过意图驱动奖励聚合训练语言智能体
⏶
28
ShapeLLM-Omni:用于3D生成与理解的原生多模态LLM
⏶
28
LoHoVLA:用于长周期具身任务的统一视觉-语言-动作模型
⏶
25
Jigsaw-R1:基于拼图的规则化视觉强化学习研究
⏶
24
学习用于机器人操作的视频生成与协同轨迹控制
⏶
21
AReaL:一个用于语言推理的大规模异步强化学习系统
⏶
21
EarthMind:面向多粒度与多传感器地球观测,结合大型多模态模型
⏶
17
统一压缩表示的标度律
⏶
15
激励大型语言模型实现高级指令遵循的推理
⏶
15
MiCRo:用于个性化偏好学习的混合建模与上下文感知路由
⏶
13
从 Token 到行动:通过状态机推理缓解信息检索中的过度思考
⏶
13
IVY-FAKE:一个用于图像和视频 AIGC 检测的统一可解释框架和基准
⏶
11
像经济学家一样推理:对经济问题进行后训练可诱导大型语言模型 (LLMs) 产生战略性泛化
⏶
11
Cora:使用少量步骤扩散的对应感知图像编辑
⏶
10
WebChoreArena:在现实繁琐的网页任务上评估网页浏览代理
⏶
9
VisualSphinx:用于强化学习 (RL) 的大规模合成视觉逻辑谜题
⏶
8
DyePack:利用后门可验证地标记LLM测试集污染
⏶
8
从视频中学习3D世界:利用3D视觉几何先验增强MLLM
⏶
8
OWSM v4:通过数据扩增和清洗改进开放式 Whisper 风格语音模型
⏶
8
CodeV-R1:推理增强的 Verilog 代码生成
⏶
8
归一化注意力引导:扩散模型的通用负向引导
⏶
8
压力测试机器生成文本检测:改变语言模型写作风格以欺骗检测器
⏶
8
达尔文-哥德尔机器:自我改进智能体的开放式演化
⏶
7
zip2zip:通过词元压缩为语言模型实现推理时自适应词汇表
⏶
7
神秘的语言模型
⏶
6
VAU-R1:通过强化微调提升视频异常理解
⏶
6
何时行动,何时等待:在任务型对话中对意图可触发性的结构轨迹进行建模
⏶
6
语言模型中从注入到蒸馏的级联对抗性偏差
⏶
5
SATA-BENCH:多项选择题的“选择所有适用项”基准
⏶
5
任意步长:一种用于预算迭代训练的统一学习率调度
⏶
5
Pro3D-Editor:一种用于一致且精确3D编辑的渐进式视图视角
⏶
5
循环中的LLM:创建用于仇恨言论净化的PARADEHATE数据集
⏶
4
ComposeAnything:用于文本到图像生成的复合对象先验
⏶
4
从指导方针到实践:阿拉伯语语言模型评估的新范式
⏶
4
OmniResponse:两人交互中的在线多模态对话响应生成
⏶
4
RARE:面向检索增强生成系统的检索感知鲁棒性评估
⏶
3
再思考!测试时计算对大型语言模型偏好、观点和信念的影响
⏶
3
评估语言模型预测器时的陷阱
⏶
3
MaskSearch:一个通用预训练框架以增强智能体搜索能力
⏶
3
SenseFlow: 扩展分布匹配以实现基于流的文本到图像蒸馏
⏶
3
弗兰肯文本:将随机文本片段缝合为长篇叙事
⏶
3
编程概念和神经元如何在代码语言模型中共享
⏶
3
SealQA:提高搜索增强语言模型的推理能力标准
⏶
2
MagiCodec:用于高保真重构和生成的简单掩码高斯注入编解码器
⏶
2
利用双语翻译数据对大型语言模型进行大规模多语言适配
⏶
2
揭开真相的面纱:降秩后涌现主权重,用于推理导向的监督微调
⏶
2
MIKU-PAL:一种自动化和标准化的语音语副语言和情感标注多模态方法
⏶
2
CityLens:用于城市社会经济感知的大型语言-视觉模型基准测试
⏶
2
使VLM助手与个性化情境认知对齐
⏶
2
R1-代码解释器:通过监督学习和强化学习训练大型语言模型进行代码推理
⏶
2
Neuro2Semantic:一个用于从人类颅内脑电图重建连续语言语义的迁移学习框架
⏶
2
BinauralFlow:一种基于流匹配模型的高质量双耳语音合成因果可流式方法
⏶
2
像素对比先验:通过视觉反事实控制视觉-语言模型中的知识先验
⏶
2
规划与预算:大语言模型推理中有效且高效的推理时伸缩
⏶
1
结合置信度边界加权伪标签的Shuffle PatchMix增强,用于增强无源域适应
⏶
0
利用多模态扩散模型合成离散-连续量子电路