AI论文精选
每日论文
◀
11月05日
▶
⏶
65
不要蒙蔽你的VLA:对齐视觉表征以实现OOD泛化
⏶
61
VCode:一个以 SVG 作为符号化视觉表示的多模态编码基准
⏶
39
当可视化是推理的第一步:MIRA,一个视觉思维链基准
⏶
19
当模态冲突时:单模态推理的不确定性如何支配多模态大模型的偏好动态
⏶
9
协作鸿沟
⏶
8
Brain-IT:通过脑交互 Transformer 从 fMRI 重建图像
⏶
6
视觉输入可以被压缩吗?一个针对大型多模态模型的视觉令牌压缩基准
⏶
6
LTD-Bench:通过让大型语言模型绘画来评估它们
⏶
6
更短但非更差:在数学 RLVR 中通过简单样本作为长度正则化器实现节俭推理
⏶
4
CodeClash: 目标导向软件工程基准测试
⏶
3
TWIST2:可扩展、便携且全面的人形机器人数据收集系统
⏶
3
iFlyBot-VLA 技术报告
⏶
2
BRAINS:一个用于阿尔茨海默病检测和监测的检索增强系统
⏶
2
ChartM^3:一个多阶段代码驱动的流水线,用于在图表理解中构建多维多步的视觉推理数据
⏶
2
RoboChallenge:具身策略的大规模真实机器人评估
⏶
1
D2D:检测器到可微分评判器,用于改善文生图中的计算能力
⏶
1
VidEmo:用于以情感为中心的视频基础模型的情感树推理
⏶
1
TabDSR: 复杂表格数据数值推理的分解、清洗和推理方法
⏶
0
LiveSecBench:一个面向中文语境下大语言模型的动态且文化相关的 AI 安全基准
⏶
0
有区别地处理运动分量,促进联合深度和自我运动学习的发展
⏶
0
Reg-DPO:使用GT-Pair进行SFT正则化直接偏好优化以改进视频生成
⏶
0
RiddleBench:一个用于大型语言模型的新型生成推理基准
⏶
0
AyurParam:一个用于阿育吠陀的先进双语语言模型
◀ 前一日