AI论文精选
每日论文
◀
06月17日
▶
⏶
248
MiniMax-M1:利用Lightning Attention高效扩展测试时计算
⏶
65
科学家的第一次考试:通过感知、理解和推理探测MLLM的认知能力
⏶
60
DeepResearch Bench:一个用于深度研究智能体的综合基准
⏶
47
DoTA-RAG:思想聚合RAG的动态化
⏶
46
等等,我们不需要“等待”!移除思考Token提高了推理效率
⏶
46
结合自回归 Transformer 和扩散模型与多引用自回归
⏶
42
Ego-R1:用于超长第一人称视频推理的工具思维链
⏶
41
离散扩散在大型语言和多模态模型中:一篇综述
⏶
39
Essential-Web v1.0:24万亿token的组织化网络数据
⏶
31
TaskCraft:自动生成代理任务
⏶
28
AR-RAG: 图像生成中的自回归检索增强
⏶
26
Test3R:学习在测试时重建三维
⏶
23
AceReason-Nemotron 1.1:SFT与RL协同赋能数学与代码推理
⏶
20
PersonaFeedback:一个大规模人工标注的个性化基准
⏶
19
VGR:视觉基础推理
⏶
16
多语言大型语言模型中的语言手术
⏶
15
从真实到合成:利用带有属性的对齐合成数百万条多样化且复杂的用户指令
⏶
12
BridgeVLA:用于视觉-语言模型中高效三维操作学习的输入-输出对齐
⏶
10
AI智能体行为科学
⏶
9
关于小型推理语言模型的技术探讨
⏶
8
可证明地从语言反馈中学习
⏶
7
ALE-Bench:一个用于长周期目标驱动算法工程的基准
⏶
5
Supernova Event Dataset:通过关键事件分析解释大型语言模型的个性
⏶
5
LETS 预测:学习时间序列预测的嵌入学
⏶
5
SeqPE:带有序列位置编码的 Transformer
⏶
4
使用预算指导引导LLM思考
⏶
4
SRLAgent:通过游戏化和 LLM 辅助增强自我调节学习技能
⏶
4
将领域知识融入材料标记化
⏶
3
利用LLM通过基于块的提示和分解进行时间序列预测
⏶
3
MS4UI:一个用于用户界面教学视频多模态摘要的数据集
⏶
3
QGuard:基于问题的多模态 LLM 安全零样本防护
⏶
3
使用大型语言模型和人类专家事实核查方法对新闻媒体进行真实性和偏见分析
⏶
3
自我隐私:你的第一视角相机暴露了你什么?
⏶
3
DiffusionBlocks:通过基于分数的扩散进行生成模型的块级训练
⏶
3
Infini-gram mini:使用FM-索引在互联网规模下进行精确的n-gram搜索
⏶
2
BOW:瓶颈式后续词探索
⏶
1
AI辅助的摘要和结论分析:标记未经证实的主张和模糊的代词
⏶
1
基于图像的不确定性感知剩余寿命预测
⏶
1
仇恨演变:静态基准测试未能告诉我们什么
⏶
1
使用 MIDI-RWKV 实现可个性化的长上下文符号音乐填充
← 前一日
后一日 →