每日论文

MiniMax-M1：利用Lightning Attention高效扩展测试时计算

MiniMax-M1：利用Lightning Attention高效扩展测试时计算

科学家的第一次考试：通过感知、理解和推理探测MLLM的认知能力

科学家的第一次考试：通过感知、理解和推理探测MLLM的认知能力

DeepResearch Bench：一个用于深度研究智能体的综合基准

DeepResearch Bench：一个用于深度研究智能体的综合基准

DoTA-RAG：思想聚合RAG的动态化

DoTA-RAG：思想聚合RAG的动态化

等等，我们不需要“等待”！移除思考Token提高了推理效率

等等，我们不需要“等待”！移除思考Token提高了推理效率

结合自回归 Transformer 和扩散模型与多引用自回归

结合自回归 Transformer 和扩散模型与多引用自回归

Ego-R1：用于超长第一人称视频推理的工具思维链

Ego-R1：用于超长第一人称视频推理的工具思维链

离散扩散在大型语言和多模态模型中：一篇综述

离散扩散在大型语言和多模态模型中：一篇综述

Essential-Web v1.0：24万亿token的组织化网络数据

Essential-Web v1.0：24万亿token的组织化网络数据

TaskCraft：自动生成代理任务

TaskCraft：自动生成代理任务

AR-RAG: 图像生成中的自回归检索增强

AR-RAG: 图像生成中的自回归检索增强

Test3R：学习在测试时重建三维

AceReason-Nemotron 1.1：SFT与RL协同赋能数学与代码推理

AceReason-Nemotron 1.1：SFT与RL协同赋能数学与代码推理

PersonaFeedback：一个大规模人工标注的个性化基准

PersonaFeedback：一个大规模人工标注的个性化基准

VGR：视觉基础推理

多语言大型语言模型中的语言手术

多语言大型语言模型中的语言手术

从真实到合成：利用带有属性的对齐合成数百万条多样化且复杂的用户指令

从真实到合成：利用带有属性的对齐合成数百万条多样化且复杂的用户指令

BridgeVLA：用于视觉-语言模型中高效三维操作学习的输入-输出对齐

AI智能体行为科学

AI智能体行为科学

关于小型推理语言模型的技术探讨

关于小型推理语言模型的技术探讨

可证明地从语言反馈中学习

可证明地从语言反馈中学习

ALE-Bench：一个用于长周期目标驱动算法工程的基准

ALE-Bench：一个用于长周期目标驱动算法工程的基准

Supernova Event Dataset：通过关键事件分析解释大型语言模型的个性

Supernova Event Dataset：通过关键事件分析解释大型语言模型的个性

LETS 预测：学习时间序列预测的嵌入学

LETS 预测：学习时间序列预测的嵌入学

SeqPE：带有序列位置编码的 Transformer

SeqPE：带有序列位置编码的 Transformer

使用预算指导引导LLM思考

SRLAgent：通过游戏化和 LLM 辅助增强自我调节学习技能

SRLAgent：通过游戏化和 LLM 辅助增强自我调节学习技能

将领域知识融入材料标记化

利用LLM通过基于块的提示和分解进行时间序列预测

利用LLM通过基于块的提示和分解进行时间序列预测

MS4UI：一个用于用户界面教学视频多模态摘要的数据集

MS4UI：一个用于用户界面教学视频多模态摘要的数据集

QGuard：基于问题的多模态 LLM 安全零样本防护

QGuard：基于问题的多模态 LLM 安全零样本防护

使用大型语言模型和人类专家事实核查方法对新闻媒体进行真实性和偏见分析

使用大型语言模型和人类专家事实核查方法对新闻媒体进行真实性和偏见分析

自我隐私：你的第一视角相机暴露了你什么？

自我隐私：你的第一视角相机暴露了你什么？

DiffusionBlocks：通过基于分数的扩散进行生成模型的块级训练

DiffusionBlocks：通过基于分数的扩散进行生成模型的块级训练

Infini-gram mini：使用FM-索引在互联网规模下进行精确的n-gram搜索

Infini-gram mini：使用FM-索引在互联网规模下进行精确的n-gram搜索

BOW：瓶颈式后续词探索

AI辅助的摘要和结论分析：标记未经证实的主张和模糊的代词

AI辅助的摘要和结论分析：标记未经证实的主张和模糊的代词

基于图像的不确定性感知剩余寿命预测

基于图像的不确定性感知剩余寿命预测

仇恨演变：静态基准测试未能告诉我们什么

仇恨演变：静态基准测试未能告诉我们什么

使用 MIDI-RWKV 实现可个性化的长上下文符号音乐填充

使用 MIDI-RWKV 实现可个性化的长上下文符号音乐填充