AI论文精选
每日论文
◀
02月10日
▶
⏶
268
弱驱动学习:弱智能体如何让强智能体变得更强
⏶
203
TermiGen:为终端智能体构建的高保真环境与鲁棒轨迹合成
⏶
185
QuantaAlpha:一种用于大语言模型驱动的因子挖掘进化框架
⏶
153
MOVA:迈向可扩展且同步的音视频生成
⏶
135
多模态大语言模型中由模态间隙驱动的子空间对齐训练范式
⏶
73
AIRS-Bench:前沿人工智能研究科学智能体任务套件
⏶
70
InternAgent-1.5:用于长时程自主科学发现的统一智能体框架
⏶
69
递归深度 VLA:通过潜空间迭代推理实现愿景-语言-动作模型的隐式测试时计算量扩展
⏶
66
LLaDA2.1:通过 Token 编辑加速文本扩散
⏶
53
RLinf-USER:一个统一且可扩展的具身智能真实世界在线策略学习系统
⏶
46
迈向材料科学的智能体智能
⏶
44
通过在基于流的 GRPO 中建模逐步和长期采样效应来缓解稀疏奖励问题
⏶
40
改进大语言模型科学推理的数据与奖励设计
⏶
38
GEBench:将图像生成模型作为 GUI 环境进行基准测试
⏶
28
Demo-ICL:用于过程性视频知识获取的上下文学习
⏶
27
为运行时智能体记忆学习查询感知的预算层级路由
⏶
26
GISA:通用信息寻求助手基准测试
⏶
24
LOCA-bench:在可控且极端的上下文增长下基准测试语言智能体
⏶
22
空间理论:基础模型能否通过主动探索构建空间信念?
⏶
21
AgentCPM-Report:为开放式深度研究交织草拟与深化过程
⏶
20
WorldCompass:用于长时程世界模型的强化学习
⏶
18
LatentChem:化学推理中从文本思维链到潜空间思考的转变
⏶
15
NanoQuant:大语言模型的高效亚 1 比特量化
⏶
14
通过显式信息传输实现上下文压缩
⏶
13
基本推理范式诱导语言模型中的跨领域泛化
⏶
11
RelayGen:用于高效推理的生成内模型切换
⏶
9
何时以及想象多少:用于视觉空间推理的世界模型自适应测试时扩展
⏶
8
How2Everything:从网络挖掘操作流程以评估和改进大语言模型
⏶
8
可靠且负责任的基础模型:综合综述
⏶
7
Rolling Sink:在自回归视频扩散中连接有限时界训练与开放式测试
⏶
7
思考让大语言模型智能体变得内向:强制思考如何在用户参与型智能体中产生反效果
⏶
6
CodeCircuit:通过归因图推断大语言模型生成代码的正确性
⏶
5
SoulX-Singer:迈向高质量零样本歌声合成
⏶
5
通向通用人工智能的数据科学与技术 第一部分:分层数据管理
⏶
4
迈向弥合人形机器人控制中大规模预训练与高效微调之间的差距
⏶
4
Agent Skills:关于 Claude 技能以扩展大语言模型功能的基于数据的分析
⏶
3
MotionCrafter:利用 4D VAE 进行稠密几何与运动重建
⏶
3
ECO:基于强化学习的人形机器人行走能量约束优化
⏶
3
WildReward:从真实场景的人类交互中学习奖励模型
⏶
3
大规模下的最优土耳其语子词策略:数据、词汇与形态学相互作用的系统评估
⏶
3
RLVR 中基于梯度保持视角的灵活熵控制
⏶
2
论智能体评估中的随机性
⏶
2
FlexMoRE:用于高效联邦训练大语言模型的灵活秩异构混合专家
⏶
2
Aster:自主科学发现速度比现有方法快 20 倍以上
⏶
2
回声作为锚点:大语言模型推理中的概率成本与注意力重聚焦
⏶
2
KV-CoRE:基准测试大语言模型中 KV 缓存的数据依赖型低秩可压缩性
⏶
2
Col-Bandit:面向延迟交互检索的零样本查询时剪枝
⏶
1
面向非线性以外的正向和反向偏微分方程的学习引导 Kansa 配置法
⏶
1
GraphAgents:知识图谱引导的跨领域材料设计智能体 AI
⏶
1
用于防御嵌入反转攻击的概念感知隐私机制
⏶
1
AVERE:通过偏好优化改进视听情感推理
⏶
1
基于大语言模型进行实体匹配的成本效益型 RAG:一种基于分块的探索
⏶
1
CauScale:大规模神经因果发现
⏶
1
锚定解码:可证明降低任何语言模型版权风险的方法
⏶
0
dewi-kadita:一个用于带有基于熵诊断的理想化鱼群模拟的 Python 库
⏶
0
f-GRPO 及更多:用于通用大语言模型对齐的基于散度的强化学习算法
⏶
0
Lean 4 中的统计学习理论:从零开始的经验过程
⏶
0
用于多模态检索的推理增强表示
◀ 前一日
后一日 ▶