AI论文精选
每日论文
◀
06月05日
▶
⏶
52
Code2LoRA:软件演化下针对代码语言模型的超网络生成适配器
⏶
41
ArcANE:角色扮演语言智能体能在合适的时间保持人设吗?
⏶
36
TIDE:通过模板引导迭代的主动多问题发现
⏶
34
AdaPlanBench:评估大语言模型智能体在世界与用户约束下的自适应规划
⏶
33
VideoKR:迈向知识和推理密集型视频理解
⏶
23
RobotValues:在人类价值观冲突时评估家用机器人
⏶
23
强化学习激发未见语言翻译的上下文学习
⏶
18
针对相册视觉问答(VQA)的个人 AI 智能体
⏶
17
LoomVideo:将多模态输入统一到视频生成与编辑中
⏶
16
重新思考自我进化 LLM 智能体的持续经验内化
⏶
15
复杂度平衡的扩散分裂
⏶
14
自动驾驶的前路:KITScenes 多模态数据集
⏶
14
Dream.exe:视频生成模型能梦见可执行的机器人操控吗?
⏶
10
智能数据分析的无监督技能发现
⏶
7
大语言模型会泄露训练数据,但它们想这样做吗?大语言模型中记忆的倾向感知评估
⏶
6
推理的影子价格:大语言模型最优预算分配的经济学视角
⏶
6
OPRD:同策表征蒸馏
⏶
6
MAOAM:基于视觉语言模型的统一物体与材料选择
⏶
5
世界-语言-动作模型:统一世界建模、语言推理和动作合成
⏶
5
针对长视界 LLM 智能体的元认知记忆策略优化
⏶
5
先想象再预测:用于视频事件预测的交织潜在视觉推理
⏶
4
MLEvolve:一种用于自动化机器学习算法发现的自我进化框架
⏶
4
SePO:用于系统提示词优化的自我进化提示词智能体
⏶
4
AdaCodec:用于视频多模态大模型的预测性视觉编码
⏶
4
迈向一对多的时序定位
⏶
4
SEAOTTER:用于高效重构的一次性转码传感器嵌入式自编码
⏶
3
迈向真正的多语言 ASR:将语码混合 ASR 泛化至未见语言对
⏶
3
Flash-WAM:世界动作模型的模态感知蒸馏
⏶
3
从视频中学习几何表示以赋能空间智能多模态大语言模型
⏶
3
AffordanceVLA:通过示能感知理解赋能动作生成的视觉-语言-动作模型
⏶
3
MechVQA:在综合机械图纸理解上评估并增强多模态大语言模型
⏶
2
EvoDS:具有技能学习和上下文管理功能的自我进化自主数据科学智能体
⏶
2
基于正则化流的潜在推理
⏶
2
修改上下文,转变模拟立场:对在线讨论中基于大语言模型的立场模拟进行审计
⏶
2
随时随地,基准一切
⏶
2
加法的形状:大语言模型中算术的几何结构
⏶
2
置信域Q伴随匹配
⏶
1
Discrete-WAM:用于世界策略学习的统一离散视觉-动作 Token 编辑
⏶
1
Video2LoRA:视觉语言模型的参数化视频内化
⏶
1
组合合成:通过原子分解与重组扩展代码 RLVR
⏶
1
这次编辑正确吗?一个面向推理感知图像编辑的多维度基准
⏶
1
质量引导的医学图像分割半监督学习
⏶
1
基于大语言模型的多模态音乐推荐系统
⏶
1
重复博弈中面对自适应对手的遗憾最小化
⏶
1
AURA:情境化大语言模型智能体中用于显化隐式需求的意图导向探测
⏶
1
吸收复杂性:用于金融大语言模型智能体的交互原生知识治理系统
⏶
1
抵抗智能体重新识别的大语言模型匿名化
⏶
0
ForeSci:评估大语言模型智能体在前瞻性 AI 研究研判中的表现
⏶
0
BRepCLIP:用于 CAD 理解的 BRep 基元对比多模态预训练
⏶
0
SABER:有状态项目工作空间中大语言模型编码智能体操作安全的基准测试
◀ 前一日