AI论文精选
每日论文
◀
12月09日
▶
⏶
44
原生并行推理器:通过自蒸馏强化学习实现并行推理
⏶
39
超越现实:旋转位置嵌入在长上下文LLM中的虚数扩展
⏶
28
统一视频编辑与时间推理器
⏶
26
Voxify3D:像素艺术遇上体渲染
⏶
24
DoVer: 干预驱动的LLM多智能体系统自动调试
⏶
23
扩展零样本参考到视频生成
⏶
17
分布匹配变分自编码器
⏶
16
EgoEdit:以自我为中心的视频编辑数据集、实时流媒体模型和基准
⏶
14
多视图金字塔变换器:从粗粒度着眼,以察更广
⏶
13
UnityVideo:统一多模态多任务学习,增强世界感知视频生成
⏶
12
LongCat-Image 技术报告
⏶
11
关系视觉相似性
⏶
8
关于预训练、中训练和强化学习在推理语言模型中的相互作用
⏶
7
ReCamDriving:无激光雷达的摄像头控制新轨迹视频生成
⏶
6
VG-Refiner: 通过智能体强化学习实现工具精修的引用基础推理
⏶
6
超越令牌级监督:通过强化学习释放基于解码的回归的潜力
⏶
5
OmniSafeBench-MM:用于多模态越狱攻防评估的统一基准和工具箱
⏶
3
群表示位置编码
⏶
3
解耦以泛化:数据稀缺视觉-语言推理的上下文优先自演化学习
⏶
2
重新思考规模自回归生成中的训练动态
⏶
2
VideoVLA:视频生成器可以是通用机器人操纵器
⏶
1
使用高斯变分自编码器进行向量量化
⏶
1
DZ-TDPO:长上下文对话中可变状态跟踪的非破坏性时间对齐
⏶
1
Small-Gain Nash:可微分博弈中Nash均衡的认证收缩
⏶
0
人机交互中的具身指代表达理解
⏶
0
Segment Anything 模型家族中 SAM2 到 SAM3 的鸿沟:为什么基于提示的专业知识在概念驱动的图像分割中会失败
◀ 前一日