每日论文

Seed1.5-VL 技术报告

Seed1.5-VL 技术报告

MiMo：释放语言模型的推理潜力——从预训练到后训练

MiMo：释放语言模型的推理潜力——从预训练到后训练

Step1X-3D：迈向纹理化 3D 资产的高保真可控生成

Step1X-3D：迈向纹理化 3D 资产的高保真可控生成

在推理模型中从同伴学习

统一连续生成模型

REFINE-AF：一个通过使用来自自动化反馈的强化学习自生成指令来对齐语言模型的任务无关框架

REFINE-AF：一个通过使用来自自动化反馈的强化学习自生成指令来对齐语言模型的任务无关框架

DanceGRPO：在视觉生成中释放 GRPO 的力量

DanceGRPO：在视觉生成中释放 GRPO 的力量

Skywork-VL 奖励模型：一种用于多模态理解和推理的有效奖励模型

Skywork-VL 奖励模型：一种用于多模态理解和推理的有效奖励模型

AttentionInfluence：采用注意力头的影响用于从弱到强的预训练数据选择

AttentionInfluence：采用注意力头的影响用于从弱到强的预训练数据选择

大型语言模型持续预训练中的学习动态

大型语言模型持续预训练中的学习动态

WebGen-Bench：评估大型语言模型从头开始生成交互式和功能性网站的能力

WebGen-Bench：评估大型语言模型从头开始生成交互式和功能性网站的能力

通过分数最大化的连续视觉自回归生成

通过分数最大化的连续视觉自回归生成

MonetGPT：解决谜题提升 MLLMs 的图像润饰能力

MonetGPT：解决谜题提升 MLLMs 的图像润饰能力

INTELLECT-2：一个通过全球去中心化强化学习训练的推理模型

INTELLECT-2：一个通过全球去中心化强化学习训练的推理模型

强化内外部知识协同推理，用于高效自适应搜索代理

强化内外部知识协同推理，用于高效自适应搜索代理

立场：AI 竞赛为 GenAI 评估提供了实证严谨性的黄金标准

立场：AI 竞赛为 GenAI 评估提供了实证严谨性的黄金标准

UMoE：使用共享专家统一注意力和FFN

UMoE：使用共享专家统一注意力和FFN

DynamicRAG: 利用大语言模型输出作为反馈，实现检索增强生成中的动态重排

DynamicRAG: 利用大语言模型输出作为反馈，实现检索增强生成中的动态重排

LLAMAPIE: 主动式入耳对话助手

LLAMAPIE: 主动式入耳对话助手

H³DP：用于视觉运动学习的三重层次化扩散策略

H³DP：用于视觉运动学习的三重层次化扩散策略

文档引用归属：使用大型语言模型研究引用关系

文档引用归属：使用大型语言模型研究引用关系

溢出预防增强长上下文循环LLM

溢出预防增强长上下文循环LLM

用于天气预报的物理辅助和拓扑引导的深度学习

用于天气预报的物理辅助和拓扑引导的深度学习

多目标导向的离散流匹配用于可控生物序列设计

多目标导向的离散流匹配用于可控生物序列设计