大型语言模型中的情绪编码调查

发表
YuyaoGeYuyaoGe 提交
作者: YuyaoGeYuyao Ge, Lingrui MeiLingrui Mei, Zenghao Duan, Tianhao LiTianhao Li, Yujia Zheng, Yiwei Wang, Lexin WangLexin Wang, Jiayu Yao, Tianyu Liu, Yujun Cai, Baolong Bi, Fangda Guo, Jiafeng Guo, Shenghua Liu, Xueqi Cheng

摘要

大型语言模型(LLM)的进步已经催生了一种范式转变,从代码生成辅助转向自主编码代理,从而实现了一种名为“Vibe Coding”的新型开发方法,在这种方法中,开发人员通过观察结果而不是逐行代码理解来验证 AI 生成的实现。尽管具有变革潜力,但这种新兴范式的有效性仍未得到充分探索,实证证据显示生产力意外下降以及人机协作方面的根本性挑战。为了弥补这一差距,本调查提供了对使用大型语言模型的 Vibe Coding 的首次全面系统审查,为这种变革性的开发方法建立了理论基础和实践框架。通过对 1000 多篇研究论文的系统分析,我们调查了整个 Vibe Coding 生态系统,考察了包括用于编码的 LLM、基于 LLM 的编码代理、编码代理的开发环境和反馈机制在内的关键基础设施组件。我们首先通过将 Vibe Coding 表述为一个约束马尔可夫决策过程(Constrained Markov Decision Process)来将其形式化为一个正式的学科,该过程捕获了人类开发人员、软件项目和编码代理之间的动态三方关系。在这一理论基础上,我们将现有实践综合为五种不同的开发模型:无约束自动化、迭代对话协作、规划驱动、测试驱动和上下文增强模型,从而提供了该领域第一个全面的分类法。至关重要的是,我们的分析表明,成功的 Vibe Coding 不仅取决于代理的能力,还取决于系统的上下文工程、成熟的开发环境以及人机协作的开发模型。
查看 arXiv 页面查看 PDF

评论

YuyaoGeYuyaoGe
论文作者
论文提交者

本调查首次对大型语言模型(LLM)中的 Vibe Coding 进行了全面系统的回顾,为这种变革性的开发方法奠定了理论基础和实践框架。通过对 1000 多篇研究论文的系统分析,我们调查了整个 Vibe Coding 生态系统,考察了关键的基础设施组成部分,包括用于编码的 LLM、基于 LLM 的编码代理、编码代理的开发环境以及反馈机制。我们首先通过形式化一个约束马尔可夫决策过程来将 Vibe Coding 作为一个正式的学科,该过程捕捉了人类开发者、软件项目和编码代理之间动态的三元关系。在此理论基础上,我们将现有实践综合为五种不同的开发模型:无约束自动化、迭代对话协作、规划驱动、测试驱动和上下文增强模型,从而在该领域提供了第一个全面的分类法。

Shenghua LiuShenghua Liu

f133dd33f1b582ebff238a7657d263b2