NeuralOS:迈向通过神经生成模型模拟操作系统

发表
Yuntian DengYuntian Deng 提交
作者: Luke Rivard, Sun Sun, Hongyu Guo, Wenhu Chen, Yuntian DengYuntian Deng

摘要

我们介绍了NeuralOS,一个神经框架,它通过直接预测屏幕帧来响应用户输入,如鼠标移动、点击和键盘事件,从而模拟操作系统的图形用户界面(GUI)。NeuralOS结合了跟踪计算机状态的循环神经网络(RNN)和生成屏幕图像的基于扩散的神经渲染器。该模型在一个大规模的Ubuntu XFCE录制数据集上进行训练,该数据集包括随机生成的交互以及AI代理产生的真实交互。实验表明,NeuralOS成功渲染了逼真的GUI序列,准确捕捉了鼠标交互,并可靠地预测了应用程序启动等状态转换。尽管精确建模细粒度键盘交互仍然具有挑战性,但NeuralOS为未来人机交互系统创建完全自适应、生成式神经接口迈出了一步。
查看 arXiv 页面查看 PDF

评论

Yuntian DengYuntian Deng
论文作者
论文提交者

一个操作系统能完全由神经网络驱动吗?

隆重推出NeuralOS,这是一款生成式操作系统,通过用户输入预测屏幕图像,结合使用RNN进行计算机状态建模和扩散模型进行渲染。

亲自尝试:https://neural-os.com

Apolinário from multimodal AI artApolinário from multimodal AI art

令人难以置信的工作 @yuntian-deng!如果能把 https://neural-os.com 的演示也放到 Hugging Face Spaces 上就太棒了!一个超级简单的方法就是用 iframe 将它制作成一个静态 Space:https://huggingface.co/new-space

Yuntian DengYuntian Deng
论文作者
论文提交者

感谢建议!我们正在制作一个Hugging Face Space的演示版本。

Yuntian DengYuntian Deng
论文作者
论文提交者

更新:Hugging Face Space 演示现已发布于:

https://huggingface.co/spaces/yuntian-group/neural-os

您现在可以自行运行 NeuralOS 或在其基础上进一步构建。为获得可接受的性能,我建议至少使用 NVIDIA L40 GPU,理想情况下使用 A100 GPU 或更高级别的 GPU(最初的 neural-os.com 演示运行在 H100s 上)。

Yuntian DengYuntian Deng
论文作者
论文提交者

包含高度总结的推文:https://x.com/yuntiandeng/status/1944802154314916331?s=46&t=iVNn_4xtitgDnUVVPSMN5w