AI类 · 2026年3月24日 0

2026 Agent最大突破是”递归自进化”,三年后有望实现”神经计算机”

他的博士生涯始于论文Mindstorm,该工作系统描绘了智能体社会的整体图景及其潜在经济形态。此后,他又以共同第一作者身份主导完成了MetaGPT,使其迅速成为近年来智能体编程领域最具代表性、也最具影响力的现象级工作之一;与此同时,他也是OpenHands(原OpenDevin)的早期核心贡献者。

围绕Agent系统方法论,他进一步发展出GPTSwarm,将多智能体建模为可优化的图(graph),为Agent的系统化构造与演化开辟了新路径;他提出的Agent-as-a-Judge,则切中了长时程任务自动评估这一关键瓶颈,为持续迭代优化提供了核心机制。

这位师从Jürgen Schmidhuber的KAUST博士生,早在2021年就将博士研究锚定为多模态Agent。回看他的路径,核心是一件事:更早判断方向,并把判断落成研究。

Agent的未来究竟是怎样的图景?长时程任务中智能体该如何实现自我评估?被调侃为”老顽童”的导师又给他带来了怎样的科研启迪?在这篇深度专访中,他将围绕Agent技术演进的关键路径展开分享,深入讨论智能体社会、智能体经济、自动化评估与递归自我改进(RSI,Recursive Self-Improvement)以及神经计算机(NC,Neural Computer)。

01 于浪潮未至时落子:研究课题和个人选择

2021年末将博士课题锁定为多模态智能体(Multimodal Agents);并始终认为CodingAgent是最易落地、最具商业价值的方向。

02 Recursive Self-Improvement:Agent进化的核心引擎

未来一年的突破就集中在这个方向。

诸葛鸣晨:三年前,我已经在MetaGPT附录中写下这些方向。回头看,它们正在逐步进入行业讨论的中心。2026年的突破,就集中在recursive self-improvement。

Agent-as-a-Judge的核心价值,是为长时程任务提供持续反馈信号。这种反馈不一定需要100%精准,只要它有意义、能提供方向性,就足以支撑整个迭代闭环继续优化。

03 Agent开源三部曲

MetaGPT当时解决的是什么问题呢?以前大模型的上下文窗口很短,代码如果稍微包含一两个文件就超出了这个上下文长度。MetaGPT的做法是把不同的职责划分开,论文里称为SOP:CEO下达命令,然后有系统架构师、产品经理、engineer等角色,每一个agent的输入输出格式都很清晰规范,同时设计了共享的对话窗口。这样就解决了两大问题:一是由上下文长度不足导致的inconsistency(不一致性),二是hallucination(幻觉)。

GPTSwarm的核心想法很直接,就是用图来统一建模single agent和multi-agent system。在这个框架里,节点代表工具、函数或能力,边代表它们之间的连接关系与信息流动方式。

04 师从”现代AI之父”Jürgen Schmidhuber

在组里氛围很自由,没有固定的weekly meeting。具体指导方面,他会非常详细地看我的论文,甚至会因为某句话、某个词表述不清楚而给出很强烈的批评意见。

他提出智能体的奖励直接等同于”Cash”——就像人类需要薪酬来维持生活,agent社会也可能由经济因素驱动。一些agent可能非常”富足”,有自己的”baby”(数字分身);一些agent可能会”破产”。

05 Agent的下一个十年

目前这一两年,最终我想做的是一个”过往项目的集大成者”,把过去几个项目的思路整合起来:多智能体协作、sandbox执行、图优化、自动评估等等,设计一个真正可长期运行的长程Agent,优先落地在automatic engineering场景。同时会找机会推出Completely Neural Computers(完备神经计算机)。

诸葛鸣晨:Agent已经基本覆盖了编程和各类工程师场景,能帮大家实实在在地提速。Agent会从编程扩展到所有日常场景。最后想说的是:人类的适应力和创造性,始终会比Agent更强。AI不会淘汰人,但会用AI的人,会淘汰不会用AI的人。

KAUST博士生诸葛鸣晨

*部分图片由AI生成

来源:虎嗅网