这个春节,AI圈最硬核的一场「真人秀」,悄然完成了阶段性收官。
主角不是动漫人物,也不是舞枪弄棒的机器人,而是一位7×24小时从不疲倦的AI科学家FARS(Fully Automated Research System)。
这套由Analemma(日行迹)打造的全自动研究系统,在长达228小时28分33秒的连续公开运行中,自己提假设、做实验、写论文,共生成244个研究假设,「肝」出100篇短论文(short paper)。
算下来,在这座流水线式的「科研工厂」中,每隔约2小时就有一篇论文产出。
首批深度「验货」的专业网友给出了一个颇为一致的判断:结果超过预期、相当出色。
如果把它当作人类顶会论文,还不够惊艳;但如果考虑到这是一个全自动系统的阶段性产出,其完成度已经明显超出很多人的事前预期。
至少在当前阶段,FARS已经完成了一次关键跨越。它首次证明,一条无人值守的科研「流水线」不仅能跑,而且能在相对稳定条件下,持续产出具备一定学术竞争力的short paper级工作。
FARS并不是一个单体模型,而是一套多智能体系统,包括四个功能模块:Ideation(构思)、Planning(规划)、Experiment(实验)、Writing(写作)。
从实时运行界面可以直观看到,FARS以项目队列的方式并行推进多个研究任务。每个课题依次穿过四个阶段,流程高度模块化,呈现出明显的「科研装配线」特征。
为了让它心无旁骛的做研究,Analemma还给它搭建了一个160张显卡的计算集群,并允许它调用几乎任何开源和闭源大模型。
在约228小时(≈9.5天)的连续运行周期内:系统生成244个研究假设,完成100篇short paper,累计消耗114亿Token,总成本约10.4万美元。
从整体评分结果来看,FARS产出的100篇论文中,平均得分为5.05。
作为参照,ICLR 2026人类投稿的平均分为4.21,而最终被接收论文的平均分为5.39。
对照来看,FARS的平均分5.05,已经明显高于人类投稿的整体平均水平。
FARS的这100篇论文,并不是终点,更像是一枚被钉下的坐标点。它证明了一件很重要的事:端到端自动科研流水线,已经能够在相对稳定的运行条件下,持续产出具备一定学术竞争力的short paper。
来源:虎嗅

