228小时狂飙100篇论文、烧光114亿Token：FARS杀疯了

这个春节，AI圈最硬核的一场「真人秀」，悄然完成了阶段性收官。

主角不是动漫人物，也不是舞枪弄棒的机器人，而是一位7×24小时从不疲倦的AI科学家FARS（Fully Automated Research System）。

这套由Analemma（日行迹）打造的全自动研究系统，在长达228小时28分33秒的连续公开运行中，自己提假设、做实验、写论文，共生成244个研究假设，「肝」出100篇短论文（short paper）。

算下来，在这座流水线式的「科研工厂」中，每隔约2小时就有一篇论文产出。

首批深度「验货」的专业网友给出了一个颇为一致的判断：结果超过预期、相当出色。

如果把它当作人类顶会论文，还不够惊艳；但如果考虑到这是一个全自动系统的阶段性产出，其完成度已经明显超出很多人的事前预期。

至少在当前阶段，FARS已经完成了一次关键跨越。它首次证明，一条无人值守的科研「流水线」不仅能跑，而且能在相对稳定条件下，持续产出具备一定学术竞争力的short paper级工作。

FARS并不是一个单体模型，而是一套多智能体系统，包括四个功能模块：Ideation（构思）、Planning（规划）、Experiment（实验）、Writing（写作）。

从实时运行界面可以直观看到，FARS以项目队列的方式并行推进多个研究任务。每个课题依次穿过四个阶段，流程高度模块化，呈现出明显的「科研装配线」特征。

为了让它心无旁骛的做研究，Analemma还给它搭建了一个160张显卡的计算集群，并允许它调用几乎任何开源和闭源大模型。

在约228小时（≈9.5天）的连续运行周期内：系统生成244个研究假设，完成100篇short paper，累计消耗114亿Token，总成本约10.4万美元。

从整体评分结果来看，FARS产出的100篇论文中，平均得分为5.05。

作为参照，ICLR 2026人类投稿的平均分为4.21，而最终被接收论文的平均分为5.39。

对照来看，FARS的平均分5.05，已经明显高于人类投稿的整体平均水平。

FARS的这100篇论文，并不是终点，更像是一枚被钉下的坐标点。它证明了一件很重要的事：端到端自动科研流水线，已经能够在相对稳定的运行条件下，持续产出具备一定学术竞争力的short paper。

来源：虎嗅

工作 · 2026年3月22日 0