从 FARS 出发,聊聊 AI 如何改写科研与工作流
本文参加年度征文活动 #TeamSilicon25 赛道。 pg a5game.app 爱壹帆电影yfsp.app
写在最前
过去一年,我对 AI 的感受其实变了好几次。最早它像一个会接话的搜索框,后来像一个还算靠谱的外包实习生,再后来,它开始有点像同事:你给它一个目标,它会自己拆步骤、补上下文、往前推进。可直到我看到 FARS 的直播界面,我才意识到,自己还是把问题想小了。 slots a5game.app
2 月 13 日,Analemma 公开直播部署 FARS;到 2 月 23 日,它已经在约 228.5 小时里完成了 100 篇 short paper,期间生成了 244 个研究假设,累计消耗 114 亿 token、总成本约 10.4 万美元,平均每篇论文 2 小时 17 分左右。 jogodotigrinhodemo a5game.app 小宝影院在线视频xiaobaotv.video demotigrinho a5game.app
FAR最终完成情况官方给它配置的,不是一个聊天窗口,而是一整套工业级基础设施:Ideation、Planning、Experiment、Writing 四个模块,再加上 160 张 GPU 和统一的模型调用端口。看着那个界面,我想到的不是论文,而是看板、流水线和任务队列。 tigrinhodemo a5game.app JogodoTigrinho a5game.app 爱壹帆电影 yfsp.app tigrinho gratis a5game.app
FARS 流程示意FARS 真正让我后背发凉的地方,不是“AI 居然能写 100 篇论文”,而是“科研这件事,第一次被如此彻底地拆成了可排队、可调度、可并行、可验收的工序”。一旦一件事能被这样拆开,它距离被自动化,往往就只差工程问题了。 寻秦记爱壹帆yfsp.app ifun yfsp.app
科研流水线,第一次长出了看板
FARS 团队给科研下了一个非常“工程化”的定义:一个理想的研究系统,产出的最小单元不是一篇气势恢宏的论文,而是“一个清晰的假设,加上一份可靠的验证结果”。正因为如此,它默认输出的是 short paper,甚至鼓励报告负结果。这个定义听上去朴素,杀伤力却很强:它把“论文”从目的地降格成了包装,把“假设—验证”重新抬成了核心。 pglucky88 a5game.app
这件事的意义,可能比 100 篇论文本身还要大。因为过去很多人理解 AI 对科研的帮助,仍停留在“帮你找文献、润色英文、写点代码”这个层面,像是给原有流程加速。但 FARS 展示的是另一种变化:不是旧流程跑得更快,而是流程本身被改写了。研究不再只是一个研究者关在屋里灵光一现,而更像一条持续运行的知识生产线。哪怕这条线今天产出的还 mostly 是 short paper,它也已经说明,科研这件事正在从“手工作坊”往“系统工程”迁移。 爱壹帆影视yfsp.app
如果把视野再拉大一点,你会发现这并不是一场孤例。Sakana AI 的 AI Scientist-v2 已经做到了端到端生成论文,并让一篇完全 AI 生成的论文通过了 ICLR 2025 workshop 的同行评审;Google DeepMind 的 AlphaEvolve 则把大模型、自动评估和演化框架拼在一起,用于算法发现和优化。FARS 的特别之处,不在于它是第一个谈“自动科研”的系统,而在于它把这种能力做成了公开直播、持续运行、规模化产出的样子,让“科研流水线”第一次有了肉眼可见的形状。
我甚至觉得,FARS 最有启发性的地方之一,是它把过程暴露出来:官网持续更新项目、论文、评审结果,公开页面也能直接看到 FARS 的组织与项目入口。面对 AI 系统,单个最终产物的说服力会下降,可追溯过程、可检查 artifact、可复现实验,反而会变得更重要。以后我们判断一项工作靠不靠谱,看的可能不只是“最后这份东西像不像”,而是“它背后的轨迹能不能被看见”。 aiyifan yfsp.app Cassinos a5game.app iyftvyfsp.app jogosdemopg a5game.app 爱壹帆电影yfsp.app
从副驾驶到自动驾驶
某种意义上说,FARS 只是把很多人过去一年隐约感受到的变化,放大成了一个极端样本。我自己最直观的感受,不是在看论文时产生的,而是在做项目时产生的。 demo a5game.app pragmatic a5game.app fortunetigerdemográtis a5game.app
去年我折腾个人账单分析工具时,项目一度因为代码量膨胀而停摆:改一个功能,能顺手带出十几个连锁错误。后来新的 AI IDE 出现,我原本只是想让它帮我看看微信账单的文件结构、给点处理思路,结果在不到 20 轮对话里,它几乎把数据切分、自动标签化和并行分析的活都往前推了一大截。那一刻我最强烈的感受并不是“它代码写得更好了”,而是“它开始理解项目、理解上下文、理解任务链条了”。 爱一番yfsp.app a5game a5game.app iyifanyfsp.app ifvodyfsp.app
我一直偏爱自动化、轻量化的工具,不希望记录和创作本身变成负担。以前这种偏好更多体现在各种 app、快捷指令和脚本上;现在,AI 工作流把这种偏好推到了新阶段:我开始默认先搭脚手架,再逐步加固,而不是从第一句、第一行代码、第一张图表开始手工砌砖。写文章如此,做分析如此,改项目也是如此。 slot a5game.app
比如现在写一篇文章,我往往不再等自己把所有材料看完再动笔,而是先让 AI 帮我做第一轮地图:哪些是背景,哪些是争议,哪些是事实,哪些只是好看的噪音;哪些段落值得展开,哪些判断只是情绪上的爽点。然后我在这张地图上走动,删改顺序,补进自己的经验,把真正想表达的东西塞进去。思考并没有被取消,只是从一次性爆发,变成了沿着流程持续发生。 sweetbonanza1000demo a5game.app
这和 FARS 给我的震动其实是一回事。AI 的变化,已经不只是单点能力变强,而是开始接管“从 A 走到 B 之间的过程”。以前我们把工作想成一个个孤立动作:查资料、做笔记、写代码、跑实验、改文案、做汇报。现在更合理的理解方式,是把它们看成一条会循环的链:检索、归纳、生成、执行、评估、修正。只要这条链足够清晰,AI 就会从一个好用的工具,慢慢变成一个能持续干活的系统。 爱壹帆yfsp.app xiaobao xiaobaotv.video
所以我现在越来越少问“AI 能不能替我写这段话”,而是更常问“这件事能不能被整理成一个 AI 也能跑通的流程”。前一个问题的答案,往往只是节省几分钟;后一个问题的答案,才决定一项工作能不能被压缩成可复用、可迭代、可放大的工作流。 plataformademo a5game.app 一帆视频yfsp.app
最先坍塌的,其实是反馈周期
我越来越觉得,AI 对科研和知识工作的最大改变,不是生成速度,而是反馈速度。传统科研里最折磨人的,往往不是做实验本身,而是等待:等把文献看得差不多,等把代码搭得八九不离十,等投稿,等审稿,等下一轮修改。Stanford 的 Agentic Reviewer 之所以会被做出来,就是因为有人真实地经历过“三年被拒六次、每六个月拿到一轮反馈”的慢周期。它的核心价值,也不是替代审稿人,而是让“提交—获得反馈—补实验—再修改”的闭环跑得更快。
从这个角度再看 FARS,就很容易明白它为什么会让人不安。真正危险的,不是它十天写了 100 篇论文,而是它让“提出假设—做实验—写成论文—接受评估”这一整条链第一次被高速打通了。知乎上有人提到一个非常尖锐的观察:现在阅读和评估论文的成本,可能已经反超了生产论文的成本。我觉得这句话不止适用于论文,也适用于大量日常工作。文档、报告、PRD、代码草案、调研纪要,都会越来越便宜;真正越来越贵的,是判断它们值不值得看、哪里有问题、下一步该不该继续投资源。(如何看待FARS批量制造100篇论文?) 免费在线影院xiaobaotv.video 爱壹帆免费版yfsp.app
当然,这一切也不是没有代价。Agentic Reviewer 官方自己就明确提醒:评审意见是 AI 生成的,可能出错,应该作为参考而不是裁决。也就是说,我们得到的是更快的反馈,不是自动正确的反馈。速度被压缩之后,人工判断并没有消失,只是被挪到了更靠后、也更关键的位置。 小宝影院xiaobaotv.video nba比分 a5game.app 一帆yfsp.app 小寶影院xiaobaotv.video 爱壹帆寻秦记yfsp.app 小宝影院电影xiaobaotv.video
这也是为什么我越来越觉得,未来很多岗位的核心能力,会从“高质量完成执行”转向“高质量组织执行”。以前优秀的人是自己能做完一整套动作;以后更稀缺的人,可能是能把问题定义清楚、把流程拆开、把评估标准立住、再让人和 AI 一起把流水线跑顺的人。说得俗一点,值钱的能力会从“亲自下场干活”慢慢挪到“设计系统、分配注意力、承担结果责任”。 电影爱壹帆yfsp.app sugarrush1000demo a5game.app fortuneoxdemográtis a5game.app
人不会立刻被替代,但位置一定会变
当然,FARS 远没有到“AI 科学家完全取代人类研究者”的地步。按照他们用 Agentic Reviewer 给 100 篇论文做的统一评分,平均分是 5.05,确实高于 ICLR 2026 人类投稿平均分 4.21,但又低于最终被接收论文的平均分 5.39。换句话说,它已经可以稳定产出“像那么回事”的研究,但离真正的顶尖成果、离能改变领域方向的工作,还有一段距离。Sakana 那边也很坦诚:AI Scientist-v2 虽然有论文通过了 workshop 审稿,但内部人工复核仍发现了引用错误、可复现性和整体质量上的不少问题。 电影小宝影院xiaobaotv.video plataformademográtis a5game.app
但这恰恰说明,接下来最先被重排的,不一定是“顶尖创造力”,而是大量中间层工作:例行性的文献综述、基线实验、代码搭建、初稿撰写、预审反馈、格式整理、版本迭代。也就是说,被 AI 冲击最早的,不是天才的灵光,而是熟练工的流程。FARS 现在先在 AI4AI 上成立,也并不神秘,因为 AI 研究天然适合被数字化:数据在电脑里,实验在电脑里,训练在电脑里,评测在电脑里,论文也在电脑里。只要验证闭环能在机器内部完成,自动化的速度就会比我们想象得更快。 爱亦凡yfsp.app 爱一帆 yfsp.app 足球比分 a5game.app
反过来说,这也是 FARS 目前的边界。它之所以先在 AI 研究上成立,不是因为 AI 更高贵,而是因为这里的资料、代码、评测和写作天然都能被机器吃进去。那些需要湿实验、田野调查、组织协调、人类受试者、长期关系建立的领域,短期内很难被一套系统端到端吃掉。但即便如此,它们的外围工作也已经开始被侵蚀:立项、综述、分析、写作、预审、修改,这些数字化程度更高的部分,会先一步变成 AI 工作流的地盘。 爱壹帆国际版 yfsp.app 爱壹帆在线yfsp.app
还有一个常被忽视的现实:FARS 这次的单篇成本约 1040 美元,背后还有 160 张 GPU。也就是说,论文工厂离“家用版”显然还远。可技术演化往往就是这样:先在昂贵、集中的场景里成立,再逐渐缩小、下放、民用化。今天看起来像研究机构专属的流水线,明天也许就会缩水成我们电脑上的 agent stack。 fortunetigerbônusgrátissemdepósito a5game.app
所以我现在不太相信那种简单的二选一问题:AI 会不会取代科研人员,AI 会不会取代内容工作者。更准确的说法应该是:AI 会先取代一批旧工作流,再逼着人去发明新的工作流。不会用 AI 的人未必立刻出局,但还把 AI 只当搜索框、翻译器、润色器的人,可能会越来越难和那些已经开始“搭系统”的人竞争。 华人影视xiaobaotv.video Caça-níqueis a5game.app pragmaticplay a5game.app slotdemo a5game.app slotdemo a5game.app
结语
如果说过去两年我们还在讨论 AI 是不是一个好用的副驾驶,那么 FARS 这类系统让我第一次认真意识到:很多工作正在从“副驾驶模式”滑向“自动驾驶模式”。这不意味着人从此可以把手离开方向盘,更不意味着科研会在明天就被工厂化复制。但至少有一件事已经很清楚了:论文、报告、代码、分析,正在越来越像同一种东西——它们都是某条工作流的输出,而不是神圣不可拆解的手工艺品。 pgslot a5game.app fortunedragon demo a5game.app ifuntvyfsp.app 小寶影院xiaobaotv.video
也许未来最稀缺的,不再是“能不能亲手把一篇论文、一份报告、一套代码写出来”,而是“你能不能判断什么值得写、怎么验证它值得写、以及出了问题谁来负责”。FARS 让我意识到,AI 对科研和工作的真正改写,从来都不只是效率提升,而是价值位置的迁移:从执行,迁到定义;从产出,迁到评估;从个人能力,迁到系统能力。
如果哪天每个人手边都能有一个属于自己的“小型 FARS”,我想真正拉开差距的,恐怕也不会是谁按下生成按钮更快,而是谁更知道该让它生成什么,又该在什么地方把它叫停。 海外华人视频网xiaobaotv.video fortunetigerbônusgrátissemdepósito a5game.app
写在最后
本文使用ChatGPT 5.4 Pro生成,AI全场自主完成选题讨论、资料梳理、结构设计、初稿生成与修改润色,中间思考过程耗时36m37s;最终观点取舍、事实核验、案例增删与定稿由作者完成。全文实质写作过程与对话记录附后。 小寶影院电影xiaobaotv.video
提示词: iyf yfsp.app pgslotgacor a5game.app
我想针对fars这个话题写一篇年度征文,谈谈ai对科研以及工作流的改变。参考:https://analemma.ai/blog/introducing-fars/,https://www.zhihu.com/question/2009388139421115997,https://.com/post/105805。行文风格可以参考我之前的投稿:https://.com/post/85355,https://.com/post/86747,https://.com/post/96151,https://.com/post/104232。字数约4000字。 pgdemo a5game.app slotpix a5game.app demo a5game.app
聊天记录
40目录 0