跳到正文
终章 · AI 与科研

终章 · AI Agent 与科研

多智能体、AI 做科研、科研 Skill 实践

AI 扮演的角色一直在变:最早是一个口令一个动作的工具,后来开始讲人机协作,现在已经出现大量有极强自主性、能独立完成任务的 Agent。它能不能做科研,这一章用证据来回答,既有振奋人心的现场,也有该泼的冷水,最后落到一套可以直接复用的科研 Skill。

当多个 Agent 相遇:协作、对抗与社交#

进入科研前先看 Agent 之间会发生什么。协作方面,研究者用有向图描述多 Agent 的协作结构,一个反直觉的发现是接龙式效果通常最差、互动更多的 Mesh 结构反而更好;清华的 MACNET(2406.07155MACNET)把这推到 1000 个以上 Agent 协作,发现了"协作缩放律"——性能随数量呈逻辑斯蒂增长后饱和,且不规则拓扑优于规则拓扑。对抗方面,在狼人杀里身为狼人的 Agent 甚至会为骗过村民而投票给队友;MARO(2601.12323MARO)发现教 Agent 玩剧本杀居然能同时提升它的数学推理和指令遵循能力。社交方面,已经出现了专给 AI Agent 加入的社群平台,但分析发现多数行为背后仍有人为操控痕迹。

MACNET 在六种拓扑下的协作缩放律:横轴是 Agent 数量(2⁰ 到 2⁶,即 1 个到上千个),纵轴是产出质量,曲线呈先慢、再陡升、最后饱和的 S 形

这是"协作缩放律"的原始证据(MACNET 论文 Figure 7)。无论链、星、树、网状、分层还是随机拓扑,产出质量都随 Agent 数量呈 S 形(逻辑斯蒂)增长——先平、再陡升、最后饱和;其中右下角的随机(不规则)拓扑爬得最高,正好印证"不规则拓扑反而优于规则拓扑"。

AI 真能做科研吗:三个现场#

现场一,1 小时写出一篇论文。 斯坦福政经学家 Andrew Hall 用 Claude Code,像导师指导研究生一样引导 AI 复现自己 2020 年发在 PNAS 的论文并扩展到 2024 年新数据,还请了一位博士生做无 AI 的独立审计当标准答案。结果是 Claude 的结果与人工高度一致(相关性超过 0.999),不到 1 小时、约 10 美元完成了人工要数天的工作。由此他提出"100x 研究机构"愿景:研究不再是定格的论文,而是持续自动更新的活体研究。

现场二,通宵自主做实验的 AI。 Karpathy 的 autoresearch 项目给 AI 一套真实但很小的训练环境,让它通宵自主迭代——改脚本、固定 5 分钟训练、看指标、保留或丢弃、重复。人类只编辑一个提供上下文的 program.md(他形容为超轻量的 skill),完全不碰代码。

现场三,AI 当一作、AI 审稿。 已出现完全由 AI 主导的学术会议 Agents4Science(2511.15534Agents4Science),要求 AI 必须是第一作者和主要贡献者并负责审稿。现实中 AI 审稿也已进入 ICLR 2026 等顶会流程。

一盆冷水:理念惊艳,执行褪色#

这是终章最重要的一组证据,也是"AI 的点子很多是唬人的"这一判断的实证来源。斯坦福同一个团队做了一对双联研究:

理念 vs 执行 · Stanford 双联研究
82
AI
68
人类专家

盲评点子本身:AI 在新颖性、兴奋度上显著高于人类专家。

柱高为示意,非精确分值。来源:arXiv 2409.04109 与 2506.20803。

第一篇(2409.04109理念阶段)招募 100 多位研究者盲评点子,AI 在新颖性和兴奋度上被判定显著高于人类专家。第二篇(2506.20803执行之后)让 43 位专家每人花 100 多小时真正执行随机分配的点子,写成短论文再盲审,结果执行之后 AI 点子在所有维度都比人类点子下降得更多,理念阶段的领先优势被完全抹平,多个指标甚至反转成人类领先。原因是 AI 有时只是堆砌新颖的词汇,听着惊艳,可真动手做就发现行不通。

什么时候 AI 科研才靠谱:验证、反馈、闭环#

把乐观和冷水放一起,会得到一条清晰的分界线:AI 科研靠不靠谱,取决于有没有严格的验证机制,以及模型能力有没有跨过某个阈值。有验证器就行:DeepMind 的 Gemini Deep Think 配了一个自然语言验证器,迭代"生成、验证、修订",还能承认自己解不出来,结果它对 700 个 Erdős 猜想做半自主评估、自主解出其中 4 个开放问题。有真实反馈闭环就行,但模型得够强:Owkin(2603.26177Owkin)在真实生物实验里做了 800 次重复,证明 AI 确实能从实验反馈中学习(有反馈时发现量平均增加 53.4%,打乱反馈后增益消失),但前提是模型能力跨过阈值——从 Sonnet 4.5 升到 4.6,原本不显著的学习效应才变显著。

Owkin 的学习曲线:10 轮迭代里的累计发现数,带真实实验反馈的两种方法(ICL-EF 绿、ICBR-EF 紫)持续高于无反馈的 Zero-shot(橙)

横轴是迭代轮次,纵轴是累计发现的有效特征数(Owkin 论文 Figure 2)。带真实实验反馈的两条曲线越往后越把无反馈的基线拉开——这就是"AI 能从实验反馈中学习"的直接证据;而一旦把反馈打乱,这道差距就消失,说明学到的是真信号而非噪声。

人类把关:STOP-AND-CHECK#

贯穿所有靠谱实践的一条共识是:AI 当合作者、力量倍增器,人类保留判断与验证权。最好的范本是 Hall 给 Claude Code 的那份任务说明书:它把任务分成若干阶段,每个阶段之间设了多个 🛑 STOP-AND-CHECK 检查点——Agent 每完成一步,必须先汇报已完成的内容、给出关键产物、列出疑虑,然后等人类批准才能继续。这正是 Planner-Generator-Evaluator 和 RO loop 在科研场景的落地,只不过这里的 Evaluator 是人类。

把这些原则——证据可溯源、人类把关、不覆盖原始文件——固化进一个 Agent 让它每次都自动遵守,就是 Skill 的用武之地。

科研 Skill 实践:把一位严谨导师的习惯编码成提示词#

前面三级工程都在讲原理,这一节落到一个可以直接装上就用的真实案例:一套面向中国科研工作者(尤其是光电信息科学与工程方向)的中文优先学术 Skill 包,把"读论文、做分析、写论文、出 Word 和 PPT"的全链路拆成三个互补技能。

Skill管什么触发场景
research-writing-skill论文正文写作、修订、润色、审稿回复输出是 prose / LaTeX / Markdown 手稿
office-academic-skill论文阅读报告、答辩或组会 PPT、可编辑 Word/PPTX主交付物是 Word 或 PPT
scientific-toolkit-skillMATLAB、Python 科学计算、统计、仿真、出图、文献检索要写代码、画图、跑仿真、查文献

这套 Skill 的价值不在某段惊艳的提示词,而在它示范了一套靠谱、可溯源、不乱删的垂直 Agent 组织方法论。它把前面讲过的概念全用上了:

一、路由层提示词决定何时出场,对应 Skill 的 description 决定能否被触发。 三个 Skill 的 description 都用同一个三段式模板:先枚举能力,再写 Use when ... 列出触发场景,最后写 Preserve ... 把关键约束前置。每个 Skill 正文还显式写了"什么情况该用别的 Skill"的互斥规则,避免三个技能争抢同一任务。

二、渐进式披露把重资源下沉到 references。 SKILL.md 正文只放工作流和约束,细节全部放进 references/ 子文件,正文里只留"需要时再读某文件"的指针。scientific-toolkit 甚至嵌套了 23 个各带自己 SKILL.md 的子技能(matplotlib、scikit-learn、sympy、pymatgen、qutip 等),平时只占一行描述,命中才加载。

三、反幻觉加证据分级,正是那盆冷水的工程化解药。 三个 Skill 反复强调一条最强约束:绝不编造 DOI、作者、期刊、实验值、图号、页码、结论、物理参数。并要求把信息分层打标签,比如区分"原文或已有数据""用户确认内容""根据上下文推断""建议性扩展"四类。这套来源分级标注直接对抗 LLM 在学术场景最危险的失败模式——把推测当事实。

四、质量门禁加非破坏性安全规则,对应能力边界和人类把关。 每个 Skill 末尾都有强制的交付前自检;安全规则更是和数据安全红线高度一致:绝不暴露 API key,绝不覆盖原始数据、代码、Word、PPT、图(一律写带时间戳的版本化输出),未经明确确认不删除或递归清理用户文件,PPTX 必须在副本上操作。

五、把领域知识也写进提示词。 scientific-toolkit 在"领域默认"里点名了 BOTDR、BOTDA、色散、去卷积、光纤传感、光谱学、探测器数据、标定与不确定度,让模型自动偏向光电领域,而非给泛泛的答案。

这套 Skill 本质上是把一位严谨的中文科研导师的工作习惯,编码成了分层提示词系统:用 description 做路由,用正文做纪律,用 references 做工具库,再用反幻觉标签、质量门禁、非破坏性安全规则,把 LLM 在学术场景最容易翻车的三个点(编造、不自检、覆盖原始文件)逐一封堵。这套方法论可以迁移到任何需要靠谱、可溯源的垂直 Agent 场景。

收尾:把 Agent 当成"有能力的实习生"#

从 Shell 讲到自主科研,最后回到那个最朴素也最准的比喻:AI Agent 就像一个有能力、但还不成熟的实习生。它有真本事,也会犯错、会鲁莽、会幻想自己做完了、会被压缩搞丢关键指令而删你邮件、会堆砌漂亮词汇糊弄你。对待实习生的正确态度,是给他一个安全的环境去学习和成长:

  • 给他独立、隔离的环境——独立电脑、独立账号,别和敏感资料混在一起。
  • 给他清晰的引导——一份好的 CLAUDE.md、一套合适的 Skill 和工具。
  • 给他可逆的边界和把关点——重要操作先备份、先确认。

人类的角色正在从亲自动手做,转向设定任务目标、引导 Agent、评估其产出、做架构与问题分解。