← Blog

OpenCode Scientific Writer:24 个 AI Agent 助力学术写作

博士生永无止境的写作循环

如果说博士生涯有什么是永恒不变的,那就是写作。论文、基金申请书、文献综述、会议摘要、海报排版、图片说明、审稿回复信——清单永远不会结束。虽然每种文体都有自己的规范和模板,但大量精力其实花在了结构化、重复性的工作上:组织章节、格式化引用、确保符合报告标准、生成方法部分的模板文字。

在香港中文大学生命科学学院完成博士学位后,我想构建一个能帮我省下数百小时的工具。这就是 OpenCode Scientific Writer——一个部署了 24 个专业 AI Agent 的 OpenCode 插件,每个 Agent 都针对科学和学术写作的特定方面进行了训练。

从 Claude Scientific Writer 到 OpenCode

这个插件的灵感来源于 K-Dense Inc. 的”Claude Scientific Writer”。我将这个概念移植到 OpenCode 平台,重构了 Agent 架构并扩展了功能,以充分利用 OpenCode 的插件系统。最终成品是一个独立的工具,将领域特定的 AI 写作辅助直接带到了你的开发环境中。

24 个 Agent 概览

这些 Agent 覆盖了科学交流的完整生命周期:

论文写作遵循 IMRAD 结构(引言、方法、结果、讨论),还有额外的 Agent 负责摘要、结论和标题生成。每个 Agent 都理解自己所在章节的写作惯例——方法 Agent 用过去时被动语态写作,结果 Agent 只呈现发现而不做解读,等等。

临床报告包括基于 CONSORT(随机对照试验)、STROBE(观察性研究)和 PRISMA(系统综述)报告指南训练的 Agent。

研究与文献提供了假设生成、研究问题检索(由 Perplexity 学术搜索驱动)和系统文献综述合成的 Agent。研究检索 Agent 连接 Perplexity 的 sonar-pro-search 模型,可以实时搜索相关学术论文。

基金写作提供了主要资助机构的模板和 Agent:NSF、NIH、DOE 和 DARPA。每个 Agent 都了解目标机构的具体评审标准和格式要求。

视觉交流是特别有意思的部分。科学示意图的 Agent 使用 Gemini 模型,配合迭代质量审查循环——生成图表、根据质量阈值评估、反复优化直到达标。这涵盖了科学图表、信息图、LaTeX/PPTX 海报和演示幻灯片。

辅助 Agent 负责引文管理、特定期刊/会议模板和通用的文本编辑优化。

智能后端路由

并非所有写作任务都需要同一个 AI 后端。OpenCode Scientific Writer 实现了智能路由:

  • 通用写作和编辑查询走 Parallel Chat API,提供快速、通用的响应
  • 学术论文搜索和研究查询路由到 Perplexity 的 sonar-pro-search,专门针对学术文献优化
  • 图表和图形生成使用 Gemini 模型,具有强大的视觉生成能力

路由过程完全透明——你只需调用需要的 Agent,插件自动选择最优后端。

质量可控的图表生成

我最引以为傲的功能之一是图表生成的迭代质量控制。科学图表的要求远高于普通插图——坐标轴需要标签、示意图需要一致的样式、流程图需要逻辑清晰。图表 Agent 会生成初稿,根据文档类型特定的质量阈值进行评估(海报图片和期刊图片有不同的要求),然后迭代优化直到质量分数达标。这种多轮方法大幅减少了单次 AI 生成中常见的”差不多但不够好”的问题。

我的收获

开发这个插件让我在多个领域有了深入实践:

  • 插件架构:设计一个足够模块化以承载 24 个 Agent,同时保持整体一致性和可维护性的系统
  • 多 Agent 系统设计:编排有时需要顺序工作(先研究、再列大纲、再起草)有时又需要独立运行的 Agent
  • 领域特定的提示工程:编写能够编码科学写作惯例的提示词,而不仅仅是通用写作能力
  • API 集成:在统一接口背后连接多个 AI 后端(聊天模型、搜索 API、图像生成)
  • 科学出版规范:深入理解 IMRAD、CONSORT、STROBE、PRISMA 和各机构基金申请的结构要求

OpenCode Scientific Writer 的目标不是取代研究者的声音或判断力。它要处理的是脚手架——结构、格式、模板文字——让你能把精力集中在科学本身。

插件地址:github.com/loganylchen/opencode-scientific-writer