ARIS —— 让 Claude Code 在你睡觉时做科研

作者:一泽 Eze(@wanshuiyin
项目地址https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep
许可证:MIT


前言

今天要介绍的是一个让我眼前一亮的项目——ARIS(Auto-claude-code-research-in-sleep)。

顾名思义,这是一个让 Claude Code 在你睡觉时自动做科研的工具。当你第二天醒来,会发现论文已经被打分、弱点已经被定位、实验已经跑完、叙事已经重写——全自动

这不是一个简单的 prompt 集合,而是一套完整的多模型协作科研工作流系统。核心理念是:

用 Claude Code 执行,用 Codex (GPT-5.4) 评审,两个模型互相制约,打破单模型自评的盲区。

更令人振奋的是,已经有两篇论文使用 ARIS 完成,最终被顶会接收

论文 评分 会议 作者 技术栈
CS 论文 8/10 “clear accept” CS 会议 @DefanXue & @Monglitay Claude Code + GPT-5.4
AAAI 论文 7/10 “good paper, accept” AAAI 2026 Main Technical @xinbo820-web 纯 Codex CLI

一、为什么需要 ARIS?

1.1 单模型自评的致命缺陷

传统的 AI 辅助科研通常是:

1
你 → 单个 LLM → 输出

问题在于:同一个模型审自己的输出,会陷入局部最优。就像自己出题自己做,永远发现不了问题。

类比 bandit 问题:单模型自审是 stochastic bandit(噪声可预测),跨模型审稿则是 adversarial bandit(审稿者会主动探测执行者未预料的弱点)。

1.2 双模型协作的威力

ARIS 的核心设计:

角色 模型 职责
执行者 (Executor) Claude Code 快速读论文、写代码、跑实验、操作文件
审稿者 (Reviewer) Codex (GPT-5.4) 严格评审、找弱点、压力测试、批判性分析

两个模型互不评自己的作业,形成真正的对抗性反馈循环:

1
2
3
4
5
6
7
8
9
10
11
12
13
用户 → Claude Code(执行)

写代码 / 跑实验 / 收结果

Codex(评审)

找弱点 → 返回给 Claude Code

Claude Code(修复)

Codex(再审)

... 循环直到顶会标准 ...

1.3 为什么是两个模型?

两个是打破自我博弈盲区的最小配置,且双人博弈收敛到 Nash 均衡的效率远高于多人博弈。增加更多审稿者只会增加 API 开销和协调成本,边际收益递减。

Claude Code 的优势是快速丝滑的执行,Codex (GPT-5.4) 虽然慢但审稿更严谨深入。两者速度 × 严谨的互补特性,比单模型自我对话效果更好。


二、ARIS 核心功能

2.1 四大工作流

工作流 1:Idea Discovery(想法发现)

1
/idea-discovery "研究方向"

从研究方向自动发现创新点,完整流程:

1
2
research-lit → idea-creator → novelty-check → research-review → research-refine-pipeline
(文献调研) (头脑风暴) (验证新颖性) (批判性反馈) (方法精炼 + 实验规划)

输出

  • IDEA_REPORT.md — 排名后的想法报告
  • refine-logs/FINAL_PROPOSAL.md — 精炼后的提案
  • refine-logs/EXPERIMENT_PLAN.md — 实验路线图

工作流 2:Auto Review Loop(自动审稿迭代)

1
/auto-review-loop "论文主题"

自动多轮审稿 → 修复 → 再审,全自动完成。

1
Claude Code 实现修复 → Codex 评审 → 问题 → Claude Code 再修复 → ... → 直到达标

工作流 3:Paper Writing(论文写作)

1
/paper-writing "NARRATIVE_REPORT.md"

研究叙事 → 精修 PDF,完整流程:

1
paper-plan → paper-figure → paper-write → paper-compile → auto-improvement-loop

已内置 9 个会议模板:ICLR、NeurIPS、ICML、CVPR、ACL、AAAI、ACM、IEEE_JOURNAL、IEEE_CONF。

工作流 4:Rebuttal(审稿意见辩护)

1
/rebuttal "paper/ + reviews" — venue: ICML, character limit: 5000

解析 review → 原子化 → 策略 → 起草 → 安全检查 → GPT-5.4 压力测试 → 定稿。

三道安全门

  • 🔒 不编造 — 每句话有出处
  • 🔒 不过度承诺 — 没批准的不承诺
  • 🔒 全覆盖 — 每个审稿意见都追踪

一键全流程:Research Pipeline

1
/research-pipeline "研究方向"

工作流 1 → 1.5 → 2 → 3 端到端全自动。

2.2 配套工具

命令 用途
/paper-slides 论文 → Beamer PDF + PPTX + 演讲稿
/paper-poster 论文 → A0/A1 海报 PDF
/arxiv 搜索下载 arXiv 论文
/semantic-scholar 搜索正式发表的顶会论文
/meta-optimize ARIS 自优化——分析使用数据改进 SKILL.md
/run-experiment 部署实验到 GPU
/experiment-bridge 实验结果 → claim 判定
/novelty-check 想法新颖性验证

2.3 支持的平台

ARIS 不锁定平台,全套 Markdown Skill 文件,零依赖:

平台 支持情况
Claude Code ✅ 原生支持
Cursor ✅ 适配指南见 CURSOR_ADAPTATION.md
Trae ✅ 字节跳动 AI IDE,适配指南见 TRAE_ARIS_RUNBOOK_CN.md
Antigravity ✅ Google Agent-First IDE
OpenClaw
Codex CLI ✅ 纯执行版本
Windsurf

2.4 支持的模型组合

不需要 OpenAI API! 支持国产模型:

组合 说明
MiniMax-M2.7 + GLM-5 零成本方案
Kimi + GLM 阿里百炼 Coding Plan
ModelScope 免费额度

详见文档:


三、ARIS 设计哲学

Skill = 哲学 + 技术事实,不是操作手册。讲清 tradeoff 让 AI 自己选,不替它推理。

这是 ARIS 最重要的设计原则。每个 SKILL.md 不只是步骤说明,而是包含:

  1. 浏览哲学:遇到问题时的决策框架
  2. 技术事实:已知的方法局限和边界
  3. 权衡取舍:为什么这样设计而不是那样

四、快速安装

4.1 基础安装

1
2
3
4
5
6
7
8
9
# 1. 克隆仓库
git clone https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep.git

# 2. 复制 skills 到你的 Claude Code
cp -r Auto-claude-code-research-in-sleep/skills/* ~/.claude/skills/

# 3. 在 Claude Code 中使用
claude
> /idea-discovery "你的研究方向"

4.2 配置 Codex MCP(推荐)

1
2
3
4
5
6
# 安装 Codex CLI
npm install -g @openai/codex
codex setup # 提示选模型时选 gpt-5.4

# 添加到 Claude Code
claude mcp add codex -s user -- codex mcp-server

4.3 无 API 成本方案

没有 OpenAI API?用国产模型:

1
2
3
# 详见文档
cat docs/MiniMax-GLM-Configuration.md
cat docs/MODELSCOPE_GUIDE.md

五、使用示例

5.1 基础模式——给方向全自动

1
/research-pipeline "离散扩散语言模型的 factorized gap"

ARIS 会:

  1. 自动搜索文献
  2. 生成创新想法
  3. 验证新颖性
  4. 获取评审反馈
  5. 精炼方法
  6. 设计实验

5.2 精准模式——有参考论文

1
/research-pipeline "改进方法 X" — ref paper: https://arxiv.org/abs/2406.04329, base repo: https://github.com/org/project

ARIS 会:

  • 读论文 → 找弱点 → 克隆代码 → 针对弱点用那套代码生成改进方案 → 跑实验 → 写论文

就像跟研究助手说:“读这篇论文,用这个 repo,找出哪里不行,然后修好它。”

5.3 Rebuttal 模式——审稿意见来了

1
/rebuttal "paper/ + reviews" — venue: ICML, character limit: 5000

自动生成安全的 rebuttal,有三道安全门确保不编造、不过度承诺、全覆盖。


六、案例分析:使用 ARIS 完成的顶会论文

6.1 案例 1:CS 论文(8/10 “clear accept”)

项目 内容
评分 8/10 “clear accept”
会议 CS 会议
作者 @DefanXue & @Monglitay
技术栈 Claude Code + GPT-5.4

使用流程

  1. /idea-discovery 发现创新方向
  2. /auto-review-loop 多轮迭代
  3. /paper-writing 写完整论文
  4. 提交后用 /rebuttal 处理审稿意见
  5. 成功接收!

6.2 案例 2:AAAI 2026 论文(7/10 “good paper, accept”)

项目 内容
评分 7/10 “good paper, accept”
会议 AAAI 2026 Main Technical
作者 @xinbo820-web
技术栈 纯 Codex CLI(无需 Claude Code)

关键启示:ARIS 不依赖 Claude Code。纯 Codex CLI 同样可以完成完整流程。

6.3 从想法到接收的全程记录

两篇论文都是全程 ARIS 完成——从 idea 到接收

这证明了 ARIS 工作流的可行性:

  • ✅ 不需要顶会论文写作经验
  • ✅ 不需要昂贵的 GPU 资源
  • ✅ 不需要多个 AI 工具拼凑

一套工作流,从想法到顶会接收。


七、重要参数说明

所有命令都支持内联参数配置:

参数 默认 说明
AUTO_PROCEED true 自动继续最佳选项
human checkpoint false 每轮 review 后暂停
sources all 搜索来源:zotero、local、web、semantic-scholar
venue ICLR 目标会议
difficulty medium 审稿对抗强度:medium / hard / nightmare
compact false 生成精简摘要文件
ref paper false 参考论文 URL

使用示例

1
2
3
4
/research-pipeline "方向" — AUTO_PROCEED: false          # 在选 idea 时暂停
/research-pipeline "方向" — human checkpoint: true # 每轮 review 后暂停
/research-pipeline "方向" — difficulty: nightmare # 极限压力测试
/research-pipeline "方向" — venue: CVPR # 指定目标会议

八、无 GPU?没问题!

ARIS 提供两种免费 GPU 方案:

8.1 Modal Serverless GPU

1
2
3
4
5
# CLAUDE.md 中配置
gpu: modal

# 一条命令跑实验,自动 scale-to-zero
modal run launcher.py
  • $30/月免费额度
  • 无需 SSH/Docker
  • 跑完自动停止

8.2 Vast.ai GPU 租赁

1
2
# CLAUDE.md 中配置
gpu: vast
  • 自动租用最便宜的 GPU
  • 用完即销毁
  • 按小时计费

九、自定义与扩展

9.1 元优化:让 ARIS 自我改进

ARIS 可以优化自己

1
2
3
4
5
# 启用被动日志
cp templates/claude-hooks/meta_logging.json .claude/settings.json

# 累积 5 次运行后分析
/meta-optimize

会分析你的使用数据,提出 SKILL.md 改进方案——reviewer 审核、用户批准

9.2 飞书通知

配置后可在手机接收实验进度通知:

1
2
3
4
# 三种模式
feishu: off # 关闭
feishu: push # 推送通知
feishu: interactive # 交互模式

9.3 Zotero + Obsidian 集成

如果你有 Zotero 文献库或 Obsidian 笔记,ARIS 可以直接读取:

  • Zotero 标注和高亮
  • Obsidian 研究笔记
  • 本地 PDF 库

十、总结

ARIS 能为你做什么

场景 ARIS 能做到
没有研究方向 /idea-discovery 从大方向发现创新点
有方向但不知道做什么 /idea-creator 生成 8-12 个具体想法
不知道想法是否新颖 /novelty-check 多源检索验证
不知道想法够不够顶会 /research-review 顶会级评审
有结果不知道写不写论文 /paper-writing 自动写完整论文
审稿意见来了不知道怎么回 /rebuttal 安全生成辩护信
没有 GPU Modal / Vast.ai 免费方案
没有 OpenAI API MiniMax + GLM 国产方案

核心优势

  1. 零依赖:纯 Markdown 文件,没有框架要学
  2. 跨平台:Claude Code / Cursor / Trae / Codex CLI 都可用
  3. 国产友好:支持 MiniMax、GLM、Kimi 等国产模型
  4. 已验证:两篇顶会接收论文证明有效
  5. 可自优化:内置 meta-optimize 让系统自我改进

下一步

  1. 克隆项目git clone https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep.git
  2. 安装 Skillscp -r skills/* ~/.claude/skills/
  3. 开始使用claude 然后 /idea-discovery "你的研究方向"

参考链接


特别致谢:ARIS 由一泽 Eze 开发维护,采用 MIT 许可证。这是一个完全开源的项目,欢迎 fork、star 和贡献。

如果这个工具对你有帮助,欢迎:

  • 在 GitHub 上点一个 ⭐
  • 分享给需要做科研的朋友
  • 提交 Issue 或 PR 帮助改进