ARIS —— 让 Claude Code 在你睡觉时做科研

作者：一泽 Eze（@wanshuiyin）
项目地址：https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep
许可证：MIT

前言

今天要介绍的是一个让我眼前一亮的项目——ARIS（Auto-claude-code-research-in-sleep）。

顾名思义，这是一个让 Claude Code 在你睡觉时自动做科研的工具。当你第二天醒来，会发现论文已经被打分、弱点已经被定位、实验已经跑完、叙事已经重写——全自动。

这不是一个简单的 prompt 集合，而是一套完整的多模型协作科研工作流系统。核心理念是：

用 Claude Code 执行，用 Codex (GPT-5.4) 评审，两个模型互相制约，打破单模型自评的盲区。

更令人振奋的是，已经有两篇论文使用 ARIS 完成，最终被顶会接收：

论文	评分	会议	作者	技术栈
CS 论文	8/10 “clear accept”	CS 会议	@DefanXue & @Monglitay	Claude Code + GPT-5.4
AAAI 论文	7/10 “good paper, accept”	AAAI 2026 Main Technical	@xinbo820-web	纯 Codex CLI

一、为什么需要 ARIS？

1.1 单模型自评的致命缺陷

传统的 AI 辅助科研通常是：

1	你 → 单个 LLM → 输出

问题在于：同一个模型审自己的输出，会陷入局部最优。就像自己出题自己做，永远发现不了问题。

类比 bandit 问题：单模型自审是 stochastic bandit（噪声可预测），跨模型审稿则是 adversarial bandit（审稿者会主动探测执行者未预料的弱点）。

1.2 双模型协作的威力

ARIS 的核心设计：

角色	模型	职责
执行者 (Executor)	Claude Code	快速读论文、写代码、跑实验、操作文件
审稿者 (Reviewer)	Codex (GPT-5.4)	严格评审、找弱点、压力测试、批判性分析

两个模型互不评自己的作业，形成真正的对抗性反馈循环：

用户 → Claude Code（执行）
         ↓
      写代码 / 跑实验 / 收结果
         ↓
      Codex（评审）
         ↓
      找弱点 → 返回给 Claude Code
         ↓
      Claude Code（修复）
         ↓
      Codex（再审）
         ↓
      ... 循环直到顶会标准 ...

1.3 为什么是两个模型？

两个是打破自我博弈盲区的最小配置，且双人博弈收敛到 Nash 均衡的效率远高于多人博弈。增加更多审稿者只会增加 API 开销和协调成本，边际收益递减。

Claude Code 的优势是快速丝滑的执行，Codex (GPT-5.4) 虽然慢但审稿更严谨深入。两者速度 × 严谨的互补特性，比单模型自我对话效果更好。

二、ARIS 核心功能

2.1 四大工作流

工作流 1：Idea Discovery（想法发现）

1	/idea-discovery "研究方向"

从研究方向自动发现创新点，完整流程：

1 2	research-lit → idea-creator → novelty-check → research-review → research-refine-pipeline (文献调研) (头脑风暴) (验证新颖性) (批判性反馈) (方法精炼 + 实验规划)

输出：

IDEA_REPORT.md — 排名后的想法报告
refine-logs/FINAL_PROPOSAL.md — 精炼后的提案
refine-logs/EXPERIMENT_PLAN.md — 实验路线图

工作流 2：Auto Review Loop（自动审稿迭代）

1	/auto-review-loop "论文主题"

自动多轮审稿 → 修复 → 再审，全自动完成。

1	Claude Code 实现修复 → Codex 评审 → 问题 → Claude Code 再修复 → ... → 直到达标

工作流 3：Paper Writing（论文写作）

1	/paper-writing "NARRATIVE_REPORT.md"

研究叙事 → 精修 PDF，完整流程：

1	paper-plan → paper-figure → paper-write → paper-compile → auto-improvement-loop

已内置 9 个会议模板：ICLR、NeurIPS、ICML、CVPR、ACL、AAAI、ACM、IEEE_JOURNAL、IEEE_CONF。

工作流 4：Rebuttal（审稿意见辩护）

1	/rebuttal "paper/ + reviews" — venue: ICML, character limit: 5000

解析 review → 原子化 → 策略 → 起草 → 安全检查 → GPT-5.4 压力测试 → 定稿。

三道安全门：

🔒 不编造 — 每句话有出处
🔒 不过度承诺 — 没批准的不承诺
🔒 全覆盖 — 每个审稿意见都追踪

一键全流程：Research Pipeline

1	/research-pipeline "研究方向"

工作流 1 → 1.5 → 2 → 3 端到端全自动。

2.2 配套工具

命令	用途
`/paper-slides`	论文 → Beamer PDF + PPTX + 演讲稿
`/paper-poster`	论文 → A0/A1 海报 PDF
`/arxiv`	搜索下载 arXiv 论文
`/semantic-scholar`	搜索正式发表的顶会论文
`/meta-optimize`	ARIS 自优化——分析使用数据改进 SKILL.md
`/run-experiment`	部署实验到 GPU
`/experiment-bridge`	实验结果 → claim 判定
`/novelty-check`	想法新颖性验证

2.3 支持的平台

ARIS 不锁定平台，全套 Markdown Skill 文件，零依赖：

平台	支持情况
Claude Code	✅ 原生支持
Cursor	✅ 适配指南见 CURSOR_ADAPTATION.md
Trae	✅ 字节跳动 AI IDE，适配指南见 TRAE_ARIS_RUNBOOK_CN.md
Antigravity	✅ Google Agent-First IDE
OpenClaw	✅
Codex CLI	✅ 纯执行版本
Windsurf	✅

2.4 支持的模型组合

不需要 OpenAI API！ 支持国产模型：

组合	说明
MiniMax-M2.7 + GLM-5	零成本方案
Kimi + GLM	阿里百炼 Coding Plan
ModelScope	免费额度

详见文档：

三、ARIS 设计哲学

Skill = 哲学 + 技术事实，不是操作手册。讲清 tradeoff 让 AI 自己选，不替它推理。

这是 ARIS 最重要的设计原则。每个 SKILL.md 不只是步骤说明，而是包含：

浏览哲学：遇到问题时的决策框架
技术事实：已知的方法局限和边界
权衡取舍：为什么这样设计而不是那样

四、快速安装

4.1 基础安装

# 1. 克隆仓库
git clone https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep.git

# 2. 复制 skills 到你的 Claude Code
cp -r Auto-claude-code-research-in-sleep/skills/* ~/.claude/skills/

# 3. 在 Claude Code 中使用
claude
> /idea-discovery "你的研究方向"

4.2 配置 Codex MCP（推荐）

# 安装 Codex CLI
npm install -g @openai/codex
codex setup   # 提示选模型时选 gpt-5.4

# 添加到 Claude Code
claude mcp add codex -s user -- codex mcp-server

4.3 无 API 成本方案

没有 OpenAI API？用国产模型：

1
2
3

# 详见文档
cat docs/MiniMax-GLM-Configuration.md
cat docs/MODELSCOPE_GUIDE.md

五、使用示例

5.1 基础模式——给方向全自动

1	/research-pipeline "离散扩散语言模型的 factorized gap"

ARIS 会：

自动搜索文献
生成创新想法
验证新颖性
获取评审反馈
精炼方法
设计实验

5.2 精准模式——有参考论文

1	/research-pipeline "改进方法 X" — ref paper: https://arxiv.org/abs/2406.04329, base repo: https://github.com/org/project

ARIS 会：

读论文 → 找弱点 → 克隆代码 → 针对弱点用那套代码生成改进方案 → 跑实验 → 写论文

就像跟研究助手说：“读这篇论文，用这个 repo，找出哪里不行，然后修好它。”

5.3 Rebuttal 模式——审稿意见来了

1	/rebuttal "paper/ + reviews" — venue: ICML, character limit: 5000

自动生成安全的 rebuttal，有三道安全门确保不编造、不过度承诺、全覆盖。

六、案例分析：使用 ARIS 完成的顶会论文

6.1 案例 1：CS 论文（8/10 “clear accept”）

项目	内容
评分	8/10 “clear accept”
会议	CS 会议
作者	@DefanXue & @Monglitay
技术栈	Claude Code + GPT-5.4

使用流程：

用 /idea-discovery 发现创新方向
用 /auto-review-loop 多轮迭代
用 /paper-writing 写完整论文
提交后用 /rebuttal 处理审稿意见
成功接收！

6.2 案例 2：AAAI 2026 论文（7/10 “good paper, accept”）

项目	内容
评分	7/10 “good paper, accept”
会议	AAAI 2026 Main Technical
作者	@xinbo820-web
技术栈	纯 Codex CLI（无需 Claude Code）

关键启示：ARIS 不依赖 Claude Code。纯 Codex CLI 同样可以完成完整流程。

6.3 从想法到接收的全程记录

两篇论文都是全程 ARIS 完成——从 idea 到接收。

这证明了 ARIS 工作流的可行性：

✅ 不需要顶会论文写作经验
✅ 不需要昂贵的 GPU 资源
✅ 不需要多个 AI 工具拼凑

一套工作流，从想法到顶会接收。

七、重要参数说明

所有命令都支持内联参数配置：

参数	默认	说明
`AUTO_PROCEED`	`true`	自动继续最佳选项
`human checkpoint`	`false`	每轮 review 后暂停
`sources`	`all`	搜索来源：zotero、local、web、semantic-scholar
`venue`	`ICLR`	目标会议
`difficulty`	`medium`	审稿对抗强度：medium / hard / nightmare
`compact`	`false`	生成精简摘要文件
`ref paper`	`false`	参考论文 URL

使用示例：

/research-pipeline "方向" — AUTO_PROCEED: false          # 在选 idea 时暂停
/research-pipeline "方向" — human checkpoint: true        # 每轮 review 后暂停
/research-pipeline "方向" — difficulty: nightmare        # 极限压力测试
/research-pipeline "方向" — venue: CVPR                 # 指定目标会议

八、无 GPU？没问题！

ARIS 提供两种免费 GPU 方案：

# CLAUDE.md 中配置
gpu: modal

# 一条命令跑实验，自动 scale-to-zero
modal run launcher.py

$30/月免费额度
无需 SSH/Docker
跑完自动停止

8.2 Vast.ai GPU 租赁

1 2	# CLAUDE.md 中配置 gpu: vast

自动租用最便宜的 GPU
用完即销毁
按小时计费

九、自定义与扩展

9.1 元优化：让 ARIS 自我改进

ARIS 可以优化自己：

# 启用被动日志
cp templates/claude-hooks/meta_logging.json .claude/settings.json

# 累积 5 次运行后分析
/meta-optimize

会分析你的使用数据，提出 SKILL.md 改进方案——reviewer 审核、用户批准。

9.2 飞书通知

配置后可在手机接收实验进度通知：

# 三种模式
feishu: off    # 关闭
feishu: push   # 推送通知
feishu: interactive  # 交互模式

9.3 Zotero + Obsidian 集成

如果你有 Zotero 文献库或 Obsidian 笔记，ARIS 可以直接读取：

Zotero 标注和高亮
Obsidian 研究笔记
本地 PDF 库

十、总结

ARIS 能为你做什么

场景	ARIS 能做到
没有研究方向	`/idea-discovery` 从大方向发现创新点
有方向但不知道做什么	`/idea-creator` 生成 8-12 个具体想法
不知道想法是否新颖	`/novelty-check` 多源检索验证
不知道想法够不够顶会	`/research-review` 顶会级评审
有结果不知道写不写论文	`/paper-writing` 自动写完整论文
审稿意见来了不知道怎么回	`/rebuttal` 安全生成辩护信
没有 GPU	Modal / Vast.ai 免费方案
没有 OpenAI API	MiniMax + GLM 国产方案

核心优势

零依赖：纯 Markdown 文件，没有框架要学
跨平台：Claude Code / Cursor / Trae / Codex CLI 都可用
国产友好：支持 MiniMax、GLM、Kimi 等国产模型
已验证：两篇顶会接收论文证明有效
可自优化：内置 meta-optimize 让系统自我改进

下一步

克隆项目：git clone https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep.git
安装 Skills：cp -r skills/* ~/.claude/skills/
开始使用：claude 然后 /idea-discovery "你的研究方向"

参考链接

ARIS 项目地址：https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep
ARIS-Code CLI 下载：https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/releases
PaperWeekly 收录文章：https://mp.weixin.qq.com/s/tDniVryVGjDkkkWl-5sTkQ
Featured on awesome-agent-skills：https://github.com/VoltAgent/awesome-agent-skills

特别致谢：ARIS 由一泽 Eze 开发维护，采用 MIT 许可证。这是一个完全开源的项目，欢迎 fork、star 和贡献。

如果这个工具对你有帮助，欢迎：

在 GitHub 上点一个 ⭐

分享给需要做科研的朋友

提交 Issue 或 PR 帮助改进