【工具】ARIS——让 Claude Code 在你睡觉时做科研
ARIS —— 让 Claude Code 在你睡觉时做科研
作者:一泽 Eze(@wanshuiyin)
项目地址:https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep
许可证:MIT
前言
今天要介绍的是一个让我眼前一亮的项目——ARIS(Auto-claude-code-research-in-sleep)。
顾名思义,这是一个让 Claude Code 在你睡觉时自动做科研的工具。当你第二天醒来,会发现论文已经被打分、弱点已经被定位、实验已经跑完、叙事已经重写——全自动。
这不是一个简单的 prompt 集合,而是一套完整的多模型协作科研工作流系统。核心理念是:
用 Claude Code 执行,用 Codex (GPT-5.4) 评审,两个模型互相制约,打破单模型自评的盲区。
更令人振奋的是,已经有两篇论文使用 ARIS 完成,最终被顶会接收:
| 论文 | 评分 | 会议 | 作者 | 技术栈 |
|---|---|---|---|---|
| CS 论文 | 8/10 “clear accept” | CS 会议 | @DefanXue & @Monglitay | Claude Code + GPT-5.4 |
| AAAI 论文 | 7/10 “good paper, accept” | AAAI 2026 Main Technical | @xinbo820-web | 纯 Codex CLI |
一、为什么需要 ARIS?
1.1 单模型自评的致命缺陷
传统的 AI 辅助科研通常是:
1 | 你 → 单个 LLM → 输出 |
问题在于:同一个模型审自己的输出,会陷入局部最优。就像自己出题自己做,永远发现不了问题。
类比 bandit 问题:单模型自审是 stochastic bandit(噪声可预测),跨模型审稿则是 adversarial bandit(审稿者会主动探测执行者未预料的弱点)。
1.2 双模型协作的威力
ARIS 的核心设计:
| 角色 | 模型 | 职责 |
|---|---|---|
| 执行者 (Executor) | Claude Code | 快速读论文、写代码、跑实验、操作文件 |
| 审稿者 (Reviewer) | Codex (GPT-5.4) | 严格评审、找弱点、压力测试、批判性分析 |
两个模型互不评自己的作业,形成真正的对抗性反馈循环:
1 | 用户 → Claude Code(执行) |
1.3 为什么是两个模型?
两个是打破自我博弈盲区的最小配置,且双人博弈收敛到 Nash 均衡的效率远高于多人博弈。增加更多审稿者只会增加 API 开销和协调成本,边际收益递减。
Claude Code 的优势是快速丝滑的执行,Codex (GPT-5.4) 虽然慢但审稿更严谨深入。两者速度 × 严谨的互补特性,比单模型自我对话效果更好。
二、ARIS 核心功能
2.1 四大工作流
工作流 1:Idea Discovery(想法发现)
1 | /idea-discovery "研究方向" |
从研究方向自动发现创新点,完整流程:
1 | research-lit → idea-creator → novelty-check → research-review → research-refine-pipeline |
输出:
IDEA_REPORT.md— 排名后的想法报告refine-logs/FINAL_PROPOSAL.md— 精炼后的提案refine-logs/EXPERIMENT_PLAN.md— 实验路线图
工作流 2:Auto Review Loop(自动审稿迭代)
1 | /auto-review-loop "论文主题" |
自动多轮审稿 → 修复 → 再审,全自动完成。
1 | Claude Code 实现修复 → Codex 评审 → 问题 → Claude Code 再修复 → ... → 直到达标 |
工作流 3:Paper Writing(论文写作)
1 | /paper-writing "NARRATIVE_REPORT.md" |
研究叙事 → 精修 PDF,完整流程:
1 | paper-plan → paper-figure → paper-write → paper-compile → auto-improvement-loop |
已内置 9 个会议模板:ICLR、NeurIPS、ICML、CVPR、ACL、AAAI、ACM、IEEE_JOURNAL、IEEE_CONF。
工作流 4:Rebuttal(审稿意见辩护)
1 | /rebuttal "paper/ + reviews" — venue: ICML, character limit: 5000 |
解析 review → 原子化 → 策略 → 起草 → 安全检查 → GPT-5.4 压力测试 → 定稿。
三道安全门:
- 🔒 不编造 — 每句话有出处
- 🔒 不过度承诺 — 没批准的不承诺
- 🔒 全覆盖 — 每个审稿意见都追踪
一键全流程:Research Pipeline
1 | /research-pipeline "研究方向" |
工作流 1 → 1.5 → 2 → 3 端到端全自动。
2.2 配套工具
| 命令 | 用途 |
|---|---|
/paper-slides |
论文 → Beamer PDF + PPTX + 演讲稿 |
/paper-poster |
论文 → A0/A1 海报 PDF |
/arxiv |
搜索下载 arXiv 论文 |
/semantic-scholar |
搜索正式发表的顶会论文 |
/meta-optimize |
ARIS 自优化——分析使用数据改进 SKILL.md |
/run-experiment |
部署实验到 GPU |
/experiment-bridge |
实验结果 → claim 判定 |
/novelty-check |
想法新颖性验证 |
2.3 支持的平台
ARIS 不锁定平台,全套 Markdown Skill 文件,零依赖:
| 平台 | 支持情况 |
|---|---|
| Claude Code | ✅ 原生支持 |
| Cursor | ✅ 适配指南见 CURSOR_ADAPTATION.md |
| Trae | ✅ 字节跳动 AI IDE,适配指南见 TRAE_ARIS_RUNBOOK_CN.md |
| Antigravity | ✅ Google Agent-First IDE |
| OpenClaw | ✅ |
| Codex CLI | ✅ 纯执行版本 |
| Windsurf | ✅ |
2.4 支持的模型组合
不需要 OpenAI API! 支持国产模型:
| 组合 | 说明 |
|---|---|
| MiniMax-M2.7 + GLM-5 | 零成本方案 |
| Kimi + GLM | 阿里百炼 Coding Plan |
| ModelScope | 免费额度 |
详见文档:
三、ARIS 设计哲学
Skill = 哲学 + 技术事实,不是操作手册。讲清 tradeoff 让 AI 自己选,不替它推理。
这是 ARIS 最重要的设计原则。每个 SKILL.md 不只是步骤说明,而是包含:
- 浏览哲学:遇到问题时的决策框架
- 技术事实:已知的方法局限和边界
- 权衡取舍:为什么这样设计而不是那样
四、快速安装
4.1 基础安装
1 | # 1. 克隆仓库 |
4.2 配置 Codex MCP(推荐)
1 | # 安装 Codex CLI |
4.3 无 API 成本方案
没有 OpenAI API?用国产模型:
1 | # 详见文档 |
五、使用示例
5.1 基础模式——给方向全自动
1 | /research-pipeline "离散扩散语言模型的 factorized gap" |
ARIS 会:
- 自动搜索文献
- 生成创新想法
- 验证新颖性
- 获取评审反馈
- 精炼方法
- 设计实验
5.2 精准模式——有参考论文
1 | /research-pipeline "改进方法 X" — ref paper: https://arxiv.org/abs/2406.04329, base repo: https://github.com/org/project |
ARIS 会:
- 读论文 → 找弱点 → 克隆代码 → 针对弱点用那套代码生成改进方案 → 跑实验 → 写论文
就像跟研究助手说:“读这篇论文,用这个 repo,找出哪里不行,然后修好它。”
5.3 Rebuttal 模式——审稿意见来了
1 | /rebuttal "paper/ + reviews" — venue: ICML, character limit: 5000 |
自动生成安全的 rebuttal,有三道安全门确保不编造、不过度承诺、全覆盖。
六、案例分析:使用 ARIS 完成的顶会论文
6.1 案例 1:CS 论文(8/10 “clear accept”)
| 项目 | 内容 |
|---|---|
| 评分 | 8/10 “clear accept” |
| 会议 | CS 会议 |
| 作者 | @DefanXue & @Monglitay |
| 技术栈 | Claude Code + GPT-5.4 |
使用流程:
- 用
/idea-discovery发现创新方向 - 用
/auto-review-loop多轮迭代 - 用
/paper-writing写完整论文 - 提交后用
/rebuttal处理审稿意见 - 成功接收!
6.2 案例 2:AAAI 2026 论文(7/10 “good paper, accept”)
| 项目 | 内容 |
|---|---|
| 评分 | 7/10 “good paper, accept” |
| 会议 | AAAI 2026 Main Technical |
| 作者 | @xinbo820-web |
| 技术栈 | 纯 Codex CLI(无需 Claude Code) |
关键启示:ARIS 不依赖 Claude Code。纯 Codex CLI 同样可以完成完整流程。
6.3 从想法到接收的全程记录
两篇论文都是全程 ARIS 完成——从 idea 到接收。
这证明了 ARIS 工作流的可行性:
- ✅ 不需要顶会论文写作经验
- ✅ 不需要昂贵的 GPU 资源
- ✅ 不需要多个 AI 工具拼凑
一套工作流,从想法到顶会接收。
七、重要参数说明
所有命令都支持内联参数配置:
| 参数 | 默认 | 说明 |
|---|---|---|
AUTO_PROCEED |
true |
自动继续最佳选项 |
human checkpoint |
false |
每轮 review 后暂停 |
sources |
all |
搜索来源:zotero、local、web、semantic-scholar |
venue |
ICLR |
目标会议 |
difficulty |
medium |
审稿对抗强度:medium / hard / nightmare |
compact |
false |
生成精简摘要文件 |
ref paper |
false |
参考论文 URL |
使用示例:
1 | /research-pipeline "方向" — AUTO_PROCEED: false # 在选 idea 时暂停 |
八、无 GPU?没问题!
ARIS 提供两种免费 GPU 方案:
8.1 Modal Serverless GPU
1 | # CLAUDE.md 中配置 |
- $30/月免费额度
- 无需 SSH/Docker
- 跑完自动停止
8.2 Vast.ai GPU 租赁
1 | # CLAUDE.md 中配置 |
- 自动租用最便宜的 GPU
- 用完即销毁
- 按小时计费
九、自定义与扩展
9.1 元优化:让 ARIS 自我改进
ARIS 可以优化自己:
1 | # 启用被动日志 |
会分析你的使用数据,提出 SKILL.md 改进方案——reviewer 审核、用户批准。
9.2 飞书通知
配置后可在手机接收实验进度通知:
1 | # 三种模式 |
9.3 Zotero + Obsidian 集成
如果你有 Zotero 文献库或 Obsidian 笔记,ARIS 可以直接读取:
- Zotero 标注和高亮
- Obsidian 研究笔记
- 本地 PDF 库
十、总结
ARIS 能为你做什么
| 场景 | ARIS 能做到 |
|---|---|
| 没有研究方向 | /idea-discovery 从大方向发现创新点 |
| 有方向但不知道做什么 | /idea-creator 生成 8-12 个具体想法 |
| 不知道想法是否新颖 | /novelty-check 多源检索验证 |
| 不知道想法够不够顶会 | /research-review 顶会级评审 |
| 有结果不知道写不写论文 | /paper-writing 自动写完整论文 |
| 审稿意见来了不知道怎么回 | /rebuttal 安全生成辩护信 |
| 没有 GPU | Modal / Vast.ai 免费方案 |
| 没有 OpenAI API | MiniMax + GLM 国产方案 |
核心优势
- 零依赖:纯 Markdown 文件,没有框架要学
- 跨平台:Claude Code / Cursor / Trae / Codex CLI 都可用
- 国产友好:支持 MiniMax、GLM、Kimi 等国产模型
- 已验证:两篇顶会接收论文证明有效
- 可自优化:内置 meta-optimize 让系统自我改进
下一步
- 克隆项目:
git clone https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep.git - 安装 Skills:
cp -r skills/* ~/.claude/skills/ - 开始使用:
claude然后/idea-discovery "你的研究方向"
参考链接
- ARIS 项目地址:https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep
- ARIS-Code CLI 下载:https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/releases
- PaperWeekly 收录文章:https://mp.weixin.qq.com/s/tDniVryVGjDkkkWl-5sTkQ
- Featured on awesome-agent-skills:https://github.com/VoltAgent/awesome-agent-skills
特别致谢:ARIS 由一泽 Eze 开发维护,采用 MIT 许可证。这是一个完全开源的项目,欢迎 fork、star 和贡献。
如果这个工具对你有帮助,欢迎:
- 在 GitHub 上点一个 ⭐
- 分享给需要做科研的朋友
- 提交 Issue 或 PR 帮助改进
