AgentCode V0 先做 20 道高质量工程题,训练真实交付和代码审核能力。agentcode.codes
ENGINEERING PRACTICE / TASK + REVIEW
真实工程题库:交付任务与审核 PR
AgentCode 保留熟悉的题库体验,但训练内容换成真实工程任务和 PR 审核。你需要完成改动、补测试、读 diff、看 runner 结果,并判断代码能不能合并。
SEED CHALLENGES20
TASK MODE10
REVIEW MODE10
练习题库
查看全部| # | 题目 | 模式 | 难度 | 通过率 | 状态 |
|---|---|---|---|---|---|
| 001 | 题目SymPy Point2D AI 补丁审查真实 SWE-bench/SymPy 案例:判断一个看似修复 evaluate(False) 的 AI PR 是否引入回归。 | 模式Review | 难度Mid | 通过率31.4% | 状态Ready |
| 002 | 题目PR 删除了权限校验识别看似通过测试的 PR 是否引入越权风险。 | 模式Review | 难度Senior | 通过率28.5% | 状态需审核 |
| 003 | 题目阻止异步任务重复执行定位队列重复消费、锁粒度和幂等性问题。 | 模式Task | 难度Senior | 通过率22.9% | 状态Ready |
| 004 | 题目测试很多但没测核心风险判断测试数量和测试质量之间的差异。 | 模式Review | 难度Mid | 通过率36.8% | 状态Ready |
| 005 | 题目实现基础 Rate Limit在不破坏兼容性的情况下增加参数和频率校验。 | 模式Task | 难度Mid | 通过率47.0% | 状态Draft |