Skip to main content

Karpathy 一条推引爆 62k star:andrej-karpathy-skills 到底做了什么

AI-assisted

拆解 forrestchang/andrej-karpathy-skills 这个 2026 年 4 月 GitHub 周榜第一的项目——它把 Karpathy 对 LLM 编程毛病的吐槽打包成四条可安装的规则,本质是"内容即产品"

ℹ️This page has not been translated yet. Showing original Chinese content.

模型替你做出错误的假设,并且不加验证就照搬执行。它们不会处理自身的困惑、不会寻求澄清、不会发现不一致、不会权衡利弊,不会在该反驳的时候反驳

2026 年 1 月 27 日,Andrej Karpathy 在 X 上发了一条超长推——11 个小节、约 1400 词的编程随笔,记录他从 11 月的"80% 手写+20% agent"迅速切换到 12 月"80% agent+20% 润色"这个转变里踩到的坑。这条推最终冲到 769 万次浏览、3.9 万喜欢、3.6 万书签

三个月后,一个叫 forrestchang/andrej-karpathy-skills 的 GitHub 仓库上线,把 Karpathy 这条推里的吐槽打包成四条可安装的规则。两周之内冲到 62.7k star、5.5k fork,成为 2026 年 4 月 GitHub 周榜第一。

仓库本体:一个 Markdown 文件

Karpathy 原推首屏——四原则的所有灵感都来自这里

克劳德最近几周一直在写代码,以下是他的一些零散笔记

一篇关于从 80% 手写切换到 80% agent 编码的长反思——什么变好了、什么变糟了、当下的 LLM 编程到底是什么感觉。

Andrej KarpathyX (Twitter)2026-01-27

一、Karpathy 在吐槽什么

Karpathy 那篇长文实质上列了四个 LLM 编码的"慢性病"。

第一病:偷偷替你做假设

"最常见的一类错误是,模型替你做出错误的假设,然后不加验证就照搬执行。它们不管理自身的困惑、不寻求澄清、不展示不一致、不呈现权衡、该反驳时不反驳,而且还有点过于奉承。"

这是"共谋式错误"。你说"帮我加个登录",它不问用什么鉴权、不问要不要记住设备、不问 session 怎么管——直接铺一套它觉得合理的方案。等你 review 完发现和你想要的不一样时,它已经写了 500 行。

第二病:过度工程

"它们特别喜欢把代码和 API 搞得过于复杂,抽象层臃肿、不清理死代码。它们会用 1000 行代码实现一个低效、臃肿、脆弱的结构,你得像哄小孩一样说'嗯,你们为什么不直接这么做呢?',它们才会说'当然可以!'然后立刻精简到 100 行。"

这是 LLM 编码最典型的观察者效应:它在被"大方"地给予上下文的同时,会"大方"地回报以复杂度。Strategy 模式、Factory 模式、依赖注入——全都给你塞上。

第三病:改你没让它改的东西

"它们有时候还会因为不喜欢或者没完全理解而修改、删除一些注释和代码——即使这些改动和当前任务完全无关。"

你让它 fix 一个 bug,它顺手把旁边没写完的 TODO 注释删了,理由是"看起来不再需要"。

第四病:即使你在 CLAUDE.md 里写了规矩,它还是会犯

"以上问题,即使我在 CLAUDE.md 里做了一些简单的修复尝试,也依然存在。"

这是整条推里最扎心的一句。Karpathy 作为前 OpenAI 创始团队和 Tesla AI Director,都写不出让 Claude 彻底守规矩的 CLAUDE.md。


二、andrej-karpathy-skills 的解法

forrestchang 把这四条病的解法系统化成四条原则,打包进一个 CLAUDE.md 文件。

原则对应的病核心动作
Think Before Coding偷偷假设明说假设、列多种解读、困惑就停下来问、该反驳就反驳
Simplicity First过度工程只写被要求的最小代码;不写投机性的灵活性、错误处理、抽象
Surgical Changes越权改动只碰必须碰的;不顺手重构、不改风格;发现别的死代码只报告不删
Goal-Driven Execution方法错位给可验证的成功标准 + 测试,让模型自己 loop 到通过

第四条原则直接引用了 Karpathy 那条推里的另一段金句——"Leverage":

LLM 极其擅长循环直到达成具体目标,feel the AGI 的魔力大多来自这里。不要告诉它做什么,给它成功标准然后看它跑。

这是整个项目方法论层面的落脚点:前三条原则让 LLM 不要乱来;第四条原则告诉你怎么真正发挥它的长处。


三、怎么安装使用

方式 A:作为 Claude Code 插件(推荐先用这种)

/plugin marketplace add forrestchang/andrej-karpathy-skills
/plugin install andrej-karpathy-skills@karpathy-skills

装完后,所有项目的 Claude Code 对话都会自动遵守这四条原则。全局生效,随时 /plugin 关掉。

方式 B:手动复制 CLAUDE.md

进 repo → 打开 CLAUDE.md → 复制 → 粘贴到你项目根目录的 CLAUDE.md 里。只对这个项目生效。

仓库还额外提供了 CURSOR.md.cursor/rules/ 适配——一套内容覆盖主流 AI IDE。


四、为什么能冲到 62k star

这是一个值得拆解的现象。62.7k star 对一个"单文件 repo"来说是夸张的数字——作为对比,同期的 Microsoft markitdown(9k)、Addy Osmani 的 agent-skills(4.6k)加起来还没它多。

按影响权重拆解:

1. Karpathy IP 背书 ——同样的内容如果叫 forrestchang-skills 不可能破万。Karpathy 自带"前 OpenAI 创始团队 + Tesla AI Director + CS231n 讲师"的文化资本,他的推文自带"必读"标签。

2. 时机完美 —— Opus 4.7 在 4 月 16 日发布,over-engineering 的抱怨达到峰值。repo 正好卡在所有人都在找"让 Claude 别那么疯"的解药时出现。

3. 痛点普适 ——每个 Claude Code / Cursor 用户都踩过这四个坑,共情率接近 100%。

4. 门槛极低 —— 1 个文件或 2 行命令。star 成本低到可忽略,"不装就亏"。

5. 可验证感强 ——4 条原则清晰好记,容易截图转发。不像 1000 行的 prompt 工程指南让人望而却步。

6. 双语 README ——README.zh.md 直接吃掉中文 AI 圈流量,V2EX / 即刻 / 微博同步引爆。

7. 作者交叉推广 ——顶栏那句 "Check out my new project Multica" 把流量导去作者自己的商业化 agent 平台 multica-ai/multica这个 repo 本质是 Multica 的获客漏斗顶端。

8. Meta 契合 ——它讨论的"LLM 编码毛病",正是所有读者此刻在用 LLM 编码时的现场。读和用合一,转化率极高。

一句话:它卖的不是代码、不是工具,而是把 Karpathy 的情绪打包成可安装的规矩——这是 2026 年 AI 编程圈最典型的"内容即产品"案例。


五、我的使用建议

先用方式 A 全局装上。看看对你写工具、写脚本时有没有体感改善——尤其是让 Claude 改别人的代码时,它顺手乱改的毛病是否减少。

一两周后再决定要不要合并进项目 CLAUDE.md。每个项目的 CLAUDE.md 已经塞满了领域知识(设计系统、组件规范、部署流程),而 Karpathy 这套是通用方法论。两者不冲突,可以叠加——但时机要等你真的确认它有用再合。

注意代价:它会让 Claude 问话变多,习惯了"一句话生成"的人会觉得烦;该做的轻微清理它也可能不做(太守规矩);对非常模糊的探索型任务反而束手束脚。

更深层的价值:它逼你把需求说清楚——这恰好也是所有高质量软件工程的前提。

值得关注的后续:forrestchang 本人同时在推 Multica——一个"open-source managed agents platform",把 skills 机制产品化。如果这套四原则最终成为事实标准,Multica 就是它的商业化载体。关注一下这条线。


参考资源

andrej-karpathy-skills GitHub 仓库

一个用来改善 Claude Code 行为的 CLAUDE.md 文件,源自 Karpathy 对 LLM 编程毛病的观察。

forrestchangGitHub2026-04

Multica——开源的 managed agents 平台

开源的 managed agents 平台。让编码 agent 变成真正的队友。

forrestchangGitHub2026-04

Comments

Table of Contents

Karpathy 一条推引爆 62k star:andrej-karpathy-skills 到底做了什么 | Yu's Cyber Desk