Ir al contenido principal
El tweet de Karpathy explotó a 62 mil estrellas: ¿Qué hizo exactamente andrej-karpathy-skills? 的文章封面图

El tweet de Karpathy explotó a 62 mil estrellas: ¿Qué hizo exactamente andrej-karpathy-skills?

Asistido por IA

Desmantelar forrestchang/andrej-karpathy-skills, el proyecto número uno en la lista semanal de GitHub en abril de 2026: empaqueta las quejas de Karpathy sobre los problemas de programación de LLM en cuatro reglas instalables. La esencia es "el contenido es producto".

The models make wrong assumptions on your behalf and just run along with them without checking. They don't manage their confusion, don't seek clarifications, don't surface inconsistencies, don't present tradeoffs, don't push back when they should.

El 27 de enero de 2026, Andrej Karpathy publicó un tweet muy largo en X, un ensayo de programación de 11 secciones y aproximadamente 1400 palabras, que registra los obstáculos que encontró durante la transición de "80% escritura a mano + 20% agente" en noviembre a "80% agente + 20% pulido" en diciembre. El tweet finalmente alcanzó 7,69 millones de visitas, 39.000 me gusta y 36.000 marcadores.

Tres meses después, se lanzó un repositorio de GitHub llamado forrestchang/andrej-karpathy-skills, que empaquetaba el tweet de Karpathy en cuatro reglas instalables. En dos semanas, alcanzó 62,7 mil estrellas y 5,5 mil bifurcaciones, convirtiéndose en el número 1 en la lista semanal de GitHub en abril de 2026.

Ontología de almacén: un archivo Markdown.

Publicación original de Karpathy: toda la inspiración para los Cuatro Principios proviene de aquí

A few random notes from claude coding quite a bit last few weeks

A thread-length reflection on switching from 80% manual coding to 80% agent coding in one month—what got better, what got worse, and what LLM coding actually feels like now.

Andrej KarpathyX (Twitter)2026-01-27
Visitar

1. ¿De qué se queja Karpathy?

El extenso artículo de Karpathy enumera esencialmente cuatro "condiciones crónicas" codificadas por LLM.

La primera enfermedad: hacer suposiciones en secreto

"El tipo de error más común es que los modelos hacen suposiciones incorrectas para usted y luego las aplican sin validarlas. No manejan su propia confusión, no buscan aclaraciones, no muestran inconsistencias, no presentan compensaciones, no refutan cuando llega el momento de refutar y son un poco demasiado halagadores".

Se trata de un "error de colusión". Usted dice "Agregar un inicio de sesión para mí", no pregunta qué autenticación usar, si recordar el dispositivo o cómo administrar la sesión; simplemente presenta una solución que considera razonable. Para cuando termines de revisar y descubras que es diferente de lo que quieres, ya tendrá 500 líneas escritas.

La segunda enfermedad: el exceso de ingeniería

"En particular, les gusta complicar demasiado su código y sus API, inflar las capas de abstracción y no limpiar el código muerto. Usarán 1000 líneas de código para implementar una estructura ineficiente, inflada y frágil, y tienes que persuadir como un niño y decir: 'Bueno, ¿por qué no haces esto?', antes de que digan: '¡Por supuesto!' y luego redúzcalo inmediatamente a 100 líneas."

Este es el efecto de observador más típico de la codificación LLM: si bien se le da un contexto "generosamente", recompensará "generosamente" la complejidad**. Modo de estrategia, modo de fábrica, inyección de dependencia: todo se le proporciona.

La tercera enfermedad: cambiar algo que no pediste cambiar

"A veces modifican o eliminan algunos comentarios y códigos porque no les gusta o no los entienden completamente, incluso si estos cambios no tienen nada que ver con la tarea actual".

Le pide que corrija un error y elimina convenientemente el comentario TODO inacabado que aparece junto a él con el argumento de que "parece que ya no es necesario".

Enfermedad 4: Incluso si escribes las reglas en CLAUDE.md, aún así se romperá

"El problema anterior todavía existe incluso si hice algunos intentos simples de reparación en CLAUDE.md."

Esta es la frase más desgarradora de todo el tweet. Karpathy, ex miembro del equipo fundador de OpenAI y director de IA de Tesla, no pudo escribir CLAUDE.md que mantendría a Claude completamente a raya.


2. Solución a andrej-karpathy-skills

forrestchang Sistematizar las soluciones a estas cuatro enfermedades en cuatro principios y empaquetarlos en un archivo CLAUDE.md.

PrincipiosEnfermedades correspondientesAcciones principales
Piense antes de codificarAsumiendo en secretoExprese sus suposiciones con claridad, enumere múltiples interpretaciones, deténgase y pregunte si está confundido y refute cuando sea necesario
La simplicidad es lo primeroSobreingenieríaEscriba sólo el código mínimo requerido; no escriba flexibilidad especulativa, manejo de errores, abstracción
Cambios quirúrgicosCambios no autorizadosToca sólo lo necesario; no refactorice ni cambie el estilo; solo informa otros códigos muertos pero no los eliminas
Ejecución basada en objetivosDesalineación del métodoProporcione criterios de éxito verificables + pruebas y deje que el modelo pase por sí solo

El cuarto principio es una referencia directa a otra frase famosa del tweet de Karpathy: "Apalancamiento":

LLMs are exceptionally good at looping until they meet specific goals and this is where most of the feel the AGI magic is to be found. Don't tell it what to do, give it success criteria and watch it go.

Este es el punto de apoyo de toda la metodología del proyecto: **Los primeros tres principios evitan que el LLM pierda el tiempo; el cuarto principio le dice cómo aprovechar verdaderamente sus fortalezas. **


3. Cómo instalar y usar

Método A: como complemento de Claude Code (se recomienda utilizarlo primero)

/plugin marketplace add forrestchang/andrej-karpathy-skills
/plugin install andrej-karpathy-skills@karpathy-skills

Después de la instalación, el diálogo del Código Claude de todos los proyectos cumplirá automáticamente con estos cuatro principios. Tiene efecto global y puede desactivarse en cualquier momento mediante /plugin.

Método B: copiar manualmente CLAUDE.md

Ingrese al repositorio → abra CLAUDE.md → copie → pegue en CLAUDE.md en el directorio raíz de su proyecto. Sólo efectivo para este proyecto.

El repositorio también proporciona adaptaciones CURSOR.md y .cursor/rules/ adicionales: un conjunto de contenido que cubre los principales IDE de IA.


4. ¿Por qué puede alcanzar las 62k estrellas?

Este es un fenómeno que vale la pena analizar. 62,7 mil estrellas es un número exagerado para un "repositorio de un solo archivo"; en comparación, el descuento de Microsoft (9 mil) y las habilidades del agente de Addy Osmani (4,6 mil) en el mismo período combinados no son tantas.

Desglosado por peso de impacto:

1. Respaldo de IP de Karpathy: el mismo contenido no puede exceder los 10 000 si se llama forrestchang-skills. Karpathy viene con el capital cultural del "ex equipo fundador de OpenAI + director de IA de Tesla + instructor de CS231n", y sus tweets vienen con una etiqueta de "lectura obligada".

2. Momento perfecto: Opus 4.7 se lanzó el 16 de abril y las quejas por exceso de ingeniería alcanzaron su punto máximo. El repositorio apareció justo cuando todos buscaban un antídoto para "evitar que Claude se volviera tan loco".

3. Los puntos débiles son universales: todos los usuarios de Claude Code/Cursor han superado estos cuatro obstáculos y la tasa de empatía se acerca al 100%.

4. El umbral es extremadamente bajo: 1 archivo o 2 líneas de comandos. El costo de una estrella es tan bajo que puede ignorarse. "Si no lo instalas, perderás".

5. Fuerte sentido de verificabilidad: los 4 principios son claros y fáciles de recordar, y fáciles de capturar y reenviar. A diferencia de la guía de proyectos de 1000 líneas, que es prohibitiva.

6. README bilingüe ——README.zh.md devora directamente el tráfico del círculo de IA chino, V2EX/instantáneamente/detona simultáneamente en Weibo.

7. Promoción cruzada por parte del autor - La frase en la columna superior "Mira mi nuevo proyecto Multica" dirige el tráfico a la plataforma del agente comercial del autor multica-ai/multica. **Este repositorio es esencialmente la parte superior del embudo de adquisición de clientes de Multica. **

8. Meta fit: los "errores de codificación LLM" que analiza son exactamente lo que todos los lectores experimentan cuando codifican con LLM. La lectura y el uso están integrados y la tasa de conversión es extremadamente alta.

En una palabra: lo que vende no es código ni herramientas, sino empaquetar las emociones de Karpathy en reglas instalables; este es el caso más típico de "el contenido es producto" en el círculo de programación de IA en 2026.


5. Mis sugerencias de uso

Primero use el método A para instalar globalmente. Vea si mejora su experiencia al escribir herramientas y scripts, especialmente cuando deja que Claude cambie el código de otras personas, si reduce el problema de realizar cambios aleatorios.

Después de una semana o dos decidiremos si lo fusionaremos con el proyecto CLAUDE.md. CLAUDE.md de cada proyecto ya está lleno de conocimiento del dominio (sistema de diseño, especificación de componentes, proceso de implementación), mientras que el conjunto de Karpathy es una metodología general. Los dos no entran en conflicto y pueden superponerse, pero el momento debe esperar hasta que esté realmente seguro de que es útil.

Preste atención al costo: Hará que Claude haga más preguntas, lo que resultará molesto para las personas que están acostumbradas a "generar en una oración"; puede que no haga la ligera limpieza que se debería hacer (demasiado estricta); se verá limitado por tareas de exploración muy vagas.

Valor más profundo: Le obliga a establecer claramente sus requisitos, lo que resulta ser el requisito previo para toda ingeniería de software de alta calidad.

Seguimiento digno de mención: el propio forrestchang también está promocionando Multica, una "plataforma de agentes administrados de código abierto" para producir el mecanismo de habilidades. Si este conjunto de cuatro principios finalmente se convierte en el estándar de facto, Multica será su vehículo comercial. Presta atención a esta línea.


Recursos de referencia

andrej-karpathy-skills GitHub Repo

A single CLAUDE.md file to improve Claude Code behavior, derived from Andrej Karpathy's observations on LLM coding pitfalls.

forrestchangGitHub2026-04
Visitar

Multica - open-source managed agents platform

The open-source managed agents platform. Turn coding agents into real teammates.

forrestchangGitHub2026-04
Visitar

Comentarios

Tabla de contenidos

El tweet de Karpathy explotó a 62 mil estrellas: ¿Qué hizo exactamente andrej-karpathy-skills? | El Escritorio Cyber de Yu