Aller au contenu principal
gstack
gstack : Quand le PDG de YC met son expérience entrepreneuriale dans Claude Code 的文章封面图

gstack : Quand le PDG de YC met son expérience entrepreneuriale dans Claude Code

Assisté par IA

Garry Tan Qu'est-ce que le gstack open source, quels problèmes résout-il, flux de travail de base et positionnement écologique de l'outil

##Présentation

Dans les notes précédentes, nous avons exploré diverses « solutions d'amélioration » dans l'écosystème Claude Code, depuis la boucle infinie de Ralph Wiggum jusqu'au développement axé sur les spécifications de GSD. Ils essaient tous de répondre à la même question : **Comment faire passer la programmation de l'IA de « l'adaptation » à une « livraison fiable » ? **

La réponse de Ralph est "tout redémarrer" - utilisez un nouveau processus à chaque fois pour éviter la pourriture du contexte. La réponse de GSD est « Spécification Driven » : garantir la qualité grâce à des cycles structurés de planification et de validation des phases. Mais que se passe-t-il si vous souhaitez non seulement un système d’exécution, mais une équipe d’ingénierie virtuelle complète ? Le PDG prend les décisions relatives aux produits, le responsable de l'ingénierie examine l'architecture, le concepteur contrôle l'expérience, le QA exécute de vrais tests de navigateur et l'ingénieur de publication gère le lancement... tout cela est joué par l'IA et est commandé par vous.

C'est l'idée centrale de gstack.

Qu'est-ce que Gstack

gstack

Créé par Garry Tan, PDG de Y Combinator, l'ensemble de compétences open source basé sur les rôles contient plus de 23 commandes Slash, transformant Claude Code d'un simple assistant IA en une équipe d'ingénierie virtuelle. Chaque compétence correspond à un rôle professionnel - PDG, responsable ingénierie, concepteur, responsable QA, responsable de la sécurité, ingénieur de publication - donnant à l'IA différents modes de pensée et perspectives professionnelles.

Source: GitHubVisiter

Garry Tan, le créateur de gstack, possède une riche expérience technique et entrepreneuriale : il a commencé à écrire du code à l'âge de 14 ans, est diplômé de Stanford Computer Engineering, est le 10e employé de Palantir, a cofondé Posterous (acquis plus tard par Twitter) et est président-directeur général de Y Combinator depuis 2023.

Il a utilisé gstack pour publier plus de 600 000 lignes de code de production (35 % de tests) en 60 jours, soit en moyenne plus de 10 000 lignes par jour, tout en continuant à exécuter YC à plein temps. L'un des projets, garylist.org, a été lancé en 21 jours, avec 150 000 lignes de code et 35 % de couverture de tests. Selon ses propres mots, la qualité du code dépasse le précédent projet entrepreneurial pour lequel il a dépensé 5 millions de dollars, deux ans et 10 ingénieurs.

Depuis que le projet est devenu open source le 11 mars 2026, il est passé de la v0 à la v0.15.1.0 en 3 semaines et GitHub a reçu plus de 60 500 étoiles. Licence MIT, entièrement open source.

gstack - Claude Code Skills

23+ opinionated skills that transform Claude Code from a single AI assistant into a virtual engineering team.

Garry TanGitHub
Visiter

La place de gstack dans l'écosystème des outils

DimensionsCode Claude natifRalph WiggumGSDKit de spécificationsSuperpouvoirsgstack
Positionnement de baseAssistant de codage universel de l'IAItération de boucle infinieIngénierie contextuelle + axée sur les spécificationsExigences → Spécifications → TâchesDiscipline des processus + TDDÉquipe virtuelle basée sur les rôles
Modèle de baseProgrammation conversationnelleBoucle Bash + Nouveau processusFeuille de route par phasesSpécification → Plan → TâchesPipeline de développement strictProcessus de sprint en sept étapes
Implication humaineConversations en directIntervention (AFK)Vérification par étapeApprobation des spécificationsValidation par étapeRévision des rôles par étape
Capacités uniquesCodage de baseItération illimitéeContexte Gestion de la pourritureSuivi des exigencesTDD forcéAutomatisation du navigateur + révision multi-rôle
Convient aux scénariosTâches simplesItération continueGestion de projets à grande échelleDes projets aux exigences rigoureusesAssurance qualité de l'ingénierieDéveloppement de produits complet

Un modèle clé peut être vu dans le tableau : **Ces outils ne se font pas concurrence, mais résolvent des problèmes de programmation d'IA dans différentes dimensions. **

Superpowers utilise la discipline des processus pour garantir la qualité du code (TDD obligatoire, dialogue structuré, plan de mise en œuvre) ; GSD utilise l'ingénierie de contexte pour gérer des projets complexes (planification des phases, nouveau contexte du sous-agent, état du système de fichiers) ; gstack utilise la décomposition des rôles pour améliorer la qualité de la prise de décision (le point de vue du PDG examine les produits, les responsables de l'ingénierie examinent l'architecture, le contrôle qualité exécute de vrais navigateurs).

Pour faire simple, Superpowers est basé sur des garde-fous de processus, et gstack est basé sur la conception de rôles : le premier est adapté à la mise en œuvre de projets de 1 à N, et le second est adapté à la construction de produits de 0 à 1. ** Les deux sont des produits complémentaires plutôt que concurrents. **

Workflow de base : les sept étapes du Sprint

gstack organise l'ensemble du processus de développement en un cycle de Réfléchir → Planifier → Construire → Révision → Test → Expédier → Réfléchir, appelé "Le Sprint" - pas un Sprint agile, mais un rythme de développement de "les rôles apparaissent en séquence".

1. Réfléchissez – Clinique de produits

/office-hours

C'est la compétence la plus distinctive de Gstack. L’inspiration vient directement des heures de bureau de YC : les entrepreneurs vont à la rencontre des partenaires de YC et se livrent à une introspection. L'IA vous posera 6 questions forçantes :

  1. Qui en a spécifiquement besoin ?
  2. Et s’ils ne l’ont pas aujourd’hui ?
  3. Pourquoi cette question est-elle urgente maintenant ?
  4. Comment savez-vous que cela fonctionne ?
  5. Que se passe-t-il si vous ne faites rien ?
  6. Quelle est la plus petite version que vous puissiez publier ?

Le but n'est pas de vous aider à écrire du code, mais de réexaminer le problème lui-même avant d'écrire du code.

2. Plan — Examen multi-rôles

/plan-ceo-review    # CEO 视角:寻找 10 星级产品
/plan-eng-review    # 工程经理:锁定架构和边界
/plan-design-review # 设计师:评分 0-10,说明如何做到 10 分
/autoplan           # 自动依次运行三个审查

L'examen du PDG est essentiellement un « mode fondateur » : au lieu d'exécuter les exigences littéralement, vous prenez du recul et demandez « Quel est le véritable objectif de ce produit ? Il prend en charge quatre modes : étendre la portée, développer sélectivement, maintenir la portée et réduire la portée.

3. Build — implémentation du codage

Commencez à coder selon le plan approuvé. Cette étape utilise les fonctionnalités standard de Claude Code.

4. Examen — Examen parallèle par des experts

/review

Cette compétence envoie 7 sous-agents parallèles en même temps pour examiner le code sous 7 perspectives : tests, maintenabilité, sécurité, performances, migration de données, contrat API et attaque de l'équipe rouge. Les problèmes évidents seront automatiquement résolus.

5. Test — Contrôle qualité du vrai navigateur

/qa

Pas un test pratique. La compétence QA lance un véritable navigateur Chromium sans tête, ouvre votre application, clique sur les boutons, remplit les formulaires et prend des captures d'écran - tout comme le ferait un vrai testeur. Corrigez automatiquement les bogues, générez des tests de régression et revérifiez une fois les bogues découverts.

6. Expédier – publication en un clic

/ship

Synchronisez automatiquement la branche principale, exécutez des tests, examinez les différences, mettez à jour les numéros de version et CHANGELOG, validez, poussez, créez des PR. Si le projet ne dispose pas d'un cadre de test, il en créera même un en premier.

7. Réfléchir – réviser et apprendre

/retro

Rapport hebdomadaire de style responsable de l'ingénierie : analysez l'historique des validations, le taux de tests et les tendances en matière de qualité du code. Soutenez l'analyse d'équipes composées de plusieurs personnes et suivez des indicateurs tels que le « nombre de jours de sortie consécutifs ».

Pourquoi ça marche : principes techniques

Browse Daemon : mettez les yeux sur l'IA

La contribution technique la plus unique de gstack est le Browse Daemon - une instance Chromium persistante sans tête qui communique via HTTP localhost. Le premier appel lance le navigateur (~ 3 secondes) et chaque commande suivante ne prend que 100 à 200 ms. Cela signifie que l'IA peut réellement voir votre application, plutôt que de deviner la structure du DOM.

Il introduit également le Ref System (référence d'élément @e1, @e2) pour localiser les éléments via l'arborescence d'accessibilité sans écrire de sélecteurs CSS. Il s'agit d'une « contribution véritablement technique » généralement reconnue par la communauté (y compris les critiques).

Répartition des rôles : pas un agent, mais une équipe

Ce que fait gstack, c'est désassembler tous les rôles en fichiers d'invite indépendants, permettant à Claude Code de basculer vers les perspectives de différents rôles à différentes étapes pour réviser le code. Il s’agit essentiellement d’une ingénierie d’invite raffinée.

L'idée principale est la suivante : **La planification n'est pas égale à la révision, la révision n'est pas égale à la publication, et le goût du fondateur et la rigueur de l'ingénierie sont des modes de pensée complètement différents. ** Au lieu de laisser un agent général faire tout, changez de « mode cérébral » si nécessaire : réflexion du fondateur, rigueur technique, révision paranoïaque, exécution rapide.

Trois grandes philosophies

ETHOS.md de gstack enregistre trois concepts fondamentaux :

  1. Boil the Lake : lorsque l'IA ramène le coût marginal de l'exhaustivité à zéro, choisissez toujours une implémentation complète : couverture de test à 100 %, tous les cas extrêmes, tous les chemins d'erreur. Les « raccourcis de version » sont une pensée ancienne.

  2. Rechercher avant de construire : Trois niveaux de connaissances : modèles éprouvés, solutions nouvelles et populaires et premiers principes. Commencez par comprendre ce que chacun fait, remettez en question ses hypothèses et découvrez pourquoi les solutions habituelles sont fausses.

  3. Souveraineté de l'utilisateur : recommandation d'IA, prise de décision humaine. Même si deux modèles d’IA parviennent à un consensus, le jugement de l’utilisateur prime toujours, car l’utilisateur possède une connaissance du domaine, une perspective stratégique et des goûts.

Les limites et controverses de gstack

La réaction de la communauté à gstack est probablement l’outil de programmation d’IA le plus polarisant.

Le bon côté : les fondateurs et les constructeurs non techniques conviennent généralement que les compétences de « réflexion produit » telles que /office-hours et /plan-ceo-review ont aidé de nombreux développeurs indépendants à réexaminer l'orientation du produit avant de commencer à coder. La revue technique (/review) peut en effet découvrir certaines vulnérabilités de sécurité cachées. Ce modèle d’examen parallèle multi-angles a une valeur pratique.

Le côté questionnement est également très direct :

  • L'indicateur LOC est peu significatif : 600 000 lignes de code en 60 jours. Le nombre de lignes de code n'est jamais un indicateur de qualité. Une grande quantité de code peut n’être qu’un échafaudage et un passe-partout.
  • Essentiellement un modèle d'invite : chaque compétence est un fichier SKILL.md et le seuil technique n'est pas élevé. La vraie valeur ne réside pas dans le fichier lui-même, mais dans la qualité de la conception de l'invite.
  • Limitations du code d'auto-révision de l'IA : /review Laisser l'IA réviser le code écrit par l'IA équivaut à corriger vos propres devoirs. Le parallélisme multirôle peut atténuer ce problème, mais il s’agit toujours du même modèle.
  • Bonus effet célébrité : Si le fondateur n'est pas le PDG de YC, il y a de fortes chances que ce projet ne reçoive pas une telle attention.

Mon avis : Mis à part les controverses, les éléments vraiment précieux de gstack sont au nombre de deux : la technologie d'automatisation du navigateur de Browse Daemon et le modèle de conception de décomposition des rôles. Rien de tout cela ne dépend de qui est Garry Tan. L'importance fondamentale de la roleisation ne se situe pas au niveau technique, mais au niveau comportemental : elle vous aide à organiser votre flux de travail d'IA de manière plus consciente, plutôt que de tout confier à un agent général.

gstack convient au forking et à la personnalisation. Vous pouvez acquérir les compétences dont vous avez besoin et modifier les invites souhaitées, plutôt que de toutes les copier.

Ressources vidéo

Better Stack: The Toolkit from YC CEO That Makes Claude Code Amazing
Better Stack Une introduction complète et une démonstration pratique de gstack. L'ensemble du processus, depuis l'installation jusqu'à l'utilisation de /plan-ceo-review pour compléter une fonctionnalité réelle, montre comment CEO Review réexamine les exigences du point de vue du fondateur et comment gstack organise le processus de révision multi-rôle. 7 minutes de contenu condensé, adapté pour comprendre rapidement les principales méthodes de travail de gstack.YouTube
YC CEO 50 天连发 100 个 PR——他的 8 个 Claude Code Skills
Le système démonte les huit compétences principales de gstack : CEO Review (réflexion sur le produit du fondateur), Review (examen technique strict), Parcourir (interaction avec le navigateur de 200 ms), QA (assurance qualité automatisée), Ship (version en un clic), etc. Contient une citation de l'idée originale de Garry Tan sur « Les outils d'IA ne devraient pas avoir un seul mode vague ».YouTube

Écrivez à la fin

gstack représente une direction intéressante pour les outils de programmation de l'IA : non pas rendre l'IA plus autonome (voie de Ralph), ni rendre le processus plus rigide (voie des Superpuissances), mais laisser l'IA jouer différents rôles pour améliorer la qualité des décisions. Sa controverse illustre simplement la richesse de l’écosystème de programmation de l’IA : aucune solution ne convient à tout le monde.

Si gstack vous intéresse, l'étape suivante consiste à lire le Chapitre pratique - un tutoriel étape par étape depuis l'installation jusqu'à l'exécution du workflow complet.


Lecture connexe :

Commentaires

Table des matières

gstack : Quand le PDG de YC met son expérience entrepreneuriale dans Claude Code | Le Bureau Cyber de Yu