
gstack : Quand le PDG de YC met son expérience entrepreneuriale dans Claude Code
Garry Tan Qu'est-ce que le gstack open source, quels problèmes résout-il, flux de travail de base et positionnement écologique de l'outil
##Présentation
Dans les notes précédentes, nous avons exploré diverses « solutions d'amélioration » dans l'écosystème Claude Code, depuis la boucle infinie de Ralph Wiggum jusqu'au développement axé sur les spécifications de GSD. Ils essaient tous de répondre à la même question : **Comment faire passer la programmation de l'IA de « l'adaptation » à une « livraison fiable » ? **
La réponse de Ralph est "tout redémarrer" - utilisez un nouveau processus à chaque fois pour éviter la pourriture du contexte. La réponse de GSD est « Spécification Driven » : garantir la qualité grâce à des cycles structurés de planification et de validation des phases. Mais que se passe-t-il si vous souhaitez non seulement un système d’exécution, mais une équipe d’ingénierie virtuelle complète ? Le PDG prend les décisions relatives aux produits, le responsable de l'ingénierie examine l'architecture, le concepteur contrôle l'expérience, le QA exécute de vrais tests de navigateur et l'ingénieur de publication gère le lancement... tout cela est joué par l'IA et est commandé par vous.
C'est l'idée centrale de gstack.
Qu'est-ce que Gstack
Créé par Garry Tan, PDG de Y Combinator, l'ensemble de compétences open source basé sur les rôles contient plus de 23 commandes Slash, transformant Claude Code d'un simple assistant IA en une équipe d'ingénierie virtuelle. Chaque compétence correspond à un rôle professionnel - PDG, responsable ingénierie, concepteur, responsable QA, responsable de la sécurité, ingénieur de publication - donnant à l'IA différents modes de pensée et perspectives professionnelles.
Garry Tan, le créateur de gstack, possède une riche expérience technique et entrepreneuriale : il a commencé à écrire du code à l'âge de 14 ans, est diplômé de Stanford Computer Engineering, est le 10e employé de Palantir, a cofondé Posterous (acquis plus tard par Twitter) et est président-directeur général de Y Combinator depuis 2023.
Il a utilisé gstack pour publier plus de 600 000 lignes de code de production (35 % de tests) en 60 jours, soit en moyenne plus de 10 000 lignes par jour, tout en continuant à exécuter YC à plein temps. L'un des projets, garylist.org, a été lancé en 21 jours, avec 150 000 lignes de code et 35 % de couverture de tests. Selon ses propres mots, la qualité du code dépasse le précédent projet entrepreneurial pour lequel il a dépensé 5 millions de dollars, deux ans et 10 ingénieurs.
Depuis que le projet est devenu open source le 11 mars 2026, il est passé de la v0 à la v0.15.1.0 en 3 semaines et GitHub a reçu plus de 60 500 étoiles. Licence MIT, entièrement open source.
gstack - Claude Code Skills
23+ opinionated skills that transform Claude Code from a single AI assistant into a virtual engineering team.
La place de gstack dans l'écosystème des outils
| Dimensions | Code Claude natif | Ralph Wiggum | GSD | Kit de spécifications | Superpouvoirs | gstack |
|---|---|---|---|---|---|---|
| Positionnement de base | Assistant de codage universel de l'IA | Itération de boucle infinie | Ingénierie contextuelle + axée sur les spécifications | Exigences → Spécifications → Tâches | Discipline des processus + TDD | Équipe virtuelle basée sur les rôles |
| Modèle de base | Programmation conversationnelle | Boucle Bash + Nouveau processus | Feuille de route par phases | Spécification → Plan → Tâches | Pipeline de développement strict | Processus de sprint en sept étapes |
| Implication humaine | Conversations en direct | Intervention (AFK) | Vérification par étape | Approbation des spécifications | Validation par étape | Révision des rôles par étape |
| Capacités uniques | Codage de base | Itération illimitée | Contexte Gestion de la pourriture | Suivi des exigences | TDD forcé | Automatisation du navigateur + révision multi-rôle |
| Convient aux scénarios | Tâches simples | Itération continue | Gestion de projets à grande échelle | Des projets aux exigences rigoureuses | Assurance qualité de l'ingénierie | Développement de produits complet |
Un modèle clé peut être vu dans le tableau : **Ces outils ne se font pas concurrence, mais résolvent des problèmes de programmation d'IA dans différentes dimensions. **
Superpowers utilise la discipline des processus pour garantir la qualité du code (TDD obligatoire, dialogue structuré, plan de mise en œuvre) ; GSD utilise l'ingénierie de contexte pour gérer des projets complexes (planification des phases, nouveau contexte du sous-agent, état du système de fichiers) ; gstack utilise la décomposition des rôles pour améliorer la qualité de la prise de décision (le point de vue du PDG examine les produits, les responsables de l'ingénierie examinent l'architecture, le contrôle qualité exécute de vrais navigateurs).
Pour faire simple, Superpowers est basé sur des garde-fous de processus, et gstack est basé sur la conception de rôles : le premier est adapté à la mise en œuvre de projets de 1 à N, et le second est adapté à la construction de produits de 0 à 1. ** Les deux sont des produits complémentaires plutôt que concurrents. **
Workflow de base : les sept étapes du Sprint
gstack organise l'ensemble du processus de développement en un cycle de Réfléchir → Planifier → Construire → Révision → Test → Expédier → Réfléchir, appelé "Le Sprint" - pas un Sprint agile, mais un rythme de développement de "les rôles apparaissent en séquence".
1. Réfléchissez – Clinique de produits
/office-hoursC'est la compétence la plus distinctive de Gstack. L’inspiration vient directement des heures de bureau de YC : les entrepreneurs vont à la rencontre des partenaires de YC et se livrent à une introspection. L'IA vous posera 6 questions forçantes :
- Qui en a spécifiquement besoin ?
- Et s’ils ne l’ont pas aujourd’hui ?
- Pourquoi cette question est-elle urgente maintenant ?
- Comment savez-vous que cela fonctionne ?
- Que se passe-t-il si vous ne faites rien ?
- Quelle est la plus petite version que vous puissiez publier ?
Le but n'est pas de vous aider à écrire du code, mais de réexaminer le problème lui-même avant d'écrire du code.
2. Plan — Examen multi-rôles
/plan-ceo-review # CEO 视角:寻找 10 星级产品
/plan-eng-review # 工程经理:锁定架构和边界
/plan-design-review # 设计师:评分 0-10,说明如何做到 10 分
/autoplan # 自动依次运行三个审查L'examen du PDG est essentiellement un « mode fondateur » : au lieu d'exécuter les exigences littéralement, vous prenez du recul et demandez « Quel est le véritable objectif de ce produit ? Il prend en charge quatre modes : étendre la portée, développer sélectivement, maintenir la portée et réduire la portée.
3. Build — implémentation du codage
Commencez à coder selon le plan approuvé. Cette étape utilise les fonctionnalités standard de Claude Code.
4. Examen — Examen parallèle par des experts
/reviewCette compétence envoie 7 sous-agents parallèles en même temps pour examiner le code sous 7 perspectives : tests, maintenabilité, sécurité, performances, migration de données, contrat API et attaque de l'équipe rouge. Les problèmes évidents seront automatiquement résolus.
5. Test — Contrôle qualité du vrai navigateur
/qaPas un test pratique. La compétence QA lance un véritable navigateur Chromium sans tête, ouvre votre application, clique sur les boutons, remplit les formulaires et prend des captures d'écran - tout comme le ferait un vrai testeur. Corrigez automatiquement les bogues, générez des tests de régression et revérifiez une fois les bogues découverts.
6. Expédier – publication en un clic
/shipSynchronisez automatiquement la branche principale, exécutez des tests, examinez les différences, mettez à jour les numéros de version et CHANGELOG, validez, poussez, créez des PR. Si le projet ne dispose pas d'un cadre de test, il en créera même un en premier.
7. Réfléchir – réviser et apprendre
/retroRapport hebdomadaire de style responsable de l'ingénierie : analysez l'historique des validations, le taux de tests et les tendances en matière de qualité du code. Soutenez l'analyse d'équipes composées de plusieurs personnes et suivez des indicateurs tels que le « nombre de jours de sortie consécutifs ».
Pourquoi ça marche : principes techniques
Browse Daemon : mettez les yeux sur l'IA
La contribution technique la plus unique de gstack est le Browse Daemon - une instance Chromium persistante sans tête qui communique via HTTP localhost. Le premier appel lance le navigateur (~ 3 secondes) et chaque commande suivante ne prend que 100 à 200 ms. Cela signifie que l'IA peut réellement voir votre application, plutôt que de deviner la structure du DOM.
Il introduit également le Ref System (référence d'élément @e1, @e2) pour localiser les éléments via l'arborescence d'accessibilité sans écrire de sélecteurs CSS. Il s'agit d'une « contribution véritablement technique » généralement reconnue par la communauté (y compris les critiques).
Répartition des rôles : pas un agent, mais une équipe
Ce que fait gstack, c'est désassembler tous les rôles en fichiers d'invite indépendants, permettant à Claude Code de basculer vers les perspectives de différents rôles à différentes étapes pour réviser le code. Il s’agit essentiellement d’une ingénierie d’invite raffinée.
L'idée principale est la suivante : **La planification n'est pas égale à la révision, la révision n'est pas égale à la publication, et le goût du fondateur et la rigueur de l'ingénierie sont des modes de pensée complètement différents. ** Au lieu de laisser un agent général faire tout, changez de « mode cérébral » si nécessaire : réflexion du fondateur, rigueur technique, révision paranoïaque, exécution rapide.
Trois grandes philosophies
ETHOS.md de gstack enregistre trois concepts fondamentaux :
-
Boil the Lake : lorsque l'IA ramène le coût marginal de l'exhaustivité à zéro, choisissez toujours une implémentation complète : couverture de test à 100 %, tous les cas extrêmes, tous les chemins d'erreur. Les « raccourcis de version » sont une pensée ancienne.
-
Rechercher avant de construire : Trois niveaux de connaissances : modèles éprouvés, solutions nouvelles et populaires et premiers principes. Commencez par comprendre ce que chacun fait, remettez en question ses hypothèses et découvrez pourquoi les solutions habituelles sont fausses.
-
Souveraineté de l'utilisateur : recommandation d'IA, prise de décision humaine. Même si deux modèles d’IA parviennent à un consensus, le jugement de l’utilisateur prime toujours, car l’utilisateur possède une connaissance du domaine, une perspective stratégique et des goûts.
Les limites et controverses de gstack
La réaction de la communauté à gstack est probablement l’outil de programmation d’IA le plus polarisant.
Le bon côté : les fondateurs et les constructeurs non techniques conviennent généralement que les compétences de « réflexion produit » telles que /office-hours et /plan-ceo-review ont aidé de nombreux développeurs indépendants à réexaminer l'orientation du produit avant de commencer à coder. La revue technique (/review) peut en effet découvrir certaines vulnérabilités de sécurité cachées. Ce modèle d’examen parallèle multi-angles a une valeur pratique.
Le côté questionnement est également très direct :
- L'indicateur LOC est peu significatif : 600 000 lignes de code en 60 jours. Le nombre de lignes de code n'est jamais un indicateur de qualité. Une grande quantité de code peut n’être qu’un échafaudage et un passe-partout.
- Essentiellement un modèle d'invite : chaque compétence est un fichier SKILL.md et le seuil technique n'est pas élevé. La vraie valeur ne réside pas dans le fichier lui-même, mais dans la qualité de la conception de l'invite.
- Limitations du code d'auto-révision de l'IA :
/reviewLaisser l'IA réviser le code écrit par l'IA équivaut à corriger vos propres devoirs. Le parallélisme multirôle peut atténuer ce problème, mais il s’agit toujours du même modèle. - Bonus effet célébrité : Si le fondateur n'est pas le PDG de YC, il y a de fortes chances que ce projet ne reçoive pas une telle attention.
Mon avis : Mis à part les controverses, les éléments vraiment précieux de gstack sont au nombre de deux : la technologie d'automatisation du navigateur de Browse Daemon et le modèle de conception de décomposition des rôles. Rien de tout cela ne dépend de qui est Garry Tan. L'importance fondamentale de la roleisation ne se situe pas au niveau technique, mais au niveau comportemental : elle vous aide à organiser votre flux de travail d'IA de manière plus consciente, plutôt que de tout confier à un agent général.
gstack convient au forking et à la personnalisation. Vous pouvez acquérir les compétences dont vous avez besoin et modifier les invites souhaitées, plutôt que de toutes les copier.
Ressources vidéo
Écrivez à la fin
gstack représente une direction intéressante pour les outils de programmation de l'IA : non pas rendre l'IA plus autonome (voie de Ralph), ni rendre le processus plus rigide (voie des Superpuissances), mais laisser l'IA jouer différents rôles pour améliorer la qualité des décisions. Sa controverse illustre simplement la richesse de l’écosystème de programmation de l’IA : aucune solution ne convient à tout le monde.
Si gstack vous intéresse, l'étape suivante consiste à lire le Chapitre pratique - un tutoriel étape par étape depuis l'installation jusqu'à l'exécution du workflow complet.
Lecture connexe :
- Introduction aux concepts GSD — Une autre solution de programmation IA structurée
- Analyse approfondie de Ralph Wiggum — Comprendre le point de départ de l'itération en boucle infinie
- Claude Skills Concept — Comprendre le mécanisme sous-jacent des compétences
Commentaires
Guide pratique
Référence complète des commandes GSD, configuration détaillée, démonstration de flux de travail et questions fréquentes — manuel opérationnel de l'installation à la livraison du projet
chapitre pratique de gstack
Configuration de l'installation de gstack, référence complète des commandes, démonstration du flux de travail et meilleures pratiques de la communauté