gstack

gstack: YC CEO が起業家としての経験をクロードコードに取り入れたとき的文章封面图

gstack: YC CEO が起業家としての経験をクロードコードに取り入れたとき

AI アシスト

Garry Tan オープンソースの gstack とは何か、それが解決する問題、コアワークフローとツールの生態学的位置付け

はじめに

以前のノートでは、Ralph Wiggum の無限ループから GSD の仕様駆動型開発に至るまで、Claude Code エコシステム内のさまざまな「拡張ソリューション」を検討しました。彼らは皆、同じ質問に答えようとしています。**AI プログラミングを「適応」から「信頼性の高い配信」に変えるにはどうすればよいですか? **

Ralph の答えは、「すべてを再起動する」です。コンテキストの腐敗を避けるために、毎回新しいプロセスを使用します。 GSD の答えは「仕様主導」、つまり構造化されたフェーズ計画と検証サイクルを通じて品質を確保することです。しかし、実行システムだけでなく、完全な仮想エンジニアリングチームが必要な場合はどうすればよいでしょうか? CEO が製品の意思決定を行い、エンジニアリングマネージャーがアーキテクチャをレビューし、デザイナーがエクスペリエンスを制御し、QA が実際のブラウザーテストを実行し、リリースエンジニアがリリースを管理します...すべてが AI によって実行され、ユーザーによって指揮されます。

これが gstack の核となる考え方です。

gstack とは

gstack

Y Combinator CEO の Garry Tan によって作成された、オープンソースのロールベースのスキルセットには 23 個以上のスラッシュコマンドが含まれており、クロードコードを単一の AI アシスタントから仮想エンジニアリングチームに変換します。各スキルは CEO、エンジニアリングマネージャー、デザイナー、QA リード、セキュリティ責任者、リリースエンジニアなどの専門的な役割に対応しており、AI にさまざまな思考モードと専門的な視点を与えます。

出典: GitHub移動

gstack の作成者である Garry Tan は、技術的および起業家としての豊富な背景を持っています。14 歳でコードを書き始め、スタンフォードコンピューターエンジニアリングを卒業し、Palantir の 10 人目の従業員であり、Posterous (後に Twitter に買収) を共同設立し、2023 年から Y Combinator の社長兼 CEO を務めています。

彼は gstack を使用して、YC をフルタイムで実行しながら、60 日間で 600,000 行を超える実稼働コード (35% テスト) をリリースしました。これは 1 日あたり平均 10,000 行以上になります。プロジェクトの 1 つである garylist.org は 21 日で立ち上げられ、コードは 150,000 行、テストカバレッジは 35% でした。彼自身の言葉によると、コードの品質は、彼が 500 万ドル、2 年、10 人のエンジニアを費やした以前の起業家プロジェクトを上回っています。

このプロジェクトは 2026 年 3 月 11 日にオープンソース化されて以来、3 週間以内に v0 から v0.15.1.0 まで繰り返され、GitHub は 60,500 以上のスターを獲得しました。 MIT ライセンス、完全にオープンソース。

gstack - Claude Code Skills

23+ opinionated skills that transform Claude Code from a single AI assistant into a virtual engineering team.

Garry TanGitHub

ツールエコシステムにおける gstack の位置

寸法	ネイティブクロードコード	ラルフ・ウィガム	GSD	スペックキット	超大国	gstack
コアの位置決め	ユニバーサル AI コーディングアシスタント	無限ループの反復	コンテキストエンジニアリング + 仕様主導	要件 → 仕様 → タスク	プロセス規律 + TDD	役割ベースの仮想チーム
コアパターン	会話型プログラミング	Bash ループ + 新しいプロセス	フェーズベースのロードマップ	仕様 → 計画 → タスク	厳密な開発パイプライン	スプリントの 7 ステッププロセス
人間の関与	ライブ会話	ハンズオフ (AFK)	段階ごとの検証	仕様の承認	ステップごとの検証	ステージごとの役割のレビュー
ユニークな機能	基本的なコーディング	無制限の反復	コンテキスト腐敗管理	要件のトレース	強制 TDD	ブラウザの自動化 + 複数の役割のレビュー
シナリオに適しています	簡単なタスク	継続的な反復	大規模プロジェクト管理	厳しい要件を伴うプロジェクト	エンジニアリング品質保証	フルプロセスの製品開発

主要なパターンが表からわかります。 **これらのツールは互いに競合しませんが、AI プログラミングの問題を異なる次元で解決します。 **

Superpowers は プロセス規律 を使用してコードの品質を保証します (必須の TDD、構造化された対話、実装計画)。 GSD は コンテキストエンジニアリング を使用して、複雑なプロジェクト (フェーズ計画、サブエージェントの新しいコンテキスト、ファイルシステムのステータス) を管理します。 gstack は、役割分解 を使用して意思決定の品質を向上させます (CEO の視点で製品をレビューし、エンジニアリングマネージャーがアーキテクチャをレビューし、QA が実際のブラウザを実行します)。

簡単に言うと、Superpowers はプロセスガードレールに基づいており、gstack はロール設計に基づいています。前者は 1 から N までのプロジェクトの実装に適しており、後者は 0 から 1 までの製品構築に適しています。**この 2 つは競合する製品ではなく、補完的な製品です。 **

コアワークフロー: スプリントの 7 つのステップ

gstack は、開発プロセス全体を **思考 → 計画 → 構築 → レビュー → テスト → 出荷 → 反映 ** のサイクルに編成します。これは「スプリント」と呼ばれます。アジャイルスプリントではなく、「役割が順番に現れる」という開発リズムです。

1. 考える — 製品クリニック

/office-hours

これがgstackの最も特徴的なスキルです。インスピレーションは YC のオフィスアワーから直接得られます。起業家は YC のパートナーに会いに行き、自分自身を見つめ直します。 AI は 6 つの強制的な質問をします:

これを特に必要としているのは誰ですか?
今日それがなかったらどうしますか?
この問題が今緊急であるのはなぜですか?
それが機能することはどうやってわかりますか?
何もしなかったらどうなりますか?
リリースできる最小バージョンは何ですか?

この目的は、コードの作成を支援することではなく、コードを作成する前に 問題自体を再検討することです。

2. 計画 — 複数の役割によるレビュー

/plan-ceo-review    # CEO 视角：寻找 10 星级产品
/plan-eng-review    # 工程经理：锁定架构和边界
/plan-design-review # 设计师：评分 0-10，说明如何做到 10 分
/autoplan           # 自动依次运行三个审查

CEO レビューは本質的に「創設者モード」です。文字通り要件を実行するのではなく、一歩下がって「この製品の本当の目的は何ですか?」と問いかけます。スコープの拡張、選択的拡張、スコープの維持、およびスコープの縮小の 4 つのモードをサポートします。

3. ビルド — コーディングの実装

承認された計画に従ってコーディングを開始します。このステップでは、標準のクロードコード機能を使用します。

4. レビュー — 専門家による並行レビュー

/review

このスキルは、7 つの並列サブエージェントを一度に派遣して、テスト、保守性、セキュリティ、パフォーマンス、データ移行、API コントラクト、レッドチーム攻撃の 7 つの観点からコードをレビューします。明らかな問題は自動的に修正されます。

5. テスト — 実際のブラウザの QA

/qa

模擬試験ではありません。 QA スキルは、実際のテスターと同じように、本物のヘッドレス Chromium ブラウザを起動し、アプリを開いて、ボタンをクリックし、フォームに記入し、スクリーンショットを撮ります。自動的にバグを修正し、回帰テストを生成し、バグが発見された後に再検証します。

6. 出荷 — ワンクリック公開

/ship

自動的にマスターブランチを同期し、テストを実行し、差分を確認し、バージョン番号と CHANGELOG を更新し、コミット、プッシュ、PR を作成します。プロジェクトにテストフレームワークがない場合は、最初にフレームワークを構築することもあります。

7. 振り返る — 見直して学ぶ

/retro

エンジニアリングマネージャースタイルの週次レポート: コミット履歴、テスト率、コード品質の傾向を分析します。複数人チームの分析をサポートし、「連続リリース日数」などの指標を追跡します。

機能する理由: 技術原則

ブラウズデーモン: AI に注目

gstack の最もユニークな技術的貢献は、ローカルホスト HTTP 経由で通信する永続的なヘッドレス Chromium インスタンスであるブラウズデーモンです。最初の呼び出しでブラウザが起動され (約 3 秒)、後続の各コマンドには 100 ～ 200 ミリ秒しかかかりません。これは、AI が DOM 構造を推測するのではなく、実際にアプリを認識できることを意味します。

また、CSS セレクターを作成せずにアクセシビリティツリーを通じて要素を見つけるための Ref System (要素参照 @e1、@e2) も導入されています。これは、コミュニティ (批評家を含む) によって一般に認められている「真の技術的貢献」です。

役割の内訳: エージェントではなくチーム

gstack が行うことは、すべてのロールを独立したプロンプトファイルに分解することで、クロードコードがさまざまな段階でさまざまなロールの視点に切り替えてコードをレビューできるようにすることです。これは本質的に洗練されたプロンプトエンジニアリングです。

核となる洞察は次のとおりです。 **計画はレビューと同等ではなく、レビューとリリースは同等ではありません。また、創業者の好みとエンジニアリングの厳密さはまったく異なる思考モードです。 ** 一般的なエージェントにすべてを任せるのではなく、必要に応じて「頭脳モード」を切り替えます (創業者の思考、エンジニアリングの厳密さ、偏執的なレビュー、迅速な実行など)。

3大理念

gstack の ETHOS.md には、次の 3 つの主要な概念が記録されています。

湖を沸騰させる: AI によって完全性の限界コストがゼロになる場合は、常に完全な実装 (100% のテストカバレッジ、すべてのエッジケース、すべてのエラーパス) を選択してください。「ショートカットを解放する」というのは古い考え方です。
構築する前に検索: 3 層の知識 - 実績のあるパターン、新しく人気のあるソリューション、および第一原則。まずは全員が何をしているのかを理解し、思い込みを疑い、なぜ通常の解決策が間違っているのかを発見することから始めましょう。
ユーザー主権: AI による推奨、人間の意思決定。 2 つの AI モデルが合意に達した場合でも、ユーザーの判断が優先されます。ユーザーにはドメインの知識、戦略的な観点、好みがあるためです。

gstack の境界と論争

gstack に対するコミュニティの反応は、おそらくあらゆる AI プログラミングツールの中で最も二極化しています。

明るい側面: 創業者と非技術系ビルダーは、特に /office-hours や /plan-ceo-review のような「製品思考」スキルが、多くの独立系開発者がコードを書き始める前に製品の方向性を再検討するのに役立ってきたという点では、おおむね同意しています。エンジニアリングレビュー (/review) では、隠れたセキュリティ脆弱性を実際に発見することができます。このマルチアングル並列レビューモデルには実用的な価値があります。

質問する側も非常に直接的です。

LOC インジケーターはあまり重要ではありません: 60 日間で 600,000 行のコード。コードの行数は決して品質の指標ではありません。大量のコードは単なる足場と定型的なものである可能性があります。
基本的にプロンプトテンプレート: 各スキルは SKILL.md ファイルであり、技術的な敷居は高くありません。本当の価値はファイル自体にあるのではなく、プロンプトのデザインの品質にあります。
AI セルフレビューコードの制限事項: /review AI が書いたコードを AI にレビューさせることは、あなた自身の宿題を修正することと同じです。マルチロール並列処理によりこの問題は軽減されますが、依然として同じモデルです。
有名人効果ボーナス: 創設者が YC CEO でない場合、このプロジェクトはそれほど注目されない可能性が高くなります。

私の意見: 論争はさておき、gstack の本当に価値のある部分は 2 つです。それは、Browse Daemon のブラウザ自動化テクノロジと、ロール分解の設計パターンです。これは、ギャリー・タンが誰であるかには関係ありません。役割分担の中心的な重要性は技術レベルではなく、行動レベルにあります。これにより、一般的なエージェントにすべてを委ねるのではなく、AI ワークフローをより意識的に整理することができます。

gstack はフォークやカスタマイズに適しています。すべてをコピーするのではなく、必要なスキルを取得し、必要なプロンプトを変更できます。

ビデオリソース

Better Stack: The Toolkit from YC CEO That Makes Claude Code Amazing

Better Stack gstack の包括的な紹介と実践的なデモンストレーション。インストールから /plan-ceo-review を使用して実際の機能を完成させるまでのプロセス全体は、CEO Review が創設者の観点から要件をどのように再検討するか、および gstack が複数の役割のレビュープロセスをどのように組織するかを示します。 7 分間に凝縮されたコンテンツで、gstack の核となる作業方法を素早く理解するのに適しています。YouTube

YC CEO 50 天连发 100 个 PR——他的 8 个 Claude Code Skills

このシステムは、gstack の 8 つのコアスキルを分解します。CEO レビュー (創設者の製品思考)、レビュー (厳格なエンジニアリングレビュー)、ブラウズ (200 ミリ秒のブラウザインタラクション)、QA (自動品質保証)、出荷 (ワンクリックリリース) などです。「AI ツールにはあいまいなモードが 1 つだけあるべきではない」という Garry Tan の独自の洞察からの引用が含まれています。YouTube

最後に書きます

gstack は、AI プログラミングツールの興味深い方向性を示しています。つまり、AI をより自律的にすることではなく (ラルフのルート)、プロセスをより厳格にすることではなく (スーパーパワーズのルート)、意思決定の質を向上させるために AI にさまざまな役割を果たさせることです。この論争は、AI プログラミングエコシステムの豊かさを示しています。すべての人に適合するソリューションはありません。

gstack に興味がある場合は、次のステップは実践編を読むことです。これは、インストールから完全なワークフローの実行までの段階的なチュートリアルです。

関連書籍:

GSD 概念の紹介 — 別の構造化 AI プログラミングソリューション
Ralph Wiggum の詳細な分析 — 無限ループ反復の開始点を理解する
Claude Skills Concept — スキルの基礎となるメカニズムを理解する

コメント

実践ガイド

GSD の完全コマンドリファレンス、設定詳細、実戦ワークフローデモ、FAQ ── インストールからプロジェクト納品までの操作マニュアル

gstack実践編

gstack のインストール構成、完全なコマンドリファレンス、ワークフローのデモンストレーション、コミュニティのベストプラクティス

目次

はじめに gstack とはツールエコシステムにおける gstack の位置コアワークフロー: スプリントの 7 つのステップ 1. 考える — 製品クリニック 2. 計画 — 複数の役割によるレビュー 3. ビルド — コーディングの実装 4. レビュー — 専門家による並行レビュー 5. テスト — 実際のブラウザの QA 6. 出荷 — ワンクリック公開 7. 振り返る — 見直して学ぶ機能する理由: 技術原則ブラウズデーモン: AI に注目役割の内訳: エージェントではなくチーム 3大理念 gstack の境界と論争ビデオリソース最後に書きます

gstack: YC CEO が起業家としての経験をクロードコードに取り入れたとき | Yuのサイバーデスク