メインコンテンツへスキップ
gstack
gstack: YC CEO が起業家としての経験をクロード コードに取り入れたとき 的文章封面图

gstack: YC CEO が起業家としての経験をクロード コードに取り入れたとき

AI アシスト

Garry Tan オープンソースの gstack とは何か、それが解決する問題、コア ワークフローとツールの生態学的位置付け

はじめに

以前のノートでは、Ralph Wiggum の無限ループから GSD の仕様駆動型開発に至るまで、Claude Code エコシステム内のさまざまな「拡張ソリューション」を検討しました。彼らは皆、同じ質問に答えようとしています。**AI プログラミングを「適応」から「信頼性の高い配信」に変えるにはどうすればよいですか? **

Ralph の答えは、「すべてを再起動する」です。コンテキストの腐敗を避けるために、毎回新しいプロセスを使用します。 GSD の答えは「仕様主導」、つまり構造化されたフェーズ計画と検証サイクルを通じて品質を確保することです。しかし、実行システムだけでなく、完全な仮想エンジニアリング チームが必要な場合はどうすればよいでしょうか? CEO が製品の意思決定を行い、エンジニアリング マネージャーがアーキテクチャをレビューし、デザイナーがエクスペリエンスを制御し、QA が実際のブラウザー テストを実行し、リリース エンジニアがリリースを管理します...すべてが AI によって実行され、ユーザーによって指揮されます。

これが gstack の核となる考え方です。

gstack とは

gstack

Y Combinator CEO の Garry Tan によって作成された、オープンソースの ロールベースのスキル セット には 23 個以上のスラッシュ コマンドが含まれており、クロード コードを単一の AI アシスタントから仮想エンジニアリング チームに変換します。各スキルは CEO、エンジニアリング マネージャー、デザイナー、QA リード、セキュリティ責任者、リリース エンジニアなどの専門的な役割に対応しており、AI にさまざまな思考モードと専門的な視点を与えます。

出典: GitHub移動

gstack の作成者である Garry Tan は、技術的および起業家としての豊富な背景を持っています。14 歳でコードを書き始め、スタンフォード コンピューター エンジニアリングを卒業し、Palantir の 10 人目の従業員であり、Posterous (後に Twitter に買収) を共同設立し、2023 年から Y Combinator の社長兼 CEO を務めています。

彼は gstack を使用して、YC をフルタイムで実行しながら、60 日間で 600,000 行を超える実稼働コード (35% テスト) をリリースしました。これは 1 日あたり平均 10,000 行以上になります。プロジェクトの 1 つである garylist.org は 21 日で立ち上げられ、コードは 150,000 行、テスト カバレッジは 35% でした。彼自身の言葉によると、コードの品質は、彼が 500 万ドル、2 年、10 人のエンジニアを費やした以前の起業家プロジェクトを上回っています。

このプロジェクトは 2026 年 3 月 11 日にオープンソース化されて以来、3 週間以内に v0 から v0.15.1.0 まで繰り返され、GitHub は 60,500 以上のスターを獲得しました。 MIT ライセンス、完全にオープンソース。

gstack - Claude Code Skills

23+ opinionated skills that transform Claude Code from a single AI assistant into a virtual engineering team.

Garry TanGitHub
移動

ツールエコシステムにおける gstack の位置

寸法ネイティブクロードコードラルフ・ウィガムGSDスペックキット超大国gstack
コアの位置決めユニバーサル AI コーディング アシスタント無限ループの反復コンテキストエンジニアリング + 仕様主導要件 → 仕様 → タスクプロセス規律 + TDD役割ベースの仮想チーム
コアパターン会話型プログラミングBash ループ + 新しいプロセスフェーズベースのロードマップ仕様 → 計画 → タスク厳密な開発パイプラインスプリントの 7 ステップ プロセス
人間の関与ライブ会話ハンズオフ (AFK)段階ごとの検証仕様の承認ステップごとの検証ステージごとの役割のレビュー
ユニークな機能基本的なコーディング無制限の反復コンテキスト腐敗管理要件のトレース強制 TDDブラウザの自動化 + 複数の役割のレビュー
シナリオに適しています簡単なタスク継続的な反復大規模プロジェクト管理厳しい要件を伴うプロジェクトエンジニアリング品質保証フルプロセスの製品開発

主要なパターンが表からわかります。 **これらのツールは互いに競合しませんが、AI プログラミングの問題を異なる次元で解決します。 **

Superpowers は プロセス規律 を使用してコードの品質を保証します (必須の TDD、構造化された対話、実装計画)。 GSD は コンテキスト エンジニアリング を使用して、複雑なプロジェクト (フェーズ計画、サブエージェントの新しいコンテキスト、ファイル システムのステータス) を管理します。 gstack は、役割分解 を使用して意思決定の品質を向上させます (CEO の視点で製品をレビューし、エンジニアリング マネージャーがアーキテクチャをレビューし、QA が実際のブラウザを実行します)。

簡単に言うと、Superpowers はプロセス ガードレールに基づいており、gstack はロール設計に基づいています。前者は 1 から N までのプロジェクトの実装に適しており、後者は 0 から 1 までの製品構築に適しています。**この 2 つは競合する製品ではなく、補完的な製品です。 **

コア ワークフロー: スプリントの 7 つのステップ

gstack は、開発プロセス全体を **思考 → 計画 → 構築 → レビュー → テスト → 出荷 → 反映 ** のサイクルに編成します。これは「スプリント」と呼ばれます。アジャイル スプリントではなく、「役割が順番に現れる」という開発リズムです。

1. 考える — 製品クリニック

/office-hours

これがgstackの最も特徴的なスキルです。インスピレーションは YC のオフィス アワーから直接得られます。起業家は YC のパートナーに会いに行き、自分自身を見つめ直します。 AI は 6 つの強制的な質問をします:

  1. これを特に必要としているのは誰ですか?
  2. 今日それがなかったらどうしますか?
  3. この問題が今緊急であるのはなぜですか?
  4. それが機能することはどうやってわかりますか?
  5. 何もしなかったらどうなりますか?
  6. リリースできる最小バージョンは何ですか?

この目的は、コードの作成を支援することではなく、コードを作成する前に 問題自体を再検討することです。

2. 計画 — 複数の役割によるレビュー

/plan-ceo-review    # CEO 视角:寻找 10 星级产品
/plan-eng-review    # 工程经理:锁定架构和边界
/plan-design-review # 设计师:评分 0-10,说明如何做到 10 分
/autoplan           # 自动依次运行三个审查

CEO レビューは本質的に「創設者モード」です。文字通り要件を実行するのではなく、一歩下がって「この製品の本当の目的は何ですか?」と問いかけます。スコープの拡張、選択的拡張、スコープの維持、およびスコープの縮小の 4 つのモードをサポートします。

3. ビルド — コーディングの実装

承認された計画に従ってコーディングを開始します。このステップでは、標準のクロード コード機能を使用します。

4. レビュー — 専門家による並行レビュー

/review

このスキルは、7 つの並列サブエージェントを一度に派遣して、テスト、保守性、セキュリティ、パフォーマンス、データ移行、API コントラクト、レッド チーム攻撃の 7 つの観点からコードをレビューします。明らかな問題は自動的に修正されます。

5. テスト — 実際のブラウザの QA

/qa

模擬試験ではありません。 QA スキルは、実際のテスターと同じように、本物のヘッドレス Chromium ブラウザを起動し、アプリを開いて、ボタンをクリックし、フォームに記入し、スクリーンショットを撮ります。自動的にバグを修正し、回帰テストを生成し、バグが発見された後に再検証します。

6. 出荷 — ワンクリック公開

/ship

自動的にマスター ブランチを同期し、テストを実行し、差分を確認し、バージョン番号と CHANGELOG を更新し、コミット、プッシュ、PR を作成します。プロジェクトにテスト フレームワークがない場合は、最初にフレームワークを構築することもあります。

7. 振り返る — 見直して学ぶ

/retro

エンジニアリング マネージャー スタイルの週次レポート: コミット履歴、テスト率、コード品質の傾向を分析します。複数人チームの分析をサポートし、「連続リリース日数」などの指標を追跡します。

機能する理由: 技術原則

ブラウズ デーモン: AI に注目

gstack の最もユニークな技術的貢献は、ローカルホスト HTTP 経由で通信する永続的なヘッドレス Chromium インスタンスであるブラウズ デーモンです。最初の呼び出しでブラウザが起動され (約 3 秒)、後続の各コマンドには 100 ~ 200 ミリ秒しかかかりません。これは、AI が DOM 構造を推測するのではなく、実際にアプリを認識できることを意味します。

また、CSS セレクターを作成せずにアクセシビリティ ツリーを通じて要素を見つけるための Ref System (要素参照 @e1@e2) も導入されています。これは、コミュニティ (批評家を含む) によって一般に認められている「真の技術的貢献」です。

役割の内訳: エージェントではなくチーム

gstack が行うことは、すべてのロールを独立したプロンプト ファイルに分解することで、クロード コードがさまざまな段階でさまざまなロールの視点に切り替えてコードをレビューできるようにすることです。これは本質的に洗練されたプロンプトエンジニアリングです。

核となる洞察は次のとおりです。 **計画はレビューと同等ではなく、レビューとリリースは同等ではありません。また、創業者の好みとエンジニアリングの厳密さはまったく異なる思考モードです。 ** 一般的なエージェントにすべてを任せるのではなく、必要に応じて「頭脳モード」を切り替えます (創業者の思考、エンジニアリングの厳密さ、偏執的なレビュー、迅速な実行など)。

3大理念

gstack の ETHOS.md には、次の 3 つの主要な概念が記録されています。

  1. 湖を沸騰させる: AI によって完全性の限界コストがゼロになる場合は、常に完全な実装 (100% のテスト カバレッジ、すべてのエッジ ケース、すべてのエラー パス) を選択してください。 「ショートカットを解放する」というのは古い考え方です。

  2. 構築する前に検索: 3 層の知識 - 実績のあるパターン、新しく人気のあるソリューション、および第一原則。まずは全員が何をしているのかを理解し、思い込みを疑い、なぜ通常の解決策が間違っているのかを発見することから始めましょう。

  3. ユーザー主権: AI による推奨、人間の意思決定。 2 つの AI モデルが合意に達した場合でも、ユーザーの判断が優先されます。ユーザーにはドメインの知識、戦略的な観点、好みがあるためです。

gstack の境界と論争

gstack に対するコミュニティの反応は、おそらくあらゆる AI プログラミング ツールの中で最も二極化しています。

明るい側面: 創業者と非技術系ビルダーは、特に /office-hours/plan-ceo-review のような「製品思考」スキルが、多くの独立系開発者がコードを書き始める前に製品の方向性を再検討するのに役立ってきたという点では、おおむね同意しています。エンジニアリングレビュー (/review) では、隠れたセキュリティ脆弱性を実際に発見することができます。このマルチアングル並列レビューモデルには実用的な価値があります。

質問する側も非常に直接的です。

  • LOC インジケーターはあまり重要ではありません: 60 日間で 600,000 行のコード。コードの行数は決して品質の指標ではありません。大量のコードは単なる足場と定型的なものである可能性があります。
  • 基本的にプロンプト テンプレート: 各スキルは SKILL.md ファイルであり、技術的な敷居は高くありません。本当の価値はファイル自体にあるのではなく、プロンプトのデザインの品質にあります。
  • AI セルフレビュー コードの制限事項: /review AI が書いたコードを AI にレビューさせることは、あなた自身の宿題を修正することと同じです。マルチロール並列処理によりこの問題は軽減されますが、依然として同じモデルです。
  • 有名人効果ボーナス: 創設者が YC CEO でない場合、このプロジェクトはそれほど注目されない可能性が高くなります。

私の意見: 論争はさておき、gstack の本当に価値のある部分は 2 つです。それは、Browse Daemon のブラウザ自動化テクノロジと、ロール分解の設計パターンです。これは、ギャリー・タンが誰であるかには関係ありません。役割分担の中心的な重要性は技術レベルではなく、行動レベルにあります。これにより、一般的なエージェントにすべてを委ねるのではなく、AI ワークフローをより意識的に整理することができます。

gstack はフォークやカスタマイズに適しています。すべてをコピーするのではなく、必要なスキルを取得し、必要なプロンプトを変更できます。

ビデオリソース

Better Stack: The Toolkit from YC CEO That Makes Claude Code Amazing
Better Stack gstack の包括的な紹介と実践的なデモンストレーション。インストールから /plan-ceo-review を使用して実際の機能を完成させるまでのプロセス全体は、CEO Review が創設者の観点から要件をどのように再検討するか、および gstack が複数の役割のレビュー プロセスをどのように組織するかを示します。 7 分間に凝縮されたコンテンツで、gstack の核となる作業方法を素早く理解するのに適しています。YouTube
YC CEO 50 天连发 100 个 PR——他的 8 个 Claude Code Skills
このシステムは、gstack の 8 つのコア スキルを分解します。CEO レビュー (創設者の製品思考)、レビュー (厳格なエンジニアリング レビュー)、ブラウズ (200 ミリ秒のブラウザ インタラクション)、QA (自動品質保証)、出荷 (ワンクリック リリース) などです。「AI ツールにはあいまいなモードが 1 つだけあるべきではない」という Garry Tan の独自の洞察からの引用が含まれています。YouTube

最後に書きます

gstack は、AI プログラミング ツールの興味深い方向性を示しています。つまり、AI をより自律的にすることではなく (ラルフのルート)、プロセスをより厳格にすることではなく (スーパーパワーズのルート)、意思決定の質を向上させるために AI にさまざまな役割を果たさせることです。この論争は、AI プログラミング エコシステムの豊かさを示しています。すべての人に適合するソリューションはありません。

gstack に興味がある場合は、次のステップは 実践編 を読むことです。これは、インストールから完全なワークフローの実行までの段階的なチュートリアルです。


関連書籍:

コメント

目次

gstack: YC CEO が起業家としての経験をクロード コードに取り入れたとき | Yuのサイバーデスク