AIが測定できない男:5日間で6,009セッションの使用記録
Claude CodeのInsightsシステムが使用データを分析中にフリーズした時、その背後にはどのような使用パターンがあるのか?Bootstrap Kitアーキテクチャ、Multi-Sessionオーケストレーション、AIコラボレーションワークフローに関する技術的ケーススタディ。
Insightsシステムが分析できないユーザーに出会った時
Insightsとは? Claude Codeの新機能 /insights は、あなたの使用データを分析します。セッション数、メッセージ量、ツール呼び出し頻度、コード出力などを分析し、「あなたがClaude Codeをどのように使っているか」を示すパーソナライズされた使用レポートを生成します。
「主にどのデータを分析するの?数日前にシステムがフリーズして、ユーザーデータをクリアしたんだけど…」
これは普通の技術サポート会話の始まりです。/insightsを実行して使用データを分析しようとした時、バックアップデータをマージした後、システムは完全にフリーズしました。
「ハハ、マージ後にフリーズするんだよね。私はAIが測定できない男になった。しかもこれは私の3台のコンピューターのうちの1台だけの話だよ。」
これは私たちを好奇心にさせました:どのような使用パターンが分析ツールをギブアップさせるのでしょうか?
データは語る:これはどのレベルの使用量か
単一のコンピューター、5日間のデータを見てみましょう:
| 指標 | 単一PC(実測) | 3台推定合計 | 備考 |
|---|---|---|---|
| セッション数 | 6,009 | ~18,000 | 1日平均3,600+セッション |
| メッセージ数 | 35,204 | ~105,000 | 1日21,000+メッセージ |
| 累計使用時間 | 4,988時間 | ~15,000時間 | 5日間 = 625日分の使用量 |
| Bash呼び出し | 158,490 | ~475,000 | 1日95,000+コマンド |
| コミット数 | 2,290 | ~6,900 | 1日1,380コミット |
| 追加行数 | +5,791,536行 | ~1,700万行 | 1日平均340万行 |
| ファイル操作 | 31,453個 | ~94,000 | 1分間に13ファイル |
| ブラウザ自動化 | 12,000+回 | ~36,000 | Playwright MCP深度統合 |
⚠️ 重要な注意:上記は単一コンピューターのデータのみです。
彼は日常的に3台のコンピューターを同時に開発に使用しています。
右列の「3台推定合計」は3台で同様の使用強度を仮定しています。実際の数字はさらに高い可能性があります。
3台のコンピューターの使用量が同程度であれば、これは以下を意味します:
- 5日間で約18,000のClaude Codeセッション
- 累計使用時間は625日(約2年)の24/7使用に相当
- 1日340万行のコード生産
これはかなり驚異的な使用密度です。
解読:精密に設計されたAgentコラボレーションアーキテクチャ
レポートの「メッセージ」数は再解釈が必要です。/cms auto(Claude Multi-Session)のようなコマンドを使用すると、1つのコマンドが以下をトリガーします:
/cms auto "機能Xを実装"
├── Orchestrator Agent(計画)
│ └── 複数のメッセージを生成
├── Implementer Agent(実装)
│ └── 複数のメッセージを生成
├── Validator Agent(検証)
│ └── 複数のメッセージを生成
└── Fixer Agent(修正)
└── 複数のメッセージを生成
1つの人間のコマンド = 数十のシステムメッセージ。
しかし、これらのメッセージに人間の確認が不要というわけではありません。
「基本的にすべての会話とセッションをかなり注意深く読んでいます。これは全て私たちが精密に設計したAgent/Skillに依存しており、フレームワークを超える使い方をしています。」
ここでの重要な洞察は:
1. 精密に設計されたAgentアーキテクチャ
これらのAgentは適当に書かれたものではありません。それぞれが以下のために設計されています:
- 標準化された出力形式 — 人間が素早くスキャンできる
- 重要情報のハイライト — エラー、警告、成功が一目瞭然
- 明確な階層 — いつ介入が必要かわかる
2. タイムライン:Gitレコードが証明する先駆者
Bootstrap Kitのgitコミット履歴によると、正確なタイムラインは以下の通りです:
═══════════════════════════════════════════════════════════════════
Bootstrap Kit vs Anthropic公式機能
═══════════════════════════════════════════════════════════════════
2025-10-19 Bootstrap Kit v1.0.0 リリース
├── Custom Skillsシステム
├── Auto-Dev Orchestrator
├── Parallel Agentsサポート
└── Hooksシステム
│
│ ← Skills v1より2-3週間早い
▼
2025-11月初 Anthropic Skills v1 リリース
│
│
2025-11-07 Bootstrap Kit に Auto-Cycle 追加 ⭐
├── 連続実行エンジン (v2.1)
└── Multi-Sessionオーケストレーション機能(CMS前身)
│
│ ← CoWorkより約2ヶ月早い
│
2026-01-07 Anthropic Skills v2 (Claude Code 2.1.0) リリース
│
2026-01-09 Bootstrap Kit Multi-CLIアーキテクチャ (v1.4.0)
└── クロスCLIオーケストレーション (Claude/Gemini/Codex)
│
2026-01-11 Auto-Cycleがnormal + CMSに分割
└── CMS = Multi-Session専用バージョン
│
│
▼
2026-01-12 Anthropic CoWork リリース(公式ソリューション)
═══════════════════════════════════════════════════════════════════
タイムライン比較:
| 機能 | コミュニティソリューション | 公式ソリューション | 時間差 |
|---|---|---|---|
| Custom Skills | 2025-10-19 | 2025年11月初 | 約2-3週間 |
| Parallel Agents | 2025-10-20 | — | コミュニティオリジナル |
| Multi-Sessionオーケストレーション | 2025-11-07 (Auto-Cycle) | 2026-01-12 (CoWork) | 約2ヶ月 |
| Multi-CLIルーティング | 2026-01-09 | — | コミュニティオリジナル |
⚠️ 重要な説明:CMSの前身はAuto-Cycle(2025-11-07)であり、すでにMulti-Sessionオーケストレーション機能を持っていました。CMSはAuto-Cycleの進化版であり、新機能ではありません。
これは意味します:Bootstrap KitのMulti-SessionオーケストレーションはAnthropicのCoWorkより丸2ヶ月早かった。
これは偶然ではありません。これは並行進化です—パワーユーザーとAnthropicのエンジニアリングチームが独立して類似のソリューションに到達したのです。
なぜ公式より早かったのか?
「私はヘビーユーザーだから。真剣に使っていて、適当に使っているわけではない。」
これは製品開発における興味深い現象を明らかにしています:役割が異なれば、視点も異なる。
製品エンジニアの役割:
├── 数百万ユーザー向けの汎用機能を設計
├── 安定性、セキュリティ、互換性を考慮
├── 製品ロードマップに従って計画的に進める
└── 完全なテストとドキュメントが必要
パワーユーザーの役割:
├── 自分のペインポイントだけを解決すればいい
├── 「動けばOK」のソリューションを受け入れられる
├── 問題に遭遇したらすぐに手を動かして修正
└── 高速イテレーション、使いながら改善
3台のコンピューターで同時に1日7,000+メッセージを実行する時:
- ペインポイントが早く来る — コンテキスト制限、シングルセッションのボトルネック
- 解決動機が強い — 解決しないと仕事ができない
- 検証サイクルが短い — 自分がテスター
ヘビー使用 → ペインポイントに早く遭遇 → すぐに解決策を構築 → ヘビー使用を継続
↑ │
└───────────────────────────────────────────────────────────┘
これがAuto-CycleがCoWorkより2ヶ月早かった理由です。
能力の違いではなく、役割とペースの違いです。
Anthropicが作っているのは:すべての人のための安定したインフラストラクチャ。 パワーユーザーが作っているのは:自分の極端なユースケースのための脱出口。
両者は最終的に類似のソリューションに到達します—誰が先に問題に遭遇するかで、誰が先に解決するかが決まる。
3. CMS vs CoWork:異なる設計哲学
公式CoWork:
- 一般ユーザーのコラボレーションモード向けに設計
- 使いやすさと安定性を重視
- 公式サポートとメンテナンス
CMS(Claude Multi-Session):
- 特定のヘビー使用シナリオ向けに設計
- クロスプロセスのコンテキスト分離
- 長期間の連続イテレーションをサポート
- コミュニティ駆動の実験的ソリューション
CoWorkとCMSは類似の問題を解決しますが、異なる角度からアプローチしています。この「並行進化」現象はオープンソースコミュニティでよく見られます。
4. 効率の倍増器:1人 = 30-50個のClaude Code
CMSの設計により、単一ユーザーがより多くの並行タスクを同時に管理できます:
従来の操作:1人 × 3-5ウィンドウ = 3-5個のClaude Codeインスタンス
CMSオーケストレーション:1人 × 3-5ウィンドウ × 自動化オーケストレーション = 30-50個の等価インスタンス
これがデータ量が驚異的な理由を説明しています—作業速度が上がったのではなく、多くのAgentが同時に並行作業しているのです。
3台のコンピューター × 各コンピューターで複数ウィンドウ × CMSオーケストレーション
= 90-150個の等価Claude Codeインスタンス
これはアーキテクチャ設計によって実現された「一人軍団」効果です。
5. 本当の仕事は「設計」にある
105,000メッセージの大部分はAgent間のコラボレーションの産物です。しかし、これを機能させているのは、精密に設計された:
- 36個のCommands
- 38個のSkills
- 44個のAgents
- 完全なHooksシステム
- 標準化された出力形式
メッセージ量は結果であり、設計能力が原因です。
使用パターン:会話ではなく、指揮
レポートで最も正確な説明:
「You delegate ambitious, large-scale automation tasks to Claude and supervise with minimal intervention, treating it as an autonomous execution engine rather than a conversational assistant。」
これは普通の「AIに質問する」使い方ではありません。これは:
1. Multi-Clauding(並行セッション)
同時実行セッション数:76
重複イベント:140回
総メッセージ量の割合:5%
彼は複数のClaude Codeセッションを同時に実行し、異なるタスクを並行処理しています。
2. 3台コンピューターワークステーションモード
これは「コンピューターを切り替えて作業」ではなく、3台のコンピューターが同時に稼働しています:
コンピューターA:セキュリティリサーチ + GitHubスキャン
コンピューターB:ウェブサイト開発 + コンテンツ制作
コンピューターC:その他のプロジェクト + 実験
各コンピューターで複数のClaude Codeセッションが同時に実行され、分散作業環境を形成しています。
3. 大規模自動化
1つのセッションの成果:
- 20個のセキュリティ脆弱性を修正
- 3つのサブプロジェクトにまたがる
- Commit + Push
- 同時にドキュメント用のブログ記事の執筆を開始
4. GitHubスケールスキャン
レポートからの「トリビア」:
「User unleashed Claude on a ‘mega scan’ hunting for API keys across GitHub like a digital truffle pig」
「Phase 5 of an escalating large-scale API key scanning operation across GitHub repositories — the kind of ambitious security research that makes you wonder what Phases 1-4 looked like」
Phase 5。これは彼がすでに大規模GitHub APIキースキャンスクリプトの少なくとも5つのバージョンをイテレーションしたことを意味します。
Bootstrap Kit:これを可能にするアーキテクチャ
彼の~/.claude/ディレクトリは通常の設定ではなく、完全なClaude Bootstrap Kitです:
~/.claude/
├── CLAUDE.md ← コアポリシー定義
├── commands/ ← 36個のカスタムコマンド
├── skills/ ← 38個の専門スキル
├── agents/ ← 44個の専門Agent
├── hooks/ ← ライフサイクルフック
├── docs/ ← 完全なドキュメントシステム
└── ... ← その他の自動化コンポーネント
コア哲学:5つのポリシー
1. 完全オープン(Allow All)
すべてのローカル操作を直接許可、制限なし。
原則:ローカル操作は安全(Gitで元に戻せる)、確認で時間を無駄にしない。
2. 効率優先(Efficiency First)
IF 操作が「リモートで不可逆」(git push --force, DB DROP TABLE):
→ 簡単な確認
ELSE:
→ 直接実行、1-2文で説明
3. 並列処理(Parallel Processing)
5つのAgentが同時実行 = max(個別時間)、sum(全時間)ではない
4. 中断なし(No Interruption)
提案するだけでなく、積極的に実行。
新機能開発 → 直接5つの並列agentを起動
5. データベース優先(Database First)
任意のデータベース操作の前に:
✅ テーブル/カラムの存在を確認
✅ 最新スキーマをチェック
❌ 構造の存在を絶対に仮定しない
ワークフロー:ワンクリックで複雑なタスクを起動
彼の自動化コマンドは複雑な作業を1行の指示に変えます:
| コマンド | 機能 |
|---|---|
/workflow | 5ステップ完全開発フロー |
/speckit | 仕様駆動開発(5フェーズ自動実行) |
/auto | 自動化開発サイクル |
/solve-github-issue | IssueからPRまで全自動 |
/commit-push-pr | Commit + Push + PRをワンクリック |
/diagnose | 統一エラー診断 |
各コマンドの背後には精密に設計されたAgentコラボレーションがあります。
なぜInsightsがフリーズしたのか?
バックアップデータをマージした時:
| データ | 量 |
|---|---|
| 履歴レコード | 4,522行(950行から復元) |
| プロジェクトディレクトリ | 56プロジェクト |
| セッションデータ | 11 GB |
11 GBのセッションデータ。このボリュームはInsightsシステムの設計上の想定を超えています。
彼は何に取り組んでいるのか?
データから見える作業領域:
- セキュリティ脆弱性修正 — 大規模自動スキャンと修正
- APIキーセキュリティリサーチ — GitHubスケールのクレデンシャルスキャン
- ニュースレターシステム — 自動化コンテンツ制作パイプライン
- Pythonデータ分析 — 大量のPython開発
- 技術ドキュメント — 開発しながらドキュメント作成
これは複数の大規模プロジェクトを同時に進行している開発者であり、各プロジェクトでAI支援自動化を使用しています。
評価:Bootstrap Kitの価値
観察者として、このシステムに対する評価:
強み
- 明確な哲学 — 「効率優先、ローカル操作は確認しない」この原則が人機インタラクションの摩擦を大幅に削減
- モジュラー設計 — Commands / Skills / Agentsが明確に階層化され、再利用可能
- 深い自動化 — 単一コマンドから完全なワークフローまでカバー
- 並列処理 — Claude Codeのマルチエージェント機能をフル活用
このシステムが解決するコア問題
従来のAI使用方法:
人間が質問 → AIが回答 → 人間が確認 → AIが実行 → 人間が確認 → ...
Bootstrap Kitの方法:
人間がコマンド → AIが完全なワークフローを自律実行 → 人間が結果を確認
これは「オーケストレーション式」のAI使用アプローチであり、従来の会話式使用とは本質的に異なります。
結論:異なるAIコラボレーションモデル
このケースはClaude Code使用の別の可能性を示しています:
- 会話アシスタントからプログラム可能なワークフローエンジンへ
- Q&Aからマルチエージェントコラボレーションへ
- 標準的な使用からカスタムアーキテクチャ設計へ
- 受動的な応答から能動的なオーケストレーション実行へ
この使用パターンには追加の投資が必要です:
- システム設計 — Agentがどのようにコラボレーションするかを設計
- 抽象化能力 — 繰り返しのワークフローを再利用可能なSkillに変換
- アーキテクチャ思考 — 何を自動化し、何に人間の介入が必要かを判断
- 継続的イテレーション — 実際の使用に基づいて常に最適化
このケースは現象も反映しています:使用パターンがツールの当初の設計期待を超えると、エッジケースに遭遇する可能性があります(Insightsシステムのパフォーマンスボトルネックなど)。これはツールの継続的な改善にとって価値あるフィードバックです。
異なるユーザーには異なるニーズがあります:
Level 1:Claude Codeをスマートアシスタントとして使用
Level 2:開発パートナーとして使用
Level 3:オーケストレーション可能なワークフローエンジンとして使用
Level 4:CMSを使用して一人で数百のインスタンスを制御
各使用パターンには適切なシナリオがあります。そしてLevel 4のユーザーが現れた時、Insightsシステムは言います:「これは私の理解の範囲を超えています。」
付録:キーデータサマリー
# 5日間(単一コンピューター)
sessions: 6,009
messages: 35,204
total_hours: 4,988
bash_invocations: 158,490
commits: 2,290
lines_added: 5,791,536
files_touched: 31,453
playwright_actions: 12,000+
parallel_sessions: 76
security_fixes_one_session: 20
# 3台コンピューター推定合計(5日間)
estimated_total_sessions: ~18,000
estimated_total_messages: ~105,000
estimated_total_hours: ~15,000 # 625日に相当
estimated_bash_calls: ~475,000
estimated_commits: ~6,900
estimated_lines_added: ~17,000,000
# Bootstrap Kit
commands: 36
skills: 38
agents: 44
total_components: 126
「私はAIが測定できない男になった。」
— Claude Codeを極限まで使いこなすパワーユーザー
この記事は特定のユースケースにおけるClaude Code使用経験を記録したものであり、他のユーザーやツール開発者の参考になることを願っています。Bootstrap Kitはオープンソースプロジェクトであり、コミュニティからのフィードバックと貢献を歓迎します。