
Claude Fable 5が最も真価を発揮する場所:エージェント型ソフトウェアエンジニアリングのためのClaude Code、Cursor、Windsurf、Copilot、Cline/Rooの比較
フック:最高のコードモデルを超えて
AIに「機能を本番環境にデプロイして」と指示するだけで、AIが自ら計画し、コードを書き、テストし、コミットし、さらにはプルリクエストを作成するのを見ることを想像してみてください。今日のAIコーディングアシスタントは、もはや単なる自動補完ツールではありません。それらは、洗練されたシステム内で動作するエージェント型ソフトウェアエンジニアなのです。「どのモデルが最高の関数を書くか?」と問うだけでは不十分です。代わりに、私たちは**「どの設定が強力なモデルを信頼できるコーディングパートナーに変えるのか?」**と問いかけます。同じClaudeモデルでも、シンプルなブラウザチャットで使う場合と、ターミナルアクセス、メモリ、安全チェックを備えたIDE内で使う場合とでは、そのパフォーマンスは大きく異なります。この記事では、最新のClaudeモデルと、AnthropicのClaude Codeからオープンソースエディタに至るまで、実際のコーディング作業にそれを活用するツールを解き明かします。
最新のClaudeモデル
Anthropicの最新のフラッグシップモデルは、2026年6月にリリースされたClaude Fable 5です。Fable 5は、同社が「一般利用のために安全にした」「ミトスクラス」モデルとされており、特に長く複雑なタスクにおいて、「これまでに一般公開されたどのモデルの能力も超える」性能を持つとされています (www.anthropic.com)。Anthropicの公式ドキュメントでは、Fable 5を「最も広くリリースされた有能なモデル」と呼んでおり、このファミリーはコーディングベンチマークで以前のClaude Opus 4.8を上回っています (platform.claude.com)。(より強力なClaude Mythos 5 – 一部の安全フィルターがない同じ基盤モデル – は、特別なプログラムに限定されており、一般には公開されていません (www.anthropic.com))。
Anthropicは、Fable 5を野心的なソフトウェアプロジェクト向けの主力モデルとして位置付けています (www.anthropic.com)。非常に大きなコンテキストウィンドウ(最大100万トークン)を持ち、数日間にわたる計画やコーディングセッションでコンテキストを維持するのに優れています。例えば、Anthropicは、Fable 5が5000万行のRubyコードベースを1日で移行したという社内テストを挙げています。これは通常、チーム全体で2ヶ月かかる作業です (claude-news.today)。要するに、Fable 5は徹底的で、積極的で、自己テスト可能になるように構築されています。さらに、新しいビジョン機能を使って、コードの出力がデザインと一致しているかを確認することもできます (www.anthropic.com)。
Fable 5は、AnthropicのAPIでモデルID claude-fable-5として利用可能です (platform.claude.com)。価格は、入力トークン100万あたり10ドル、出力トークン100万あたり50ドルです (www.anthropic.com) (www.anthropic.com)(Opus 4.8のトークンあたりのコストの約2倍)。2026年6月には、AnthropicはFable 5をサブスクリプション層に一時的に追加料金なしで含め、その後7月23日にはクレジットベースの使用に移行しました (www.anthropic.com)。いずれにせよ、あなたやツールがアクセス権限を持つAnthropic APIキーを持っている場合、他のClaudeモデルと同様にFable 5を直接呼び出すことができます(例:AWS BedrockまたはClaude Platform経由で) (platform.claude.com)。
数あるタスクの中で、なぜコーディングなのか? AnthropicはFable 5を最高のコーディングモデルと明言しています。その製品ページでは、Fableが「大規模な移行、複雑な実装、複数日にわたる自律セッションを含む、意欲的なコーディングプロジェクトに最も適したモデルです」と謳われています (www.anthropic.com)。Anthropicのベンチマークによると、Fable 5は「最も困難なコーディングベンチマーク」でOpus 4.8の2倍の性能を発揮します (claude-news.today)。計画、テスト、ビジョンといった機能により、Fable 5は単一の関数を書くだけでなく、ソフトウェアをエンジニアリングするために設計されました。
ハーネスが重要な理由
Claude Fable 5のようなLLMでは、本当の魔法(あるいは本当の苦労)は、その周りのハーネス、つまりメモリ、ツール、ワークフローを提供するエディターやアシスタントから生まれます。単一のプロンプトに応答するモデルは、サンドボックス化されたコード実行、永続的なチャット履歴、Git統合を備えた長時間のループで動作するモデルとは根本的に異なります。
-
状態とコンテキスト: シンプルなチャットインターフェースでは、Fable 5はあなたが貼り付けたものしか記憶できません。エージェント型ハーネスでは、コードベース全体と会話をメモリに保持できます。例えば、WindsurfのCascadeエージェントは「開発者のセッション内のすべてを認識」し、Claudeの完全なコンテキストウィンドウを使用して次のステップを計画します (claude.com)。この継続性により、モデルは追跡を失うことなく複数ファイルの変更や機能構築を行うことができます。
-
ツールアクセス: 単純なチャットモデルは話すことしかできません。エージェントは行動することができます。Claude CodeやClineのようなツールは、Claudeに仮想IDEを提供します。ファイルを読み書きしたり、シェルコマンドを実行したり、依存関係をインストールしたり、テストを実行したりできます。この「目と手」の機能は、モデルができることを根本的に変えます。例えば、ClineはClaudeに明示的にターミナルコマンドを実行させ、さらにはブラウザを起動してウェブアプリをテストすることも可能です (cline-efdc8260.mintlify.app)。つまり、Claudeにどのようなテストを書くべきかを尋ねる代わりに、実際にそれらのテストを書いて実行させることができるのです。
-
計画とループ: 素のLLMは一度に一ターンしか実行できません。エージェントフレームワークは、そのモデルをループで実行できます。計画を統合し(「プランモード」)、その一部を実行し(「アクティブモード」)、結果をチェックし、反復します。Claude Codeのようなツールには、モデルが多段階の変更を計画し、サブタスクを自身に委任できる組み込みのワークフロー(プラン/アクティブモード)があります。これがなければ、単発のプロンプトしか得られません。Anthropicが指摘するように、Fable 5は、複数の段階にわたって計画を立て、サブエージェントを生成し、自己チェックを行うことができる場合に特にその能力を発揮します (www.anthropic.com)。
-
安全性とロールバック: エージェントは、チャットボットにはない「ブレーキ」を追加できます。例えば、Clineはすべてのファイル編集を実行前に承認することを求め、ワークスペースを自動的にスナップショットするため、いつでも任意の時点に復元できます (cline-efdc8260.mintlify.app)。Claude Codeは、コマンドを制限するために「セーフモード」で実行できます。対照的に、安全対策の少ない実験的なシェルエージェントは、誤ってファイルを削除する可能性があります。
要するに、モデルは全体像の半分に過ぎません。そのメモリ、ツール、ガードレールといったハーネスが、実際のコーディングワークフローの成否を分けます。同じClaude Fable 5でも、VS Codeプラグイン(即座の提案、ファイルナビゲーション、Gitコンテキストを備えたもの)を動かす場合と、ステートレスなウェブチャットで使う場合とでは、全く異なる感触になるでしょう。
ツールごとの比較
それぞれのAIコーディング製品はClaudeを異なる方法で使用しています。以下では、主要なエージェント型コーディングハーネスを、最新のClaudeをどのように組み込んでいるかに焦点を当てて見ていきます。
Anthropic Claude Code
Claude Codeは、Anthropic公式のVS Code/ターミナルエージェント環境です。Claudeモデルを完全なエージェントモードで実行します。バージョン2.1.170(2026年6月)現在、Claude CodeはClaude Fable 5をサポートしています (newreleases.io) (claude-news.today)。Claude Codeを更新後、claude --model claude-fable-5コマンドを発行して使用できます。舞台裏では、Claude Codeは長時間のセッションを管理します。リポジトリを読み込み、変更を計画し、ツールを実行し、コミットやプルリクエストの作成まで行うことができます。コンテキストのために実行中のトランスクリプトと作業ディレクトリを維持します。コマンド(例:テストを実行、ファイルを開く)を介して制御でき、満足したらGitに変更をプッシュできます。
- モデル: Fable 5(
claude-fable-5経由)または古いClaude 4モデル。CLIでは、任意のClaude APIモデルまたはエイリアス(例:opusplan、sonnet)を選択できます (code.claude.com)。 - 使い方: コマンドラインエージェントまたはVS Code拡張機能として機能します。単発の補完だけでなく、多段階のワークフローのために設計されています。例:コーディング前に計画を立てるための「プランモード」があります。
- 制御: アクションは明示的に承認します。すべてのファイル編集はステージングされますが、コミットを確定するまで最終決定されません。セッショントランスクリプトと
post-sessionフックを介して、簡単にキャンセルまたは元に戻すことができます (claude-news.today)。 - コンテキスト: セッション履歴とワークスペースを維持します。限られたコンテキストウィンドウ(プロンプトあたり約20万)ですが、ターンをまたいでファイルを「記憶」することができます。また、永続的なメモリ機能(Anthropicはこれを「ファイルベースのメモリ」と呼んでいます)をサポートしており、これによりFable 5の長時間のタスクにおける有効性が3倍になります (claude-news.today)。
- 安全性: 組み込みの安全策(例:危険なアクションを制限する
/safe-mode)を含みます。Fable 5自体にはサイバーセキュリティ/生物学に関するコンテンツフィルターがあります。フラグが立てられたクエリは、自動的に次に安全なモデルであるOpus 4.8にフォールバックします (www.anthropic.com) (www.anthropic.com)。変更は常に承認する必要があり、最終的な制御はあなたにあります。 - コスト: Claude CodeでFable 5を実行すると、Claudeのクレジット(100万トークンあたり10ドル/50ドル)を消費します。安価なモデルやローカルの代替手段と比較して、1〜2時間の長い開発セッションでは、コストがかさむ可能性があります(数百ドル)。
- レビュー/使いやすさ: すべての変更は対話型セッションを介して行われるため、すべての提案と差分を確認できます。いつでも停止したり、監査したりできます。
claude sessionのトランスクリプトは、事後レビューのためにすべてを記録します。
Cursor (AI IDE)
Cursorは、多くのモデルの中にClaudeを統合する商用AIコーディングアシスタント(現在開発者プレビュー版)です。Cursorのインターフェースには、チャットウィンドウ、インテリジェントなIDEエディタ、大規模なタスク向けの「エージェントモード」が含まれています。そのドキュメントには、選択可能なモデルの1つとして**Claude Fable 5(30万コンテキスト)**がリストされています (docs.anyweb.dev)。実際には、デフォルトのCursorプラン(Composer 2.5またはGoogleのGemini)がデフォルトで実行されますが、モデルメニューでCursorを「Claude Fable 5」に切り替えることができます。
- モデル: Cursorは複数のモデルを使用できます。そのテーブルには、[Anthropic]がClaude 4.xとFable 5の間で選択していることが示されています。例えば、Fable 5はOpus 4.8と並んで30万コンテキスト容量で表示されています (docs.anyweb.dev)。(注:2026年初頭現在、CursorでのFableサポートには「Pro」プランまたはBYOKが必要な場合がありますが、Cursorのドキュメントでは利用可能であると示されています。)
- 使い方: Cursorは、チャット補完、インライン編集(Tab補完)、および「プランモード」と呼ばれる強力なエージェントを組み合わせたものです。主にIDEプラグインであり、ターミナルエージェントではありません。リポジトリを認識し、バックグラウンドでコードベースを解析し、そのコンテキストを提案に利用します。
- 制御: Cursorからの変更のほとんどはエディタに表示され、手動で承認または拒否します。また、専用のエージェントビューもあり、そこでタスク(「機能Xを実装」)を与えると、複数ファイルの編集を試みます。その場合でも、開発者はコミット前に各変更を確認します。
- コンテキスト: Cursorは、ターンをまたいで会話コンテキストを維持します。また、リポジトリ全体を見てチェックリストを作成する「プランモード」などの機能も備えています。Cursorチームによると、次のステップを計画するために開発セッション履歴全体をコンテキストに保持します (claude.com)。深いタスクでは「Maxモード」で最大1Mトークンを処理できます (shtruzel.ru)。
- 安全性: Cursorはクラウドホスト型であるため、共有するコードはCursorのサーバー(選択されたモデルと共に)に送られます。開発者は引き続きすべての変更を検査するため、偶発的な出力も捕捉可能です。Cursorはエージェント型のセキュリティ機能については言及していませんが、バージョン管理と統合されているため、コードを失うことはありません。
- コスト: Cursorのエージェントモードは、タスクごとまたは月額制です。Claude Fable 5を使用すると(利用可能な場合)、Cursorのクレジットを急速に消費します。Cursorは、コスト削減のために独自の最適化された「SWE」モデルを使用することを推奨することがよくあります(古いClaudeモデルよりも13倍高速です (docs.windsurf.com))。
- レビュー/使いやすさ: Cursorはすべての計画ステップをバージョン管理します。各コミットの「前/後」を比較できます。エージェントの変更をレビューするためのUIは洗練されており、タスク全体を元に戻すことができます。チャットモードでは、他のIDEプラグインと同様に、スニペットを手動でコミットまたは破棄します。
Windsurf (Cascade IDE)
Windsurf Cascadeは、自身をAIネイティブIDEと位置付けています。コーディングに特化した独自の内部「SWE」モデルを持っていますが、「Bring Your Own Key」(BYOK)を介してAnthropicもサポートしています。重要な点として、Windsurfは2026年半ば時点ではFable 5への直接的なパイプラインを持っていませんでした。その公開ドキュメントにはClaude 4 Sonnet/Opusモデルのみが記載されており、BYOK機能はClaude 4.0/4.1モデルのみに限定されていました (docs.windsurf.com)。実際には、Windsurfは流動的な状況にありました。TechCrunchは、Anthropicが2025年にWindsurfのClaude 3.xおよび4.xへの直接アクセスを遮断したと報じました(合併の噂の中で)、これによりWindsurfはサードパーティサーバーまたはBYOKに依存せざるを得なくなりました (techcrunch.com)。Anthropicは、ユーザーがClaude APIキーを差し込むことはできると述べましたが、それは古いSonnet/Opusモデルのみであり、Fableについては言及されていませんでした (docs.windsurf.com) (techcrunch.com)。
- モデル: Windsurfの組み込みエージェントは、デフォルトでWindsurf独自のモデル(SWEシリーズ)を使用します。AnthropicキーでBYOKを有効にすることで、Claude 4 Opus/Sonnetモデルを使用できます。*2026年半ば現在、Fable 5はWindsurfで公式にはサポートされていないようです。*Windsurfのリーダーでさえ、クライアントがClaudeのために「自身のキーを持ち込む」必要があり、それが本来よりも高価であることを認めています (techcrunch.com)。
- 使い方: Windsurfは、AIアシスタントを備えたIDE(VS Codeのフォーク)です。Composerペインでプロンプトを与えたり、コードを選択してCascadeに尋ねたりします。また、自動的に補完を提案します。
- 制御: Windsurfのエージェントは自動コミットしません。エディタにコードを挿入し、ユーザーが最終決定します。ユーザーは提案を信頼するためにループ内に留まります。(GitHub/Slackなどとも統合されていますが、いかなる変更も手動または承認が必要です。)
- コンテキスト: Cascadeの強みは、プロジェクトの非常に広範なコンテキストを保持することです。Windsurfチームは、「開発活動の長いシーケンスを理解し、推論する」ことができ、セッションで起こっているすべてを見て次のステップを導くことができると強調しています (claude.com)。また、コンテキスト検索のためにリポジトリを強力にインデックス化するため、ほぼ瞬時の応答を主張しています (claude.com)。
- 安全性: 手動承認が必要であることに加え、Windsurfのコード変更はIDE環境内で発生します。保存する前に編集内容を確認できます。Windsurfはクラウド接続されているため、コードはWindsurfのサーバー(またはBYOKプロバイダー)に送信されます。機密性の高いコードベースの場合、これは懸念事項となる可能性があります。
- コスト: Windsurfは企業向けのサブスクリプションベースです(年間経常収益が1億ドルに達することもあります (techcrunch.com))。BYOK Claudeモデルを使用する場合、Windsurfの料金に加えてAnthropicに直接支払うことになります。内部のSWEモデルは、速度と低コストを重視して設計されています。
- レビュー/使いやすさ: Windsurfは、AIが生成したすべてのコードをエディタで通常の差分として表示します。エージェントタスクを簡単に元に戻したり、再実行したりできます。ただし、ロールバックは通常のGit操作に依存しており、Gitが提供するもの以外の特別なチェックポイントはありません。
GitHub Copilot (Copilot Workspaces /Agent)
GitHubのCopilot(特にCopilot Chat / Workspaces)は、現在ベータ版でAnthropicモードの**「Anthropic Claude Agent」**を提供しています (docs.github.com)。これはCopilotインターフェースで動作するサードパーティのコーディングエージェントですが、使用できるClaudeモデルは制限されています。GitHub Docsによると、サポートされているAnthropicモデルはClaude 4シリーズのみ(Opus 4.5~4.7およびSonnet 4.5~4.6)です (docs.github.com)。つまり、Copilotは現在Fable 5を提供していません。(Copilotサブスクリプションはこのエージェントへのアクセスを許可しますが、AIは基本的にCopilotの傘下でAnthropicによってホストされています。)
- モデル: CopilotのAnthropicエージェントはClaude 5ではなく、最大Claude 4.7を使用します。(利用可能な最良のモデルを選択する「自動」モードも可能です。)OpenAIファンにとって、Copilotの標準補完は引き続きOpenAIのモデル(例:GPT-4)によって動かされているため、プロバイダを切り替えずに「Copilot Chat」を使用すると、依然としてGPTベースの提案が得られます。
- 使い方: Anthropicエージェントは、別のCopilotチャットサイドバーとして表示されます。これに「タスクを割り当てる」(修正するイシューなど)と、Claudeを使用しようとします。GitHubのイシュー/PR知識と統合されており、変更をPRにコミットできます。通常のCopilotの自動補完では、舞台裏ではOpenAIが使用されます。
- 制御: GitHubに紐付けられているため、エージェントが作業を終えると、GitHubサイトで通常のPR差分がレビューのために表示されます。依然として承認とマージが必要です。
- コンテキスト: エージェントは現在のリポジトリと最近のユーザーチャットを認識していますが、実際に数日間にわたるセッションを実行しているわけではありません。そのブラウザセッション内のCopilotチャットでの以前のターンを記憶している可能性があります。
- 安全性: これは依然としてクラウドサービスです。変更はプルリクエストを介してリポジトリに入り、マージはあなたが制御します。GitHubには、どのエージェントを有効にできるかに関する独自のポリシー制御があります。AnthropicのClaudeの安全対策(Opusフォールバック)は舞台裏で適用されます。
- コスト: Copilotはサブスクリプションベースです。原則として、トークンごとではなく、Copilotシート(月額約10ドル/ユーザーから)に対して支払います。Anthropicの使用料はその料金(またはエンタープライズプラン)に含まれている可能性があります。
- レビュー/使いやすさ: 出力は実際のPRやチャットの返信となるため、通常のコードと同様にレビューします。あなたの承認なしに自動的に書き換えられることはありません。
Cline (オープンソースAIエージェント)
Clineは、自身のエディタまたはターミナルで実行するオープンソースのコーディングエージェントです。モデルにとらわれず、任意のLLM(Anthropic、OpenRouter、OpenAIなど)の独自のAPIキーを提供します (cline-efdc8260.mintlify.app)。実際には、有効なClaude APIキー/プロバイダーがあれば、ClineをClaude Fable 5に接続できるということです。Clineのセールスポイントは透明性と制御性であり、**「モデルロックインなし」および「すべての決定が可視化される」**です。
- モデル: あなた次第です。デフォルトでは、Claude、GPT-4/5、Gemini、さらにはローカルのオープンモデルの実行をサポートしています。Claudeを使用するには、Clineの設定でClaude APIキーを設定します。すると、他のAPIと同様に、選択したClaudeモデル(例:
claude-sonnet-4.6またはclaude-fable-5)にプロンプトを送信します。 - 使い方: ClineはVS Code、JetBrains内で動作するか、CLIとして動作します。Clineを開き、実行したい内容を入力します(計画と実行モード)。その後、コードベースを巡回し、変更を加えたり、コマンドを実行したりできます。基本的に、コマンドラインのエージェントアシスタントのように対話します。
- 制御: Clineは明示的なヒューマン・イン・ザ・ループを謳っています。すべての変更をリストし、確認を求めます。内部的には実際にgitコマンドやシェルコマンドを実行し、適用前にすべての差分チャンクを確認できます。何か問題があれば、拒否できます。また、Clineはファイルの「チェックポイント」を自動保存するため、簡単にロールバックできます (cline-efdc8260.mintlify.app)。
- コンテキスト: Clineはセッションワークスペースを維持し、コマンドをまたいで物事を「記憶」できます。また、開始および再開できるタスクの概念も統合されているため、30〜90分以上のグローバルな状態を保持できます。ただし、開いているセッション以外に組み込みの長期メモリストアはありません(AGENTS.mdファイルなど)。
- 安全性: ローカルで動作するため、リポジトリにとって非常に安全です。あなたのコードがClineのサーバーに送られることはなく、設定したLLM APIにのみ送られます。すべてのアクションにはあなたの承認が必要であり、Clineの組み込みロギングにより、送信された正確なプロンプトと返された差分を確認できます。これは本質的に「ブラックボックスなし」の設計です (cline-efdc8260.mintlify.app)。
- コスト: APIの料金を支払います。Anthropicキーを介してClaude Fable 5を使用する場合、Anthropicの料金(10ドル/50ドル)を支払いますが、追加のサブスクリプション料金や仲介手数料はかかりません。予算を重視する場合は、より安価なモデル、またはトークンあたりのコストがかからないローカルモデル(Clineはローカルモデルもサポートしているため)に切り替えることができます。
- レビュー/使いやすさ: Clineのワークフローはレビュー可能性を重視して設計されています。すべての変更はステージングされ、すべてのコマンドと差分が表示され、チェックポイントにより、いつでも元に戻すことができます (cline-efdc8260.mintlify.app)。基本的に各ステップの確認に「Enter」が必要なため、遅いですが安全です。セッションの完全なログを監査用にエクスポートすることもできます。
Roo Code (オープンソースVS Code拡張機能)
Roo Codeは、チーム向けのもう1つのオープンでモデルに依存しないコーディングアシスタント(VS Code拡張機能)です。プラグイン可能なモデルとワークフローを重視しています (roocodeinc.github.io)。Clineと同様に、Rooはプロバイダープラグインをインストールすることで、どのモデルプロバイダーでも選択できます。Rooのドキュメントには、Anthropicとの統合がプロバイダーオプションとして明示的に示されています (roocodeinc.github.io)。言い換えれば、Anthropicプロバイダーを介して、あなたのAPIキーを提供すればFable 5を使用できるということです。
- モデル: Rooはモデルに依存しません。つまり、プロバイダー(Anthropic、OpenAI、Googleなど)をインストールします。Rooのドキュメントには、「Anthropic」がClaude APIキーで追加できるプロバイダーとしてリストされています (roocodeinc.github.io)。組み込みモデルは付属せず、クライアントフレームワークです。
- 使い方: RooはVS Code内で動作します。「AIに機能の計画を依頼する」などのモードや、インライン提案があります。拡張機能APIを介してリポジトリのコンテキストを理解できます。
- 制御: 使用したいプロバイダー/モデルは明示的に有効にする必要があります。Clineと同様に、RooはAIが生成した編集をエディタで通常の差分として表示します。保存する前に元に戻したり、調整したりできます。Rooは、AIを誘導するための「専門モード」(例えば、ドキュメント作成に焦点を当てるか、コードタスクに焦点を当てるかなど)もサポートしています。
- コンテキスト: Rooはワークスペースを参照できます(完全なファイルアクセス権を持つVS Code内で動作します)。現在の編集コンテキストと、あなたが維持する会話以外の独立した「メモリ」は持っていません。プロンプトを連結できるバックエンドはありますが、長期メモリや永続的なエージェントは主な焦点ではありません。
- 安全性: オープンでローカルであるため、合理的に安全です。レビューなしでコードがどこかにコミットされることはありません。ただし、選択したLLM APIにプロンプトを送信するため、機密性の高いコードはあなたのコンピュータを離れます。
- コスト: Roo自体は無料です。Anthropicモデルと一緒に使用する場合、API使用料のみがかかります。Rooは、コスト削減のために、より安価なLLMやセルフホスト型LLM(OllamaやLM Studioのようなプロバイダー経由で)を使用することも推奨しています。
- レビュー/使いやすさ: Rooは、タスクに集中するための「専門モード」を提供しますが、各変更はVS Codeの編集として表示されるため、通常通りレビューします。マージしない限り、Gitに自動的に何もコミットすることはありません。
Continue (オープンソースコーディングエージェント)
Continueは、AIコーディング用のオープンソースのVS Code拡張機能およびCLIです。ソース管理されたAIチェックとCIパイプラインとの統合に重点を置いていますが、インタラクティブなエージェントも提供しています。公開されているモデルレジストリ(Continue Hub)を見ると、エージェントモードでAnthropicのClaude 4 Sonnet(Claude 4.6モデル)をサポートしていることが示されています (hub.continue.dev) – 注目すべきは、Claude 5への言及がないことです。2026年6月現在、Continueは依然として20万コンテキストの「anthropic/claude-4-sonnet」までしかリストしていません (hub.continue.dev)。つまり、ドキュメントやプロジェクトが更新されない限り、Continueを通じてFable 5を使用することはできません。
- モデル: レジストリは、Claude 4.x(およびおそらくOpenAI/GPTモデル)のすぐに使えるサポートを示しています (hub.continue.dev)。まだClaude Fable 5はリストされていないため、Continueエージェントは古いコード中心のモデルで実行されます。
- 使い方: Continueには、VS Code内に複数のモード(エージェント、チャット、自動補完)があります (marketplace.visualstudio.com)。エージェントモードでは、GitHubのイシューやタスクを受け取り、リポジトリ全体でコード化を試みることができます。チャットモードはコードに関するQ&A用です。ルールを強制するCI統合もあります。
- 制御: IDE拡張機能として、提案と変更はエディタに表示されます。編集を承認する必要があり、Continueがあなたのリポジトリに密かにコミットすることはありません。また、GitHubと統合されているため、タスクをレビュー用のイシュー/PRとしてプッシュバックできます。
- コンテキスト: Continueはリポジトリの状態を認識しています(GitHubリポジトリにアタッチできます)。各エージェントセッションはステートフルな会話ですが、長期メモリや永続的なルールファイルに関する公開情報はありません。ハブを介した「テンプレート」と「コンテキスト」の概念はあります。
- 安全性: ソースコードはセッション内に保持されます。Continueのエージェントアクションは、あなたがそれらを受け入れることを要求します。CIに焦点を当てた設計は、レビューされた変更のみがマージされるように強制できることを示唆しています。
- コスト: Continueは無料(Apache 2.0)です。設定した任意のLLM APIをサポートします。したがって、もしClaude Fable 5を組み込んだ場合、Anthropicの料金を支払うことになります。しかし、そのままの状態ではGPTまたはClaude 4を使用する可能性が高いです。
- レビュー/使いやすさ: Continueはすべての変更をログに記録します。また、「AIチェック」の作成、つまりCIにおけるユニットテストやリンターの作成を強調しています。任意の提案にタグを付けてコードレビューのコメントにすることもできます。元に戻すのは通常のGitロールバックです。
Devin (Cognition AI)
Devinは、Cognition.aiが開発した商用「AIソフトウェアエンジニア」です。他のツールとは異なり、Devinは単に公開LLMを囲むハーネスではありません。独自のAIバックエンド(おそらくコードに最適化されたCognitionモデル)を備えた完全なエージェント製品です。Devinがどのようなモデルを使用しているかは正確にはわかりませんが(Anthropicまたはカスタム?)、CognitionはDevinが一般的なLLMエージェントを超える高度な計画と記憶能力を示すと主張しています (cognition.ai)。例えば、彼らのブログでは、Devinが「すべてのステップで関連するコンテキストを想起し」、時間とともに学習できると述べています (cognition.ai)。ベンチマークでは、オープンソースのバグ修正(SWE-bench)において、Devinは以前のモデルをはるかに上回る性能を発揮しました (cognition.ai)。
- モデル: プライベートです。インストールや設定するものではなく、ホスト型サービスです。CognitionはDevinをClaudeの同等品としてブランド化しておらず、独自のLLMまたはアンサンブル(同社の「Cognition AI Lab」モデル)です。したがって、Claude Fable 5の観点から見ると、Devinは競合製品であり、Claudeを実行する場所ではありません。
- 使い方: Devinは大規模なエンジニアリングチーム向けです。Slack、Jira、GitHubなどのツールと連携し、それらのチャネルを通じてタスクを与えることができます。複雑なチケットを数時間から数日かけて実行します。
- 制御: Devinは管理されたエージェントであるため、チャットまたはタスクチケットを介して操作します。進捗を報告し、フィードバックを求めます。最終結果(コード変更)はGitHubまたはエディタに戻され、レビューされます。マージされるすべてのものに対して、最終的な承認権限はあなたが保持します。
- コンテキスト: Devinの主要なセールスポイントは、強力なメモリと計画能力です。各ステップでプロジェクトのコンテキストを想起し、使用でき、フィードバックから学習します (cognition.ai)。これは、単純なプロンプトウィンドウよりもはるかに豊富なオンデマンドメモリシステムを示唆しています。
- 安全性: コーダーが使用するツール(シェル、ブラウザなど)を備えたサンドボックス化されたクラウド環境で動作します (cognition.ai)。Cognitionは、Devinが試行できるタスクについて独自の制御を持っている可能性が高いです。ブラックボックスSaaSとして、Cognitionのポリシーを信頼する必要がありますが、マージは承認された場合にのみ行われます。
- コスト: Devinはプレミアム製品(企業向け)です。価格は公開されていませんが、おそらく他のエンタープライズコーディングAIと同等でしょう。基盤となるLLM呼び出しのコストはサービスにバンドルされています。
- レビュー/使いやすさ: 作業は実際のGitHubイシューとPRを介して行われます。Devinのパフォーマンスは印象的ですが(複雑な現実世界の問題で約13~14%の成功率 (cognition.ai))、他のAIと同様に完璧ではありません。Devinが利用可能であれば、ワンストップで利用できますが、Cognitionのシステムにロックインされます。
オープンソースターミナルエージェント
ターミナルで実行できるオープンソースのコーディングエージェントは数多くあり、その多くはClaude APIを指すことができます。例えば、CLIツールOpenAgentは、Claude Codeのオープンソース代替として宣伝されています (ask-sol.github.io)。これにより、「Claude Max」サブスクリプションまたは他のモデルをターミナルから使用できます。また、Claude CodeのアイデアをPythonで再実装したCLAW Code Agentもあります。さらに、Auto-GPTやLangChainのようなフレームワークもあり、人々はこれらをコーディングタスクに適合させています。
- モデル: BYOKを使用すると、これらのほとんどでClaudeを使用できます。OpenAgentは、Claude Maxプランを使用することで、プランで許可されている任意のClaudeモデルを呼び出せることを具体的に述べています (ask-sol.github.io)。したがって、CopilotまたはClaudeのサブスクリプションにFable 5が含まれている場合、理論的にはOpenAgentに接続できます。実際には、多くのオープンエージェントはOpus 4.xまでしかハードコードされていませんが(あるフレームワークはSonnetサポートを持っていました)、更新される可能性があります。
- 使い方: これらは完全にターミナル内で実行されます。高レベルのコマンド(例:「openagent plan」)を入力すると、エージェントはファイルの読み込み、コードの書き込み、コマンドの実行をループします。洗練されたUIのない、よりDIYなセットアップです。
- 制御: 通常、変更は依然として承認します。各差分は印刷されるか、レビューのためにエディタで開かれます。しかし、一部の実験的なエージェントには「自動コミット」モードがあります。注意して使用してください。チェックポイントやgitスタッシュはあなたの味方です。
- コンテキスト: ターミナルエージェントは、通常、ワークスペースとチャット履歴をターンごとにリロードします。長いコンテキストが必要な場合、一部はローリングプロンプト履歴を維持しますが、デフォルトではメモリは深くありません。それはツール次第です。長いGPTチャットを続けるように設定することも、そうしないこともできます。
- 安全性: 自動実行に設定されている場合はリスクが高いです。すべての進捗をレビューするようにロックダウンされていればより安全です。ローカルで制御するため、あなたのコードはClaudeへのAPI経由以外ではあなたのマシンを離れません(エージェントがウェブから取得する場合を除く)。
- コスト: ClaudeのAPIに料金を支払うことになります。多くのオープンエージェントは、より安価な代替手段としてローカルモデル(LLaMA派生など)を推奨しています。Claude Fable 5の場合、すべてのクエリで通常の10ドル/50ドルのトークン費用が発生します。
- レビュー/使いやすさ: これは様々です。OpenAgentのようなツールにはGit統合が組み込まれています。他のツールは、あなたが手動でGitを使用することに依存するだけかもしれません。すべての変更はローカルリポジトリにあるため、通常のレビューが適用されます。壊れた場合は、
git resetするだけです。
シナリオベースの比較
一般的なコーディングシナリオを順に見ていき、Claude Fable 5(または同等のモデル)を搭載した場合にどのハーネスがそれぞれのシナリオで優れているかを確認しましょう。
-
複数のファイルにまたがる新機能の構築: 大規模なコンテキストと計画が求められます。ここで最も優れたハーネスは、Claude Code(プランモード付き)とCursor(エージェントモード付き)です。どちらも複数ファイルの変更を追跡し、反復できます。Cline(ローカルエージェント)も適しています。「機能Xを実装」と指示すれば、コードとテストを実行しながら手順を組み立ててくれます。オープンソースのターミナルエージェントも可能ですが、手動で監視する必要があります。WindsurfのCascadeも可能ですが、Anthropicの限定的なサポートを思い出してください。ただし、独自のSWEエージェントが試みるかもしれません。Copilot(通常のチャット)は大規模な計画には本当に苦労します。最適: メモリを備えたIDE統合型エージェント(Claude Code / Cursor)。
-
本番バグのデバッグ: ここでは、シェルアクセスによる迅速な反復が必要です。ClineとClaude Codeが優れているのは、Claudeにデバッグコマンドを実行させ、ログを直接検査させることができるからです。「このスタックトレースを修正して」と指示すれば、ログをgrepしたり、テストを実行したり、修正を試みたりできます。Windsurfのエージェントは、単発のバグに対するワークフローにあまり焦点を当てていません。Copilot Chatはコードの説明には優れていますが、ターミナルがないと推測しかできません。Continueはイシューを開いてそれを順に処理することでこれを行うことができます。最適: ClineやClaude Codeのようなターミナル対応のエージェント。
-
大規模なコードベースのリファクタリング: 機能構築のケースと似ていますが、よりリスクが高いです。コード全体のコンテキストと慎重なステージングが必要です。ここでも、Claude CodeとCursorはバッチ変更を計画できるため、適しています。また、断片的にコミットすることもできます。Devinのようなエージェント(もしここで適用された場合)は、大規模なリファクタリングで強みを発揮しています(バグ修正でしたが、SWE-benchの結果を参照 (cognition.ai))。Clineはローカルでこれを行うことができます。WindsurfのSWEモデルは大規模なリファクタリングを試みるかもしれませんが、Claudeへのアクセスが制限されていました。最適: ハル環境 – 各チャンクを確認できるClaude CodeまたはCursor。
-
テストの作成と更新: エージェントがコードを生成し、その後テストを実行する必要があります。実行アクセス権を持つツールが際立っています。Claude CodeとClineは、文字通りテストスイートを実行し、失敗を確認してからコードを更新できます。Windsurf/Cursorはテストを提案できますが、内部で実行することはできません(コピーして実行します)。Copilot Chatはテストコードを出力するだけで、手動で実行する必要があります。したがって、IDE/ターミナル内のエージェントが最適です。最適: ターミナルを備えたエージェント、例:Claude Code、Cline。
-
なじみのないフレームワークでの作業: モデルは新しいAPIについて調査したり、推論したりする必要があります。ドキュメントブラウジングを伴うエージェントが役立ちます。Clineはブラウザを開いてドキュメントや例を取得することもできます (cline-efdc8260.mintlify.app)。ContinueとDevinはクラウドで情報を検索するかもしれません。真にオフラインのツールは、トレーニングデータ以外の新しい情報を取得できません。最適: ウェブアクセスを許可するエージェント(ブラウザ付きのClineや、自身で記事を取得できるDevin)または大規模な知識コーパスを持つエージェント。
-
ログとターミナル出力の読み取り: 生のログを見て、それに基づいて行動できるエージェントが必要です。Clineは、プロンプトにターミナル出力(例:
@[output.txt]を使用)を表示できます。Claude Codeも出力をモデルにパイプできます。Cursor/WindsurfはGUIに重点を置いており、自然にログを取り込むことはありません。Copilot chatはログスニペットを入力として受け取ることができるため、診断を試みることはできますが、ログを生成するコマンド自体を実行することはできません。最適: コンソール出力をAIのプロンプトにコピー/ペーストしたり、パイプしたりできるターミナル保持型エージェント(Cline、Claude Code、OpenAgent)。 -
GitHubイシューとPRの作成: 統合が鍵となります。Cursorは、GitHub/Linearとの連携を明示的にサポートしており、イシューを作成したり、それらにリンクしたりできます (docs.anyweb.dev)。ContinueとDevinも、インターフェースとしてGitHubイシューに接続します。Claude Codeはパッチを作成してリモートにプッシュしたり、ターミナルで指示したりできます。Copilot ChatはPRテキストとコードを生成できますが、コピーする必要があります。最適: シームレスなワークフローのために、既にGitHubを中心に構築されているツール(Cursor、Continue、統合を有効にしたDevin)。
-
他のAIエージェントが書いたコードのレビュー: これはより人間的なタスクですが、AIエージェントがレビューを手助けすることはできます。ここではどのチャットインターフェースでも機能します。Copilot ChatやCursorのチャットでは、コードを貼り付けて質問することができます。ClineやClaude Codeのようなエージェントは差分を開き、モデルにそれらを調べさせることもできます。しかし重要なのは、手動で検証することになります。レビューは本質的に人間の判断であるため、これを完全に自動化するハーネスは(まだ)ありません。トレーサビリティを重視するツール(Clineのログなど)は、人間のレビューを容易にします。
-
ライブラリ/フレームワークバージョンの移行: これは計画とコードの全面的な見直しの組み合わせです。大規模なリファクタリングに似ており、古いAPIと新しいAPIの両方の理解が必要です。広範な知識(Fable 5は多くのMLコードでトレーニングされている可能性が高い)とメモリを持つエージェントが役立ちます。Claude CodeまたはCursorは、移行を段階的に計画できます。また、実行コマンドを介して各ステップをテストすることもできます。WindsurfとDevinは、利用可能であれば、複雑なエンジニアリングタスクで優れた性能を発揮したため、移行を試みる可能性があります。最適: 多段階の変更に対応するエンドツーエンドのエージェントシステム(Claude Code、Cursor、利用可能な場合はDevin)。
-
30〜90分間の半自律作業の実行: これはセッションの安定性を強調するものです。一部のツールはタイムアウトします(ブラウザチャットは短いコンテキスト制限や時間予算があるかもしれません)。Claude Codeは数時間におよぶセッションを宣伝しています。適切なメモリがあれば、プロジェクトで「一度に数日間作業できる」とされています (www.anthropic.com)。Devinは数時間にわたって自律的に作業すると報告されています。Clineも、マシンがオンになっている限り、長時間タスクをバックグラウンドで実行できます。Cursorのエージェントセッションは、同じウィンドウ内で複数のクエリにまたがることができます。Copilot Chatやほとんどのシンプルなチャットボットは、90分間の中断のないセッションを維持できません。最適: 長時間セッション用に設計されたエージェント(Claude Code、Devin、Cline)。
安全性と制御
AIを実際のコードに適用する際、セーフティネットは重要です。これらのツールがリスク管理とユーザー制御においてどのように比較されるかを以下に示します。
-
パーミッション: 一部のエージェントは「最小権限の原則」を採用しています。Cline、Roo、Claude Codeは、あなたが許可した場合にのみ動作します。対照的に、「自動エージェント」モード(有効な場合)は、確認なしに複数のコミットを適用できます。これは監視されていないと高リスクです。Claude CodeのCLIは常に最終確認を求めます。WindsurfとCursorは、エディタであなたが承認した変更のみを適用します。
-
ロールバック: Clineには組み込みのチェックポイントがあり、プロジェクト全体を瞬時に以前の状態に戻すことができます (cline-efdc8260.mintlify.app)。他のほとんどのツールは、元に戻すためにGitに依存しています。(CursorとContinueはローカルで元に戻せる差分を表示します。)より優れたツールは、部分的な作業を簡単に取り消せるようにします。
-
入出力の安全性: Anthropicのモデルには強力なコンテンツフィルターがあります。例えば、Fable 5は、クエリがハッキングやサイバー兵器のプロンプトとしてフラグが立てられた場合、より安全なモデルに切り替わります (www.anthropic.com)。したがって、これらのツールを介してFable 5を操作すると、それらの安全対策が継承されます。ツール自体も別の層を追加します。例えば、Claude Codeの「/safe-mode」や特定のシェルコマンドのブロックなどです。ただし、コードを実行するエージェントは強力であり、機密性の高い本番環境で監視なしに実行すべきではありません。
-
透明性: クローズドシステムはプロンプトを隠します。ClineとRooは透明性を重視しており、モデルが受け取った正確なプロンプトと生成されたすべての差分を確認できます (cline-efdc8260.mintlify.app) (roocodeinc.github.io)。クローズド製品(Cursor、Windsurf)では、提案は表示されますが、正確な隠されたプロンプトのロジックは表示されません。監査の観点からは、オープンソースツールが有利です。
まとめると、オープンソースまたはセルフホスト型ハーネス(Cline、Roo、OpenAgent)は、最も高い制御性と監査証跡を提供し、実際のレポにとって最も安全です。プロプライエタリツール(Claude Code、Cursor、Windsurf)は、注意して使用すれば安全ですが(IDEですべてのコードを承認するため)、レビューは多少不透明なクラウドシステムに委ねることになります。GitHubのAnthropicエージェントは、強力な企業制御(企業Copilot管理の背後にある)を提供しますが、GitHubとAnthropicのフィルターを信頼することになります。
コストと実用性
最後に、コストと使いやすさを比較検討しましょう。
-
日常使い: 日常のコードヘルプには、多くの開発者がCopilotやCursorのチャットモード(あるいはChatGPT)を使用します。これらは迅速でインタラクティブに感じるからです。しかし、それらは深いタスクにはそれほど強力ではありません。機能を構築したい場合、ブラウザとコードの間を切り替え続けるのは避けたいでしょう。Claude Code(エディタ内)やCline(IDE内)のようなツールは、AIを実際のコーディング環境に組み込むため、学習曲線があるにもかかわらず、より実用的だと感じられます。
-
重いエージェント作業: 大規模なプロジェクトでは、Windsurf/CursorのようなプラットフォームやDevinのようなエンタープライズソリューションが真価を発揮しますが、それらはオンボーディング、会社の承認、そしてコストを必要とします。しかし、オープンソースのCLIエージェントやClaude Codeは、セルフホストできるため、ソロ開発者やスタートアップのニーズにも驚くほど対応できます。これらは無料でインストールでき、LLM API料金のみを支払います。
-
たまのタスク: コーディングタスクをたまにオフロードしたいだけであれば、よりシンプルなチャット(Copilot Chat、ChatGPT)で十分かもしれません。エージェントセッションのオーバーヘッドが必要ないからです。しかし、注意してください:チャットでは長いタスクを管理したり、コンテキストを維持したりできません。
-
エンタープライズのニーズ: 大企業は、監査制御を備えた管理された環境を好むことがよくあります。Anthropicがモデルアクセスを制限したとしても、大規模チームには**WindsurfまたはDevin (Cognition)**を選択するかもしれません。これらの製品は、エージェント機能とダッシュボードをバンドルしているからです。あるいは、個人エージェント(ポリシー規則付きのClaude Codeなど)を許可しつつ、コードレビューパイプラインを必須とすることもあります。
-
コストが重要な場合: 予算が厳しい場合は、無料のBYOK/ハイブリッドルートに頼りましょう。例えば、ローカルのClineをGPT-3.5(OpenRouter経由)で実行するのは非常に安価です。ropeを介してClaudeを注意深いプロンプトキャッシュ(繰り返されるコンテキストに対して90%割引)で使用することでも、コストを劇的に削減します (www.anthropic.com)。言い換えれば、ハーネスを予算に合わせて調整できます。小さなタスクには安価なClaude 4モデルを使い、最も重要で価値の高いタスクにのみFable 5を投入するといった具合です。
評決
Claudeに最適な総合ハーネス: 多くの専門家は、本当に強力なエージェント能力が必要な場合、Anthropic自身のClaude Code(またはそのCloud IDE)を選ぶでしょう。これはモデルの作成者によって構築・サポートされており、現在Fable 5を使用でき、ソフトウェアプロジェクト向けに設計されています (www.anthropic.com) (claude-news.today)。しかし実際には、Cursorのようなツールも、洗練されたUIでFable 5の力を引き出すことができます。
ソロ開発者に最適: おそらくClineまたはRoo Codeでしょう。これらは無料/オープンソースで、透明性のためにローカルで動作し、追加費用はかかりません。Claudeキーを提供すれば、アクセスできる任意のモデル(Fable 5を含む)を自動的に使用できます。学習曲線は少し深いですが、完全に制御でき、すべてをカスタマイズできます。
スタートアップに最適: 組み合わせです。スタートアップの創業者は、迅速な機能構築のためにWindsurf(Claudeへのアクセス問題が解決された場合)またはCursorを使用し、安全なローカル作業のためにClineも利用できます。手軽な成果のためには、Copilot Chat + Emmanuelまたは同様のものがQ&Aをカバーしますが、実際の機能作業にはエージェントハーネスが必要です。
大規模コードベースに最適: 完全なコンテキストを保持するエージェント:Claude Codeのマルチエージェントモード、またはDevinのようなエンタープライズプラットフォーム。これらは何千ものファイルと複雑なアーキテクチャを管理できます。また、プロジェクトメモリやナレッジベースも統合されており、モデルが同じことを繰り返し行うのを防ぎます。
安全なエンタープライズ作業に最適: コンプライアンスを重視するツール、例えばContinue(CIチェック付き)やCline(オープンで監査可能)。あるいは、GitHub CopilotのClaude Agent(ロックダウンされたプレビュー版)は企業ポリシーに従うことができます。いずれにせよ、すべての変更について人間のレビューを要求することが重要です。
最適なオープンソース/APIオプション: 明らかにClineです。明示的にオープンであり、プラグインするあらゆるプロバイダーをサポートし、実績のあるローカルワークフローを備えています。OpenAgentもCLI形式で強力な候補です。どちらもベンダーロックインなしでClaude Fable 5(あなたのキーを使用)を活用できます。
コストが最重要視される場合: より安価な、またはセルフホスト型のソリューションを使用します。つまり、Claude 4またはオープンLLMを使用するシステムをデフォルトとし、あるいはエージェントをローカルで実行します。例えば、CursorのSWEモデルを使用するか、Fableの追加パワーが正当化される場合を除いて、Claudeを下位層で実行します。
自律性に最適: 最小限のガイダンスでAIにタスクを自動実行させたいなら、Claude CodeまたはDevinが優れています。これらは継続的なタスクを計画し、実行できます。OpenAgentのようなオープンソースエージェントも自律性をサポートしていますが、概念的には各ステップで鍵を回す必要があります。完全にハンズオフな操作には、専用のプラットフォームが少し先行しています。
ポッドキャスト向け結び
結局のところ、教訓はこれです。最も賢いモデルが自動的に最高のコーダーであるとは限らない — 適切なコーディングハーネスが必要なのです。強力なClaudeの頭脳には、優れた目(プロジェクト全体を読む能力)、手(ファイルを編集しテストを実行する能力)、記憶(過去のステップを思い出す能力)、そしてブレーキ(災害の前に停止する能力)が必要です。それがClaude Codeのターミナルループ内であれ、CursorのIDEエージェント内であれ、ClineのようなローカルCLI内であれ、AIが実際に何を達成できるかは、システム全体によって決まります。Anthropicの幹部の一人が述べたように、私たちは静的なチャットボットを超えて、真のAIチームメイトへと移行しています。最高のシステムは、そのAIチームメイトが単なる速い話し手ではなく、信頼できるエンジニアであるために必要なものを提供するでしょう (techcrunch.com)。
新しいAIコーディング研究とポッドキャストエピソードを入手
AIコーディングツール、AIアプリビルダー、ノーコードツール、vibeコーディング、AIを使ったオンライン製品構築に関する新しい研究更新やポッドキャストエピソードを受信するために購読してください。