Claude Opus 4.8 完全ガイド 2026年5月版 — Dynamic Workflowsとeffort 5段の使い分け
2026-05-28リリースのClaude Opus 4.8の全新機能を、週77時間Claude Codeを使うAI社長が解説。Dynamic Workflows・ultracode・Fast Mode・effort 5段(low/medium/high/xhigh/ultracode)の実戦運用ガイド。SWE-Bench Pro 69.2点・価格据置・mid-conversation system prompt・cache 1024 token閾値まで、現場で何が変わったかを2026年最新版で完全網羅。
執筆者: 古田 健
株式会社37Design 代表取締役 / 14プロダクト運用中の現役AI顧問
2026-05-28、Anthropic が Claude Opus 4.8 をリリースした。価格据え置きで性能向上、新機能 Dynamic Workflows が Claude Code に追加された。
週77時間 Claude Code を使う AI社長 の立場から、実戦で何が変わるかを解説する (次は月300時間到達が目標)。
こんにちは、37Design代表の古田です。Opus 4.7 リリースからわずか 41日後 の 4.8 投下に、現場で何時間も触ってきた感触をそのまま記事化します。
「数字は読んだけど、結局 4.7 から何が変わって、今日から何を変えれば良いのか?」——AI顧問契約のクライアント10社からも同じ質問が来たので、判断軸と当日アクションを 1 本にまとめます。
机上のレビューではなく、14プロダクトを並走運用する現役運用者が、リリース当日に何を切り替えたか としてお読みください。
何が変わったか — Claude Opus 4.8 の概要
リリース概要
| 項目 | 内容 |
|---|---|
| リリース日 | 2026-05-28 (Opus 4.7 から41日後) |
| モデルID | claude-opus-4-8 |
| 価格 | 据え置き ($15 / $75 per Mtok、4.7と同額) |
| 主要新機能 | Dynamic Workflows、Fast Mode、effort 5段、mid-conversation system prompt 注入、cache 最小 1,024 token |
| Claude Code 既定 | v2.1.154 以降、Lean system prompt が既定に |
ベンチマーク (4.7 → 4.8 比較)
| ベンチマーク | Opus 4.7 | Opus 4.8 | 体感 |
|---|---|---|---|
| SWE-Bench Pro | 64.3 | 69.2 | 中規模リポでの「もう一手前で気づく」率が増えた |
| 多分野推論+ツール | 54.7 | 57.9 | ツール選択ミスが目に見えて減る |
| Knowledge (ELO) | 1753 | 1890 | 古い事実の口走りが減る |
| コード欠陥見逃し | (基準) | 約 1/4 | レビューで自分が見落とすバグを Claude 側が拾う |
数字よりも体感が大きいのは「ハルシネーション減と判断力」の方です。後述します。
4.7 → 4.8 で体感する3点
- 精度向上: SWE-Bench Pro が +4.9 pt。中規模リポのリファクタで「直前の編集と矛盾する追加」が減った
- honesty 改善: 不確かな時に “I’m not sure” と先に言うようになった。これまで自信満々で間違えていた領域でブレーキが効く
- cache 閾値低下: 最小キャッシュ 1,024 token に下がったため、CLAUDE.md を細かく分割したセットアップでもキャッシュヒット率が体感で上がる
Claude そのものの全体像から見直したい方は Claude(クロード)とは?中小企業経営者のためのClaude AI完全ガイド を、Claude Code の全体観は Claude Codeで会社を動かす完全ガイド を先に読むと、この記事の前提が整います。
Dynamic Workflows: Claude Opus 4.8 最大の新機能
何ができるか
Dynamic Workflows は、Claude Code に追加された Research Preview 機能です。/workflows コマンドで起動し、ユーザー指示に対して Claude 自身が JavaScript のオーケストレーション・コードをその場で書き、数十〜数百のサブエージェントを並列起動して、検証まで自走 します。
具体的に踏み込めるタスクの例:
- codebase-scale migration: 50ファイル超に渡る API バージョン置換を、依存解析→並列編集→テスト→差分レポートまで一発
- 大規模 audit: モノレポ全パッケージのセキュリティ依存確認を fan-out → 結果集約
- マルチサービス調査: 5〜10 リポジトリを並列クロールして API 差分マップ生成
これまで Task ツールで 1〜数本ずつ手動 fan-out していたものが、Claude が自分で並列度・分割粒度・検証方法まで設計する ようになった、というのが本質です。
内部動作 (orchestration JS 自動生成)
/workflows 経由で起動すると、Claude は以下を順に行います。
- ユーザー指示を読み、タスクを 「分割可能か / 依存があるか / 検証可能か」 で判定
- JavaScript のオーケストレーション関数を書き出す (agent / pipeline / parallel / phase のような primitive 群)
- サブエージェントを spawn し、各サブエージェントの出力を JSON Schema で強制
- 3票検証 (同タスク3本走らせて多数決) で偽陽性を抑制
- 最終結果を統合し、ユーザーに差分レポート
Bun リポジトリから漏出した実装例 (lifetime-classify.workflow.js 165行) を見る限り、980 cap (1回の workflow で生成できるサブエージェント数の上限) が内部に効いている形跡もあります。
リスク事例: 130並列発火による課金爆発
リリース当日、X 上で @thetreygoff 氏が 「Dynamic Workflows で 130 並列 Opus 4.8 が発火し、課金が想定の数十倍になった」 と報告しました (投稿)。
これは Dynamic Workflows の 設計上避けにくい挙動 です。Claude は「タスクを終わらせる」最適化で動いているため、並列度の上限を明示しないと、安全に倒すよりスピード優先で fan-out します。
必須ガード3本
Dynamic Workflows を実戦で使うなら、以下の3つを プロンプト規律として固定 してください。
- budget directive 明示: 「このワークフローでは最大 $X まで」「サブエージェントは最大 N 本まで」を起動プロンプトに必ず書く
- 並列 cap: orchestration を書かせる段階で「並列は最大 8 本、それ以上が必要ならフェーズを切る」と指示
- ultracode 規律:
/workflowsをultracodeeffort で勝手に走らせない (ultracode は明示指示時のみ、後述)
私のクライアント運用では、.claude/CLAUDE.md 末尾に「Dynamic Workflows 起動時は必ず予算上限とサブエージェント上限をユーザーに確認」というルールを追加しました。規律はルールで縛る、プロンプトで毎回書かせない が現場の解です。
Effort 5段の使い分け — Claude Opus 4.8 の新しい思考量制御
Opus 4.8 から、思考量を 5 段階で制御できるようになりました。Claude Code 上では /effort コマンドで切り替えます。
| Effort | 用途 | 推奨タイミング |
|---|---|---|
| low | 単純置換・フォーマット・小さな書き換え | rename、import 整理、コメント追加など |
| medium | 通常コーディング | 個人運用デフォルト推奨。多くの編集はこれで足りる |
| high | 重い設計・複数ファイル横断のリファクタ | Claude Code 新既定。新規機能設計、debug の方向性決め |
| xhigh | 大規模リファクタ・アーキ刷新 | モノレポ移行、フレームワーク跨ぎ移植、性能要件付きの再設計 |
| ultracode | Dynamic Workflows トリガ | 明示指示時のみ。50ファイル超の一気編集、フルリポ migration |
落とし穴: 常時 high / ultracode は性能を下げる
effortLevel: high を常時化すると、Opus 4.8 + 拡張思考が stream で取りこぼしを起こし、tool call could not be parsed エラー が頻発する事例が出ています。私自身も settings.json で effortLevel: high を常設していたところ、parse error 頻発で medium 既定に戻しました。
実戦の振り分け:
- 個人運用デフォルト:
medium(Claude Code 既定の high より一段下げる) - 設計フェーズ:
highを一時的に - xhigh / ultracode: 重いタスクのときだけ手動でアップグレード、終わったら
mediumに戻す
「常時最大」が一番賢く動く時代ではありません。タスクごとに 意図的にダイヤルを回す のが Opus 4.8 を活かす作法です。
Fast Mode と Mid-conversation system prompt
Fast Mode (/fast)
Claude Code v2.1.154 以降、/fast コマンドで Fast Mode に切り替えられます。
| 指標 | 通常モード | Fast Mode |
|---|---|---|
| 速度 | (基準) | 約 2.5× |
| API コスト | (基準) | 約 2× |
| 精度 | フル | 一段下 (大規模設計には不向き) |
使いどころ:
- 大量の小編集 (typo 修正、import 整理、コメント追加) を捌くとき
- 長尺チャットで「Claude の反応待ち時間」が体感ボトルネックになっているとき
- demo / 商談中の即応性が要るとき
使わない方が良いとき:
- 新規機能設計
- セキュリティ実装
- 大規模リファクタ
私は AI顧問の商談中に画面共有しながら触るときだけ Fast Mode を有効化しています。普段の実装は通常モード。
Mid-conversation system prompt 注入
Opus 4.8 から、会話の途中で system prompt を差し替えても cache が無効化されない ようになりました (4.7 までは cache 全破棄)。
これが効くのは、長尺サブエージェント や 長期セッション で「途中から役割を変えたい」「途中から制約を追加したい」ケースです。具体的には:
- code review の途中から「セキュリティ観点を最優先で」と切り替える
- 設計レビューの後段で「実装フェーズに入るので冗長な説明は不要」と切り替える
- ロングコンテキスト agent で 100k token 超えてから「ここからは結論だけ書け」に絞る
これまでは「途中で性格を変えたい→cache が飛ぶ→トークンコスト爆発」の三重苦でしたが、4.8 で 無料で人格切替 ができるようになりました。
切り替え判断と「今日やる3つ」
Claude Opus 4.8 をリリース当日に切り替えるなら、最低限の3アクションです。
1. モデル切替
/model claude-opus-4-8
Claude Code の ~/.claude/settings.json で "model": "claude-opus-4-8" に変更、または対話中に /model コマンドで切替。価格据置なので、4.7 から 4.8 に上げない理由は基本ない。
2. DISABLE_TELEMETRY 罠の確認
リリース当日、DISABLE_TELEMETRY=1 環境変数を設定していると Dynamic Workflows と Fast Mode の一部が無効化される という報告が出ました。プライバシー目的で設定している方は、以下で確認してください。
env | grep DISABLE_TELEMETRY
無効化したい機能が含まれているなら、設定を見直すか、当該機能を諦めるかの判断が要ります。私のクライアント環境では「telemetry は許容、Dynamic Workflows を使う」の方針に振りました。
3. Fast Mode 試走
/fast で一度だけ試走して、自分のワークフローで体感差を確認してください。速度 2.5× / コスト 2× を支払う価値があるかは、本人の作業密度次第 です。
私の場合: AI顧問商談中だけ ON、普段は OFF が最適でした。
週77時間使う立場から見えた本質
Claude Opus 4.8 の数字 (SWE-Bench Pro +4.9 / Knowledge ELO +137) を見て「ふーん、4.7 で十分じゃないか」と感じる方も多いと思います。
ですが現場で 1 週間触って分かったのは、「効率の差」より「ハルシネーション減と判断力」が圧倒的に大きい ということです。
具体的には:
- 自信のない判断を「分からない」と先に言うようになった (これまでは堂々と間違えた)
- 既存コードの規約を読んでから書くようになった (これまでは独自スタイルで書き始めた)
- ツール選択で迷ったとき、ユーザーに先に確認するようになった (これまでは決め打ちで進めた)
運用に効くのは「賢くなった」ではなく「謙虚になった」 という感触です。週77時間使う身からすると、後者の方が事故防止にも、信頼にも効きます。
AI顧問契約のクライアント10社にリリース当日に通知したのも、この理由です。「ベンチが上がりました」ではなく「Claude が間違えたときに、間違えたと言うようになりました」が現場での価値でした。
月300時間到達目標の進捗にも、もう一段の追い風になりそうです。
関連記事
Claude Opus 4.8 を実戦投入するなら、以下を合わせてお読みください。
- Claude Codeで会社を動かす完全ガイド — Claude Code の全体観・Skills/MCP/サブエージェント・自動化事例
- Claude(クロード)とは?中小企業経営者のためのClaude AI完全ガイド — Claude 全体観 (モデル選択・料金・経営者の使い方5つ)
- Claude料金プラン完全比較ガイド — Opus 4.8 を含む全プランの選び方
- Claude非エンジニア向け使い方マスターガイド — 経営者・非エンジニアの実戦投入手順
AI顧問契約 (月1回 2万円〜) では、こうした最新モデルへの切替判断・運用設計・落とし穴回避まで現場一緒に進めます。週77時間 Claude Code を実運用する立場から、御社の業務に組み込む最短ルートを設計 します。