技術記事 2026年3月9日 読了 約26分

OpenAI Codex完全ガイド ── オープンソースのCLI型AIエージェント

オープンソース(Rust製)で透明性が高く、サンドボックスによる「デフォルトで安全」な設計── OpenAI Codexの独自機能とClaude Codeとの使い分けを解説します。

YS
山田 翔太郎
ReIT

この記事を読めばわかること

前回の記事ではClaude Codeを紹介しました。CLI型AIツールの「カスタマイズ性と自律性」を追求した存在です。

今回紹介する OpenAI Codex は、同じCLI型でありながら、まったく異なる設計思想を持っています。オープンソース(Rust製)で透明性が高く、サンドボックスによる「デフォルトで安全」な設計。 Claude Codeが「設定して安全にする」ツールだとすれば、Codex CLIは 「最初から安全で、必要に応じて制限を緩める」 ツールです。

この記事を読めば、Codex CLIの独自機能、Claude Codeとの使い分け、そしてどちらを選ぶべきかがクリアになります。

OpenAI Codexとは?── 30秒でわかる概要

OpenAI Codexは、OpenAI社が提供する ターミナル上で動作するAIコーディングエージェント です。第1回の記事で解説した「プラットフォーム(車)」に当たります。

Codexには2つの実行形態があります。Codex CLI はローカルのターミナルで動作するオープンソースツール(Rust製)。Codex Web はChatGPT上でクラウド実行されるブラウザ版です。本記事では主にCLI版を中心に解説します。

前回のClaude Codeと同じ「CLIネイティブ」カテゴリですが、設計思想に明確な違いがあります。Claude Codeが 「CLAUDE.md + Hooks + MCPで構築する、カスタマイズ可能なAI開発基盤」 であるのに対し、Codex CLIは 「サンドボックスとオープンソースによる、透明で安全なAIコーディングツール」 です。

最大の特徴は サンドボックス設計 です。デフォルトでネットワークアクセスなし・書き込みはワークスペース内に限定。AIが想定外の操作を行うリスクを、技術的に最初から封じ込めています。

できること・得意なこと

Codex CLIの機能は大きく6つに分かれます。

自律的なコード操作: ターミナルからリポジトリを検査し、ファイル編集、コマンド実行を行います。GPT-5.2-Codex・codex-miniなど、コーディングに最適化されたモデルを使用します。特にoシリーズ(推論モデル)を搭載したことで、単なるコード生成だけでなく、既存のバグを論理的に推論し、依存関係を壊さずに修正するといった知的なバッチ処理が可能になっています。Claude Codeと同様に自己修正ループにも対応しており、テスト実行→失敗→修正→再実行を自律的に繰り返します。

サンドボックス(デフォルト安全設計): Codex CLIのセキュリティは2層構造です。サンドボックス(書き込み範囲・ネットワークアクセスの技術的制限)と 承認ポリシー(アクション実行前の人間確認)。デフォルトではネットワークアクセスなし・書き込みはワークスペース内に限定されており、AIが意図しないファイルを書き換えたり、外部にデータを送信したりするリスクを構造的に抑制します。Claude Codeが「settings.json + Hooks + CLAUDE.mdの多層防御を自分で構築する」のに対し、Codex CLIは 箱から出した瞬間に安全 です。

マルチエージェント(CSV一括タスク実行): 複数のサブエージェントを起動してタスクを並列処理します。Codex CLIの独自機能として spawn_agents_on_csv があり、CSVファイルの各行を1つのタスクとして自動的にサブエージェントに割り当て、進捗・ETAの表示、完了後の結果CSV出力まで一括で行います。「100個のAPIエンドポイントにバリデーションを追加」「50個のコンポーネントのテストを生成」── こうした定型的だが大量にある作業を、CSVで定義してバッチ処理する。Claude Codeのサブエージェントが「臨機応変な並列実行」なら、Codex CLIは 「定型大量処理の自動化」 に最適化されています。

コードレビュー機能: コミットやプッシュの前に、別のCodexエージェントがコードレビューを実行します。AIによるセルフレビューで、明らかなバグやセキュリティ上の問題を事前にキャッチ。人間のレビューの前にAIが一次フィルターとして機能します。

画像入力対応: スクリーンショット、ワイヤーフレーム、設計図をCLIに直接添付可能です。「このUIモックアップを実装して」とスクリーンショットを渡すだけで、Codexがデザインの意図を解釈してコードを生成します。CLI型でありながらビジュアル入力に対応している点は、Claude Codeにはない独自の強みです。

AGENTS.md / MCP対応: Claude CodeのCLAUDE.mdに相当するプロジェクト設定ファイルとして、AGENTS.md をサポートしています。プロジェクト固有のルールや文脈を記述できます。また、MCP(Model Context Protocol)にも対応しており、外部ツールとの接続が可能です。ただし、MCP利用時はコンテキスト消費が増えるため、接続するサーバー数を絞ることが推奨されています。

料金プラン

Codex CLIは、ChatGPTのサブスクリプションプランに含まれる機能として提供されています。Claude Codeと同様に、独立したサブスクリプションではありません。

利用方法月額備考
ChatGPT Plus$20Codex Web + Codex CLI。使用量制限あり
ChatGPT Pro$200高い使用量上限。ヘビーユーザー向け
ChatGPT Business$30/ユーザーチーム管理 + セキュリティ制御
API直接利用従量課金GPT-5.2-Codex: $1.25/$10(入力/出力 per 1Mトークン)。codex-mini: さらに安価

Claude Codeとの料金比較

Codex CLIClaude Code
最安プランChatGPT Plus $20Claude Pro $20
ヘビーユースChatGPT Pro $200Claude Max $100〜200
API入力単価$1.25/1Mトークン(GPT-5.2-Codex)$3/1Mトークン(Sonnet 4.6)
キャッシュ割引75%(プロンプトキャッシュ)あり(Anthropic API)

API単価で比較すると、Codex CLIの方がトークン単価が安いのが特徴です。特にcodex-miniは軽量タスク向けに極めて低コストで提供されており、定型的な大量処理(lint修正、テスト生成、バリデーション追加など)ではCodex CLIのコスト効率が光ります。一方、複雑な推論や設計判断ではClaude CodeのOpus 4.6が優位です。

Codex Webはブラウザから利用するクラウド実行版です。長時間タスク(7時間以上)にも対応しており、「寝ている間にリファクタリングを完了」といった使い方が可能です。CLIで一括処理した結果を、ブラウザのCodex Webで開いて視覚的に確認・微調整する── この「CLI(自動)とWeb(手動)の往復」ができるのは、ChatGPTエコシステムを持つOpenAIならではの強みです。

データの取り扱い・プライバシー設定

Codex CLIのプライバシー設計は、「オープンソース × サンドボックス」による透明性が最大の特徴です。

項目内容
コードの保存先ローカル(あなたのマシン)
サンドボックスデフォルトでネットワークアクセスなし・書き込みはワークスペース内のみ
API送信時のデータプロンプト + 関連コード片。WebサーチキャッシュはOpenAI管理のインデックスを使用(ライブページへのアクセスなし=プロンプトインジェクション対策)
オープンソースCLIのソースコードがGitHubで公開。データの流れを自分で検証可能

Claude Codeとのプライバシー比較:

Claude Codeは「設定して安全にする」設計で、settings.jsonのdenyルール・Hooks・CLAUDE.mdの多層防御を自分で構築する必要があります。一方、Codex CLIは 「デフォルトで安全」 です。ネットワーク遮断・書き込み制限がサンドボックスとして最初から適用されているため、設定ミスによるセキュリティホールが生まれにくい構造です。特に前回の記事で解説した .env 漏洩リスクの文脈では、Codex CLIのネットワーク遮断が決定的な意味を持ちます。プロンプトインジェクション攻撃でAIが .env の内容を読み取ったとしても、 外部にデータを送信する通信路自体が存在しない ため、情報漏洩が物理的に成立しません。Claude Codeの多層防御が「防波堤を築く」アプローチなら、Codex CLIのサンドボックスは「そもそも海がない」アプローチです。

さらに、Codex CLIはオープンソースのため、AIがどのデータをどこに送信しているかをソースコードレベルで検証できます。「このツールは本当にコードを外部に送っていないか?」という疑念に対して、コードを読んで自分で確認できる── この透明性は、セキュリティ審査の厳しい組織にとって大きな安心材料です。

Claude Codeとの比較: Claude Codeはカスタマイズ性が高い分、設定の責任も開発者にあります。Codex CLIはデフォルト設定のままでも安全に使える「ガードレール付き」設計。セキュリティに自信がないチームや、素早く導入したい場合はCodex CLIの方が安心です。

おすすめの使い方・プロンプト例

Codex CLIの強みは「安全な自律実行」と「大量タスクの一括処理」にあります。

1. CSVによる大量タスクの一括実行

CSVファイルにタスクを定義: file,task src/api/users.ts,入力バリデーションをZodで追加 src/api/orders.ts,入力バリデーションをZodで追加 src/api/products.ts,入力バリデーションをZodで追加codex --spawn-agents-on-csv tasks.csv

ポイント: spawn_agents_on_csv はCodex CLI独自の機能で、CSVの各行を1つのタスクとして並列実行します。進捗バーとETA表示が付き、完了後に結果CSVが出力されるため、「50個のエンドポイントにバリデーションを追加」といった大量定型タスクを管理しやすい形で処理できます。Claude Codeのサブエージェントが「その場の判断で分割」するのに対し、Codex CLIは 「事前に定義した計画を粛々と実行」 するスタイルです。

2. サンドボックスを活かした安全な実験

codex "このリポジトリのパフォーマンスボトルネックを特定して、修正案を実装して。ベンチマークで効果を検証して"

ポイント: サンドボックスにより、Codexの変更はワークスペース内に限定されます。ネットワークアクセスも遮断されているため、「まずAIに自由にやらせて、結果を確認してから採用する」という実験的な使い方が安全にできます。

3. AIセルフレビュー

codex review をコミット前に実行

ポイント: 別のCodexエージェントがコードレビューを行い、バグやセキュリティの問題を事前に指摘します。人間のレビュアーの負荷を減らしつつ、レビューの抜け漏れを防ぐ「AIファーストパス」として有効です。

4. スクリーンショットからのUI実装

デザインモックアップの画像を添付して「このUIをReact + Tailwind CSSで実装して」

ポイント: CLI型でありながら画像入力に対応しているのはCodex CLIの独自機能です。Figmaからエクスポートしたスクリーンショットを渡すだけで、デザインの意図を解釈してコンポーネントを生成します。

5. AGENTS.mdによるプロジェクト設定

プロジェクトルートの AGENTS.md に以下を記述: 「言語: TypeScript / テスト: Jest / スタイル: Prettier準拠 / 禁止: any型」

ポイント: Claude CodeのCLAUDE.mdに相当する機能です。プロジェクト固有のルールを宣言することで、Codexの提案がプロジェクトの規約に沿うようになります。AGENTS.mdはリポジトリにコミット可能で、チーム全体で共有できます。

注意点・苦手なこと

Codex CLIにも限界があります。

WARN

カスタマイズ性ではClaude Codeに劣る: Codex CLIはサンドボックスで「安全」を優先する分、Claude CodeほどのHooks・MCP・サブエージェントの柔軟なカスタマイズはできません。「CI/CDパイプラインとの深い統合」「外部ツールとの複雑なワークフロー構築」にはClaude Codeの方が向いています。

推論の深さ: codex-miniは速度とコスト効率に優れますが、複雑なアーキテクチャ設計や高度な推論タスクではClaude CodeのOpus 4.6に及びません。「量」のCodex、「質」のClaude Code── という棲み分けを意識する必要があります。

WARN

サンドボックスの制約: デフォルトのネットワーク遮断は安全性の源ですが、「npm installで外部パッケージを取得」「APIにリクエストを送ってテスト」といったタスクでは制限を緩める設定が必要です。サンドボックスの緩め方を理解しておく必要があります。

macOS / Linux中心: Codex CLIはmacOSとLinuxがメインの対応OSです。Windowsは対応済みですが、PowerShellベースで一部制約があります。

学習コスト: Claude Codeと同様に、ターミナル操作・git・シェルの基礎知識が前提です。IDE型ツールのようなGUIはありません。

5軸スコア

第2回の記事で紹介したシリーズ共通の5軸で、OpenAI Codex CLIを評価します。

評価軸スコア(5段階)コメント
知能・論理★★★★☆GPT-5.2-Codexはコーディングに最適化された高い推論力。ただしClaude Opus 4.6ほどの汎用的な深い推論にはまだ差がある
スピード★★★★★Rust製CLIで起動が高速。codex-miniの応答速度はCLI型ツールの中でトップクラス。大量タスクの並列処理も高速
コンテキスト★★★★☆リポジトリ検索 + AGENTS.md + MCP + 画像入力対応。ただしClaude CodeのCLAUDE.md / Hooks / コンパクションほどの長時間セッション維持力はまだ発展途上
実行力★★★★☆サンドボックスによる安全なファイル操作 + マルチエージェント + コードレビュー。安全性と実行力のバランスが良い。ただしClaude CodeのHooks / MCP統合の柔軟性には及ばない
コストパフォーマンス★★★★★ChatGPT Plus($20)に含まれる。API単価はClaude Codeより安く、キャッシュ割引(75%)もありコスト効率が高い。大量定型タスクのコスパは最強クラス

こんな人におすすめ / こんな人には向かない

おすすめな人:

セキュリティを重視するが、設定に時間をかけたくない方。Codex CLIは「デフォルトで安全」なサンドボックス設計のため、セキュリティ設定を一から構築する必要がありません。Claude Codeの多層防御を構築する時間がない、あるいはセキュリティ設定に自信がないチームに最適です。

大量の定型タスクを一括処理したい方。spawn_agents_on_csv による定型タスクの並列処理は、Codex CLI独自の強みです。「100ファイルにバリデーションを追加」「全コンポーネントのテストを生成」── こうした「量」の仕事に最適化されています。

オープンソースの透明性を重視する方。CLIのソースコードが公開されており、データの流れを自分で検証できます。セキュリティ審査でツールの内部挙動を説明する必要がある組織にとって、これは大きなアドバンテージです。

すでにChatGPT Plusを使っている方。追加コストなしでCodex CLIを利用できます。

向かない人:

  • 高度なカスタマイズや外部ツール統合を求める方。→ Claude CodeのHooks + MCP + CLAUDE.mdの方が柔軟です。
  • 複雑な設計判断や深い推論が必要な方。→ Claude CodeでOpus 4.6を使う方が適しています。
  • ターミナル操作に不慣れな方。→ CursorGitHub CopilotのGUI環境が適しています。

Claude Code vs Codex CLI── 結局どちらを選ぶべきか

CLI型AIツールの2大巨塔、最終的な使い分けを整理します。

比較軸Claude CodeCodex CLI
設計思想「設定して安全にする」「デフォルトで安全」
セキュリティ多層防御を自分で構築サンドボックスが最初から適用
カスタマイズ性★★★★★(Hooks / MCP / CLAUDE.md)★★★☆☆(AGENTS.md / 基本的なMCP)
得意なタスク複雑な推論・設計判断・ワークフロー構築大量定型タスク・安全な自律実行
コスト効率Opus高め、Sonnetで最適化API単価が安く、大量処理に強い
透明性クローズドソースオープンソース(Rust製)
プロジェクト設定CLAUDE.md(宣言型、成熟)AGENTS.md(対応中、発展途上)

選び方の指針:

「深い推論・拡張性」を求めるなら Claude Code。複雑なアーキテクチャ設計、CI/CDとの深い統合、MCP経由の外部ツール連携── プロジェクト固有の開発基盤を構築するならClaude Codeの拡張性が必要です。

「大量処理・即時導入」を求めるなら Codex CLI。大量の定型タスクを安全に並列処理する、セキュリティ設定に時間をかけずに素早く導入する── こうした場面ではCodex CLIの設計が優位です。

INFO

両方使うのが正解。Qurated Labでは、設計判断やワークフロー構築にはClaude Code、定型的な一括修正やコードレビューにはCodex CLIと、タスクの性質に応じて使い分けています。CLI型の2大ツールは競合ではなく、補完関係です。

次回は、開発ツール編の最終回── Amazon Kiro・Cline・その他注目の新興開発ツール を紹介します。


AI開発ツールの選定を支援します

CodexとClaude Code、チームに最適なツールの選定をサポートします。