2026年2月2日、OpenAIがCodex macOSアプリを静かにリリースした。Inc.誌はそれを「CursorやAIコーディングスタートアップへの手榴弾」と表現した。誇張を差し引いても、このツールが示す設計思想は注目に値する。
まず、Codexには2種類ある
「Codexという名前、前にも聞いた気がする」という人は正しい。Codexには別々の2つのプロダクトが存在する。混乱の元なので最初に整理しておく。
1. Codex CLI(ターミナルで動くもの)
2025年4月に公開されたコマンドラインツールだ。ターミナルにコマンドを打てば、AIがコードを書いてくれる。Claude Codeと同じカテゴリの、ターミナル型AIコーディングツールだ。GitHubリポジトリ(openai/codex)は2026年2月時点で約61,700スターを集めており、開発者コミュニティからの注目度の高さがうかがえる。
# Codex CLIのインストール(npm)
npm install -g @openai/codex
# または Homebrew
brew install codex
# 基本的な使い方
codex "src/api/users.ts のバリデーションロジックにユニットテストを追加して"
2. Codex App(macOSのデスクトップアプリ)
こちらが今回の本題だ。2026年2月2日に公開された。ターミナルではなく、デスクトップアプリとして動く。現在はmacOS(Apple Silicon)のみ対応で、Windows版は後日展開予定とされている。OpenAIの公式ページからダウンロードできる。
この2つが「どちらもCodex」と呼ばれるので混乱する。機能も用途もまったく異なる。
Codex Appの設計思想:「指揮台」
Claude CodeもCursorも、基本的には「1人のAIに深く指示を出すツール」だ。1つのタスクをAIに渡して、AIが考えながら解決していく。料理に例えるなら、腕のいい料理長(AI)に「今夜のメニューを考えて、料理して」と一任するイメージだ。
Codex Appは設計思想が違う。OpenAIは公式に "command center for agents"(エージェントの指揮台)と表現している。複数のAIエージェントが別々のタスクを並列で動かし、その進捗を人間が一括管理する仕組みだ。厨房の制御室——複数のシェフ(AI)に同時に別々の料理を担当させ、進捗を監視して仕上がりを確認する形だ。
この違いは実用上大きい。Claude Codeで3つのタスクを処理するには、1つずつ順番に進めるか、git worktree(1つのリポジトリを複数のフォルダで同時に開く仕組み)を手動でセットアップするかしかない。Codex Appでは、アプリを開いてスレッドを3つ作るだけで、3つのエージェントが同時に動く。worktreeによる競合の回避も自動で行われる。
3つの主要機能を解説する
Skills:エージェントを「教育」する
Skillsはエージェントに追加の能力を持たせる仕組みだ。公式ドキュメントによると、標準で使えるスキルには以下がある。
- Figmaの設計をコードに変換
- Linear(プロジェクト管理ツール)との連携
- Vercel・Netlify・Cloudflare・Renderへの自動デプロイ
- 画像生成
- PDF・スプレッドシート・Wordファイルの生成
重要な点は、SkillsがチームでリポジトリにチェックインしてCLI・IDEの拡張機能・App間で共有できることだ。「このプロジェクトでは、デプロイはVercelを使う」「テストはVitestで書く」というチームのルールをSkillsとして定義しておくと、誰がどのツールを使っても同じ前提で動く。
# AGENTS.md(リポジトリのルートに置くチーム共通設定)
# Claude Codeの CLAUDE.md に相当するが、CLI・App・IDE拡張機能で共通参照される
## スタイルガイド
- TypeScriptのstrictモードを使うこと
- テストはVitestで書くこと
- コミットメッセージはConventional Commitsに従うこと
## 自動化で使うSkills
- deploy: Vercelへのデプロイ
- test-summary: CI/CDの失敗を要約してIssueに報告
AGENTS.md というファイルをリポジトリのルートに置くと、CodexがそこからチームのルールやSkillsを読み込む。Claude Codeの CLAUDE.md に相当するが、CLI・App・IDE拡張機能の3つで共通して参照される点が異なる。
Automations:人間が寝ている間に工場を動かす
Automationsは定時実行の自動化機能だ。「毎朝9時にIssueをトリアージして、重要なものだけインボックスに通知する」「CI/CD(コードを自動でテスト・ビルド・デプロイするパイプライン)が失敗したら、エラーの原因を要約してチームに報告する」といった定型作業を、人間の介在なしに動かせる。
OpenAIの公式ブログによると、OpenAI社内では実際に以下の用途で使われている。
- 日次のIssueトリアージ(重要度別の仕分け)
- CI/CD失敗通知の要約
- リリースブリーフの自動生成
- バグの自動検出
クリーニング店に服を預けて翌朝受け取る感覚に近い。繰り返す定型作業はAutomationsに任せて、エンジニアの判断が必要な仕事に集中できる。
Automationsの結果はインボックスに届く。重要なものだけ確認・承認して、単純なものは自動アーカイブという運用が基本形だ。全部AIに任せて放置するのではなく、人間が最終確認する設計になっている。
Review Queue:AIの仕事をまとめて確認する
複数のエージェントが並列で動くということは、複数のコード変更が同時に生まれることを意味する。Review Queueはその変更をまとめて確認・承認する機能だ。
Gitのdiff(変更差分)をApp内で直接確認でき、インラインコメントを付けたり、手動で修正してからコミットすることもできる。「エージェントが勝手に全部やって終わり」ではなく、人間がゲートキーパーとして機能する設計になっている。
Claude Code vs Codex App:どちらを選ぶか
率直に言うと、「どちらが優れているか」という問いの立て方が間違っている。設計思想が異なるので、得意な場面が違う。
# Claude Code が向いている場面
$ claude "認証システムのバグを調査して、根本原因を特定してから修正して"
→ AIが1つのセッションで深く思考し、複数のファイルを読み込み、
因果関係を整理しながら修正案を出す
# Codex App が向いている場面
→ Appを開く
→ 「認証バグ修正」「テスト追加」「ドキュメント更新」を別スレッドで同時依頼
→ 3つのエージェントが並列で作業(git worktreeで同じリポジトリへの競合を回避)
→ Review Queueで差分を一括確認・承認
整理すると次のようになる。
| 判断軸 | Claude Code | Codex App |
|---|---|---|
| タスク数 | 1つを深く | 複数を並列で |
| 複雑さ | 高い(因果関係の把握が必要) | 低〜中程度(独立したタスク向き) |
| 人間の関与 | 対話しながら進める | 渡して待ち、まとめて確認 |
| 向いている作業 | バグ調査・設計の相談 | テスト追加・ドキュメント整備・リファクタリング |
2つを組み合わせることも現実的だ。難しいアーキテクチャの決定はClaudeに深く考えさせ、その結果として生まれる単純な実装タスクはCodex Appで並列に流す、という使い方もある。
料金:どのプランで使えるか
OpenAIのヘルプページによると、2026年2月時点での料金体系は以下の通りだ。
| プラン | 月額 | Codexアクセス |
|---|---|---|
| Free / Go | 無料 / 約$8 | 限定期間のトライアルのみ |
| Plus | $20/月 | フルアクセス(期間限定2倍レート) |
| Pro | $200/月 | フルアクセス(期間限定2倍レート・利用上限はPlusの6倍) |
| Business / Enterprise / Edu | 各種 | フルアクセス + 追加クレジット |
月$20のPlusプランからフルアクセスできる。現時点では期間限定で使用レートが2倍に設定されており、試しやすい状況だ。ただし、使い込むほどトークン消費量が増えるのはどのAIコーディングツールでも共通の注意点だ。
「管理する時代」が始まった
AIコーディングは、「AIに聞いてコードを貼る」段階(2023年)から「AIがターミナルで自律的に動く」段階(2025年)へ進んだ。Codex Appはその次の形を示している——「複数のAIエージェントを人間が管理・指揮する」段階だ。
現時点ではmacOS(Apple Silicon)のみで、機能も発展途上だ。ただ、複数エージェントを指揮台から管理するという設計思想は、今後のAIコーディングツールに広く取り込まれていく可能性が高い。
「1人のAIを使いこなす」から「複数のAIをどう組み合わせるか」へ。その問いを意識し始める頃合いが来ている。
