AI自動化

ChatGPTサブスクをCLIから使い切る:画像生成・Excel・ブラウザ操作の全実装

ChatGPTサブスクをCLIから使い切る:画像生成・Excel・ブラウザ操作の全実装

ChatGPTサブスクをCLIから使い切る:画像生成・Excel・ブラウザ操作の全実装

この記事は約 13 分で読めます

📖 目次
  1. 📌 Codex CLIとは何か、なぜClaude Code環境で使うのか
  2. 📌 gpt-image-2でKDP表紙とサムネを生成——失敗3回を超えて辿り着いた設定
  3. 📌 browser-useで実際のブラウザを自動操作——できることとできないこと
  4. 📌 Excel自動生成——Pythonとの組み合わせでレポート出力を完全自動化
  5. 📌 ChatGPT Plus vs APIコスト:3ヶ月間の実測値
  6. 📌 参考・出典
  7. 📌 よくある質問
  8. 📌 まとめ

最終更新: 2026-04-29

ChatGPT Plusを契約しているのにブラウザでしか使っていない——その非効率に気づいたのは、月額$20を払い始めて3ヶ月後だった。

Claude Codeをメイン作業環境にしている私が発見したのは、「Codex CLIを経由すれば、gpt-image-2もbrowser-useもExcel生成も、全部ターミナル一本で動く」という事実だ。KDPの表紙16枚をまとめて生成し、Excelレポートを週次で自動出力し KDP表紙日本語テキスト入り画像生成5ツール比較【2026年実測】、BSkyへの投稿フォーム操作まで試した。

この記事でわかること:


Codex CLIとは何か、なぜClaude Code環境で使うのか

ChatGPTサブスクをCLIから使い倒す(gpt-image-2生成)
↑ ChatGPTサブスクをCLIから使い倒す(gpt-image-2生成)(Codex gpt-image-2で生成)

Codex CLIの立ち位置と私の使い方

Codex CLIはOpenAIが公開しているターミナル上のAIエージェントだ。単なるコード補完ツールではなく、ファイル読み書き・シェル実行・画像生成・ブラウザ操作・スプレッドシート操作まで、プラグイン経由で幅広く使える。

私の環境はClaude Codeをメインにしている。戦略立案・コードレビュー・長期設計はClaude Code(Sonnet/Opus)で、「これ試してきて」という実行系タスクにCodex CLIを使う分業になった。ClaudeはAnthropicのモデルで動いているので、OpenAI固有のgpt-image-2やbrowser-useは直接呼べない。そこをCodex CLIで補完する構成だ。

CLI vs GUI vs 直接API——使い分けの実態

機能 GUI(ChatGPT) Codex CLI 直接API呼び出し
gpt-image-2画像生成 ○(手動) ○(自動化可) ○(コード要)
browser-use △(限定的) ○(プラグイン)
Excel生成 ○(手動DL) ○(ファイル出力) △(コード要)
バッチ処理
launchd連携
月次コスト感 $20固定 使った分(私は$5〜10) 使った分

インストールは npm install -g @openai/codex 一発。ただしOpenAIのAPIキーが必要で、ChatGPT Plusのサブスクとは「別に」API残高が要る点は注意が必要だ。

# インストールと認証
npm install -g @openai/codex
export OPENAI_API_KEY="sk-..."

# 動作確認
codex "現在のディレクトリの内容を教えて"

初回起動時、モデルを gpt-4o-mini に設定していたが、画像生成を使おうとした段階で「gpt-image-2はgpt-4o-miniでは使えない」というエラーが出た。モデル指定の落とし穴は次のセクションで詳しく書く。


gpt-image-2でKDP表紙とサムネを生成——失敗3回を超えて辿り着いた設定

日本語プロンプトと引用符という2つの鬼門

OpenAIの公式ドキュメントによると、gpt-image-2は dall-e-3 の後継として位置付けられており、より高解像度・より指示追従性が高い。Codex CLIからモデルを明示的に指定して使う。

私が最初に踏んだ失敗は2つある。

「日本語プロンプトを渡したら壊れた」のが1つ目だ。半分英語・半分日本語のプロンプトを入れたら、テキストが文字化けした画像が出てきた。Pollinations APIで同じ問題を踏んでいたので、画像生成系は英語プロンプト固定が正解と判断した。

「引用符の問題」が2つ目。プロンプトにダブルクォートを含めると、シェルがエラーを吐く。ヒアドキュメント方式に切り替えてから安定した。

# NG: 引用符がシェルに食われる
codex "generate image: book cover with the text "CLAUDE CODE" glowing"

# OK: ヒアドキュメントで渡す # コピペ可
codex exec "$(cat <<'EOF'
Generate a book cover image using gpt-image-2.
Style: documentary photography, dark background, glowing terminal screen
Subject: professional book cover, minimalist layout, no author name
Format: portrait orientation, high contrast, clean typography
EOF
)"

実測データ:8冊分の表紙を生成したコストと時間

KDP表紙を8冊分まとめて刷新したときの実測値を残しておく。

  • 生成枚数: 16枚(1冊2パターン生成して選択)
  • 成功: 13枚、失敗(エラーor使い物にならないクオリティ): 3枚
  • 合計所要時間: 約22分(sequential実行)
  • API費用: $1.84

ChatGPT Webから16枚を手動生成すると、プロンプト入力・保存・リネームだけで1時間以上かかっていた。自動化後は指示を書いて放置できるので、その間に別の作業を進められる。


browser-useで実際のブラウザを自動操作——できることとできないこと

browser-use:画面遷移ゼロ(gpt-image-2生成)(画面遷移なし)
↑ browser-use:画面遷移ゼロ(gpt-image-2生成)(画面遷移なし)(Codex gpt-image-2で生成)

プラグインの使い方と典型的なユースケース

browser-useはPlaywrightをバックエンドにしたブラウザ自動化ライブラリで、Codex CLIのブラウザ操作プラグインとして機能する。

私が試したのは「BSkyの投稿フォームを操作して下書きを投稿する」というユースケースだ。Claude Code側でコンテンツを生成し、そのテキストをCodexに渡してブラウザ操作させる構成になる。

# browser-useを使った投稿自動化の例 # コピペ可
POST_TEXT=$(cat output/bsky_post_draft.txt)

codex exec "$(cat <<EOF
Open Brave browser and navigate to bsky.app.
Use the existing browser session (do not log in).
Click the compose button and type the following post:
${POST_TEXT}
Click the post button and confirm success.
EOF
)" --plugin browser-use

動かして判明した3つの制限

ログイン状態の引き継ぎが不安定なのが1つ目の制限だ。Braveのプロファイルを指定してもセッションが切れることがある。2FA必須のサービスはここで詰まった。

動的サイトのDOM変更に弱いのが2つ目。BSkyのUIが更新されるとセレクタが変わって止まる。週1回くらいのペースで確認が必要になった。

実行速度が遅いのが3つ目。1操作あたり2〜5秒の待機が入るため、10ステップの操作で1分以上かかる。

それでも「完全に手を離せる」点は価値がある。launchd経由でのスケジュール実行については、朝の「状況把握5分」をゼロにするDiscord Bot通知の作り方【Python/launchd】で書いた構成と同じ考え方で動かしている——「動かして放置できる仕組みを作る」が目標で、完璧さより継続性を優先した。


Excel自動生成——Pythonとの組み合わせでレポート出力を完全自動化

Excel自動生成ダッシュボード(gpt-image-2生成)
↑ Excel自動生成ダッシュボード(gpt-image-2生成)(Codex gpt-image-2で生成)

2段ロケット方式の設計

Excel生成はCodex CLIが直接xlsxファイルを書き出すのではなく、「openpyxlを使ったPythonスクリプトを生成・実行する」という2段構成になる。Codexに直接「Excelを作れ」と言うと出力が不安定だった。「Pythonスクリプトを書いて実行しろ」という指示に変えてから安定した。

# Codexが生成したExcelレポートスクリプトの実例 # コピペ可
import openpyxl
from openpyxl.styles import Font, PatternFill, Alignment
from datetime import datetime
import json

wb = openpyxl.Workbook()
ws = wb.active
ws.title = "月次KDPレポート"

headers = ["タイトル", "ASIN", "販売数", "ロイヤリティ(¥)", "更新日"]
for col, h in enumerate(headers, 1):
    cell = ws.cell(row=1, column=col, value=h)
    cell.font = Font(color="FFFFFF", bold=True)
    cell.fill = PatternFill("solid", fgColor="2C3E50")
    cell.alignment = Alignment(horizontal="center")

# データはJSONキューから読み込む(実際の構成)
with open("output/kdp_monthly_data.json") as f:
    records = json.load(f)

for rec in records:
    ws.append([
        rec["title"], rec["asin"], rec["units"],
        rec["royalty_jpy"], datetime.now().date()
    ])

ws.column_dimensions["A"].width = 30
filename = f"kdp_report_{datetime.now().strftime('%Y%m')}.xlsx"
wb.save(filename)
print(f"[DONE] {filename} を出力しました")

launchd連携で週次レポートを自動化した結果

毎週月曜8:00に自動実行するlaunchd plistを設定した。設定後の実態は「月曜の朝にファイルが存在している」だけ——確認作業が消えた。

自動化の積み重ねについては非エンジニアがAI開発で収益化するまでの1年ログにも書いたが、「1個の自動化で回収できる時間」を積み上げていくと、半年後に体感が変わる。


ChatGPT Plus vs APIコスト:3ヶ月間の実測値

使用データから見えたコスト構造

ChatGPT Plusを$20/月で契約しながらAPIも使う、という二重コスト状態が2ヶ月続いた。実測値を並べると以下になる。

項目 ChatGPT Plus Codex CLI(API) 備考
基本料金 $20/月 $0 APIは従量課金
画像16枚生成 込み $1.84 gpt-image-2実測
テキスト生成 込み $2〜5/月 用途次第
ファイル/Excel操作 込み $0.5〜1/月 実行回数次第
ブラウザ操作 ✕(未対応) $1〜3/月 操作量次第
月額合計感 $20固定 $5〜10(私の用途)

ヘビーユーザーならPlusの方が安い。私の使い方(1日10〜20回の生成)ではAPIの方が明らかに安かった。Plusは3ヶ月で解約した。

ただし「UIでサッと試したい」場面ではGUIの方が速い。CLI化は「繰り返す処理」に特化する——これが今の結論だ。


参考・出典


よくある質問

Q: ChatGPT PlusのサブスクはCLI自動化に必要ですか?

必要ない。Codex CLIはOpenAIのAPIキーで動く。ChatGPT PlusはGUIのWebサービスなので、CLI自動化にはAPIの残高だけあればいい。Plusを解約してAPIだけにした方がコストが下がるケースが多い。

Q: Claude Code(Anthropic)だけではなく、なぜCodex CLIを追加で使うのですか?

Claude CodeはAnthropicのモデルで動いている。gpt-image-2はOpenAIのモデルなので、Claude Codeから直接は呼べない。OpenAI固有の機能を使いたいとき、Codex CLIを呼び出す形で補完する構成にしている。

Q: browser-useはBraveブラウザ以外でも動きますか?

動く。ChromiumベースのブラウザならPlaywrightが対応している。ただし私の環境はBraveに統一しているので、Chrome・Edge での安定性は未確認だ。

Q: ExcelではなくGoogleスプレッドシートに直接書き込む方法はありますか?

gspread ライブラリを使ったPythonスクリプトをCodexに生成させる方法で対応できる。GoogleのOAuth認証が必要になるため初回セットアップに30分ほどかかったが、一度通れば以降は完全自動だ。

Q: Apple Silicon(M5)のMacでCodex CLIは動きますか?

動く。M5環境で問題なく動作している。Node.jsのバージョンは18以上が必要で、nvm経由でインストールするのが安定する。


まとめ

  • Codex CLIはChatGPT Plusとは別で、OpenAI APIキーがあればCLI自動化に使える
  • gpt-image-2は英語プロンプト・ヒアドキュメント方式で安定する(日本語・引用符は鬼門)
  • browser-useはDOM変更に弱く、週1回のセレクタ確認が現実的なコストとして発生する
  • Excel生成はopenpyxl+Pythonスクリプトの2段ロケット方式が安定する
  • 「繰り返す処理」に絞ればAPIはPlusより安い(私の場合は月$5〜10)

関連記事:
非エンジニアがAI開発で収益化するまでの1年ログ — 非エンジニアがどうやってAI自動化で収益化まで辿り着いたかを時系列で書いた
朝の「状況把握5分」をゼロにするDiscord Bot通知の作り方【Python/launchd】 — launchd×Python×Discordで朝の確認作業を完全に消した実装例



一ノ瀬泰斗のアバター
一ノ瀬泰斗
AI自動化エンジニア / Python個人開発者

Claude Code × Ollama × launchd で SNS・ブログ・KDPを全自動化。実測データと失敗談を軸に、月5万円収益化のリアルな記録を発信中。

💬 自動化の相談・小規模受託も受付中:「launchd で毎朝 AI が動く仕組みを作りたい」「KDP の自動出版を組みたい」など、X (@taito_automate) の DM からお気軽にどうぞ。




✨ AUTHOR'S KDP BOOKS

かかる人向ケ、10分でわかるAI自動化入門

Claude Code / Ollama / launchd の実践テクニックをコンパクトにまとめたシリーズ。非エンジニアの会社員向けに書いてます。

Amazonで見る ›

✨ FOLLOW ME

AI自動化の実験・失敗・実測データを毎日発信中

𝕏 フォローする