AI自動化

GPT-4o vs Gemini 画像生成比較|同じプロンプトでKDP表紙を作ったら全然違う結果になった

GPT-4o vs Gemini 画像生成比較|同じプロンプトでKDP表紙を作ったら全然違う結果になった

最終更新: 2026-04-28

泰斗
泰斗

一ノ瀬泰斗です。同じプロンプトを両方に投げたら、まるで別のサービスが作ったような2枚の画像が返ってきた話を書きます。

GPT-4o vs Gemini 画像生成比較|同じプロンプトでKDP表紙を作ったら全然違う結果になった

この記事は約 7 分で読めます

📖 目次
  1. 📌 疑念が2週間ずっと頭に引っかかっていた
  2. 📌 使用プロンプト(GPT-4o・Gemini共通)
  3. 📌 GPT-4oの結果
  4. 📌 Geminiの結果
  5. 📌 6項目で並べた比較
  6. 📌 GPT-4oで3回詰まった壁
  7. 📌 Geminiを使い続けているのは惰性じゃない
  8. 📌 「GPTで構図設計→Geminiで仕上げ」を3日間試した
  9. 📌 結局どっちを使うか

同じプロンプトを両方に投げた。返ってきた2枚を並べたとき、「これ本当に同じ指示か?」と声が出た。比較する気が薄かった私が比較したくなった経緯から書く。

疑念が2週間ずっと頭に引っかかっていた

毎日1冊KDP本を自動生成するパイプラインが動いている。表紙はずっとGemini Web(Brave CDP経由)で生成してきたが、「GPT-4oの方が品質高いんじゃないか」という疑念が拭えなかった。

検証しないまま使い続けるのが気持ち悪くなって、Pythonスクリプトで両方を同時に回す比較環境を作った。プロンプトを1つ用意して、GPT Images APIとGemini Webに同時投げし、出力をcompare_output/ディレクトリに保存する仕組みを約30分で書いた。

使用プロンプト(GPT-4o・Gemini共通)

professional KDP book cover, title 'AIと共に創る未来の世界',
young Japanese man and humanoid robot standing together,
futuristic city background, dramatic cinematic lighting,
anime illustration style, vibrant colors, epic composition,
high quality book cover design

同じ指示文。同じテーマ。同じ条件で投げた。

GPT-4oの結果

生成完了まで約3分(ChatGPT Plus WebUI経由)。

返ってきたのはアニメ調のイラストだった。キャラクターの目の光り方、背景の光芒の処理、ロボットの金属質感——細部まで作り込んでいる。日本語タイトル「AIと共に創る未来の世界」も崩れずに画面中央に配置されていて、最初は「これで行けるかも」と思った。

コストはChatGPT Plus月額$20が前提。WebUI経由なら1枚あたりの追加料金は発生しない。ただし自動化のためにAPIに切り替えると話が変わってくる——それは後述する。

Geminiの結果

生成完了まで約40秒。

Geminiは違う方向に振り切ってきた。プロンプトに書いていないのに著者名「RYO TANAKA」を勝手に生成して、英語サブタイトルまで追加してデザインに組み込んできた。最初は「余計なことするな」と思ったが、出力を見たらAmazonで売っている海外KDP本に近い仕上がりになっていた。プロのブックデザイナーが作ったような構図——正直、悔しいくらいよかった。

コスト:Gemini Web(無料プラン)で生成。ゼロ円。

6項目で並べた比較

評価軸 GPT-4o Gemini
生成速度 約3分(WebUI)/ 平均28秒(API) 約40秒
コスト Plus月額$20 + API別途 無料
アート品質 ★★★★☆ ★★★☆☆
日本語テキスト △ 3回中3回崩れた △ 書き方次第で7割成功
KDP適合度 ★★★★☆ ★★★★★
自動化しやすさ △ APIコスト・速度がネック ○ 40秒で安定

GPT-4oで3回詰まった壁

最初に結論を言う。私はGPT-4oに月5,000円以上払う気になれなかった。

一番ひどかったのが日本語テキストの文字化けだ。「AIと共に創る未来の世界」というタイトルを画像内に入れようとしたら、出力が「Al乙共仁創各未来の世界」みたいな謎の文字列になっていた。3回試して3回全部崩れた。英語テキストなら問題ないが、日本語KDP表紙では使い物にならないケースが多い。英語圏向けモデルに日本語の文字形状を学習させるのは難しいんだろうと理解はできるが、私のユースケースには合わなかった。

次にコスト。WebUIのPlus契約とAPIのクレジットは別物で、APIでgpt-image-1を叩くと1枚あたり$0.04〜$0.08かかる。テスト生成も含めて月30〜50枚ほど生成すると、APIクレジット代だけで月$2〜4が消える。Plus代と合わせると月4,000円超えになる計算だ。

そして速度。GPT Images APIの応答完了まで実測で平均28秒。Geminiが16秒前後だったので体感でも「遅いな」とわかる。1日10枚生成するだけで差が積み重なる——小さいようで、自動化パイプライン全体の設計に響く。

Geminiを使い続けているのは惰性じゃない

Brave CDP経由で操作している私の環境では、Gemini Webはコストゼロで動く。launch_brave_debug.shでBraveを起動しておけばセッションが維持されるので毎回ログインも不要。1日20回という上限はあるが、毎日1冊生成するぶんには余裕で収まる。

日本語テキストの認識精度も、書き方次第でかなり改善できた。プロンプトを英語で書いて日本語テキストの場所だけ「Japanese text: 〜」と明示する書き方にしたら、成功率が体感で7割以上に上がった。試行錯誤の末にたどり着いた書き方で、今はスクリプトのデフォルト設定になっている。

縦長フォーマット(KDP表紙に必要なアスペクト比7:10前後)でもGeminiは品質をあまり落とさない。プロンプトの末尾に「vertical book cover format, 2560×1600 resolution」と付け足すだけで、構図が自然に縦長寄りに調整される感覚がある。GPT-4oで同じことをやったら構図が崩れた。

英語タイトルを勝手に入れてくる件は、今では「Geminiの癖」として使い方を覚えた。著者名の捏造は困るが、英語サブタイトルが自動で入ることで海外KDP本に近い雰囲気が出る。この癖を逆手に取って、プロンプトに「no author name」とだけ追記する書き方に落ち着いた。

「GPTで構図設計→Geminiで仕上げ」を3日間試した

2段階フローの発想自体は悪くなかった。でも運用コストが高かった。

やり方はこうだ。GPT-4oに「このテーマのKDP表紙の構図を日本語で詳述して」と頼む。返ってくるのは画像ではなく文章——「左下に人物、右上に光源、背景は都市夜景、タイトルは上部3分の1に白文字で」みたいな具体的な指示。それをそのままGemini Webの入力欄に貼り付けて生成する。

最初の3枚は明らかに構図がよくなった。キャラクターの配置と光源の処理が意図通りになりやすかった。「GPTは言語処理が強いから構図の言語化も上手い」という仮説は、ある程度正しかったと思う。

ただし3日目に飽きた。GPT APIコールに20〜30秒、Gemini Web操作に15〜20秒、合計で1枚あたり1分近くかかる。Gemini単独なら30秒以内に終わる。スクリプト側でもGPTのレスポンスをパースしてGeminiに渡す処理を書く必要があり、コードが50行ほど増えた。その割に4枚目以降は「Gemini単独と大差ない気がする」という感想になっていった。

現在この2段階フローは使っていない。毎日の量産ラインには不向きだ——ただ「特別に力を入れたい1冊」の表紙を作る場面では、また試すかもしれない。

結局どっちを使うか

私の答えは「基本Gemini、GPT-4oは特定用途に限定」だ。

  • 日本語KDP本を量産したい → Gemini一択(無料・40秒・Brave CDP自動化済み)
  • 英語圏向けの表紙を作る → GPT-4o(英語テキストのレンダリング精度が明らかに高い)
  • 特別な1冊の表紙を丁寧に仕上げたい → GPT-4oか2段階フロー

「どちらが上か」という問いかけ自体、あまり意味がない。用途が違うから得意なことも違う。私が毎日1冊の日本語KDP本を自動生成するという条件では、Geminiの方が合っていた——それだけの話で、GPT-4oの品質が低いわけじゃない。

一つ言えるのは、評判より自分の実測値を信じろということだ。私も最初の2週間はGeminiだけ使っていた。GPT-4oを実際に回してみて初めて、自分のパイプラインでの比較数値が出た。日本語テキストが3回連続で崩れたあの感覚は、どんなベンチマーク記事を読んでも得られない。ツールの話をするなら自分で回す。画像生成に限らず、全部に通じると思っている。✨

一ノ瀬泰斗のアバター
一ノ瀬泰斗
AI自動化エンジニア / Python個人開発者

Claude Code × Ollama × launchd で SNS・ブログ・KDPを全自動化。実測データと失敗談を軸に、月5万円収益化のリアルな記録を発信中。

💬 自動化の相談・小規模受託も受付中:「launchd で毎朝 AI が動く仕組みを作りたい」「KDP の自動出版を組みたい」など、X (@taito_automate) の DM からお気軽にどうぞ。

✨ AUTHOR'S KDP BOOKS

かかる人向ケ、10分でわかるAI自動化入門

Claude Code / Ollama / launchd の実践テクニックをコンパクトにまとめたシリーズ。非エンジニアの会社員向けに書いてます。

Amazonで見る ›

✨ FOLLOW ME

AI自動化の実験・失敗・実測データを毎日発信中

𝕏 フォローする