【AI比較】どのAIが画像生成に強い?ChatGPT・Gemini・Claude を実際に使い比べてみた
はじめに――デザイン制作会社として
「できる人は複数のAIを使い分けている」という話、最近よく耳にしませんか?
私たちはデザイン制作会社として、AIの流れに取り残されないよう、会社全体でさまざまなAIを試す取り組みをしています。
その方法が月替わりで使うAIを決めること。
1月はChatGPT、2月はGemini、3月はClaudeというように、毎月テーマを決めて使い込んでいます。
「なんとなく使っている」状態から抜け出して、それぞれの得意・不得意をちゃんと体感するためです。
今回はその経験をもとに、「画像生成」という切り口でChatGPT・Gemini(nanobanana)・Claudeの3つを比較してみました。
ChatGPT・Gemini・Claudeで実際に生成して比較|ルールと前提
やったことはシンプルで、まったく同じ指示文を3つのAIに投げるだけです。
ただし、使い込んでいるAIほど精度の高いやり取りができるため、今回の比較は完全にフェアとは言い切れない部分もあります。
また、AIにはそれぞれ得意・不得意があります。
本来であれば画像生成を得意とするAI同士で比較するのが適切かもしれませんが、今回は汎用AIの中でどこまで画像生成ができるのかという観点で検証してみました。
テストしたのは以下の2シーンです。
- ① バナー画像をゼロから作る
- ② 既存の写真を加工する
テスト①:バナー画像をゼロから作る
まずはざっくりした指示で
細かい条件を指定せず、あえてふんわりとした指示を出してみました。
ChatGPT・Gemini・Claudeで画像生成を比較するWEB記事を作っています。
サムネイル・アイキャッチに使う画像を作ってください。
その結果は以下のとおり。
ChatGPTの場合

30秒くらいですんなり出力してくれました。
レスポンスが早く、指示に対して素直に動いてくれる印象です。
ただ、お任せにした分だけ「これじゃない感」がすごい仕上がりに。。。
Gemini(nanobanana)の場合

最初に「比較」というワードを使ったところ、「特定のAIやブランドを描写することになる可能性があるため対応できない」と断られてしまいました。
そこで「試す」という言い回しに変えて再挑戦。
すると、あっさりOK。
15秒くらいで「お!これは使えそう」という仕上がりが出てきました。
一手間かかりましたが、言葉の選び方ひとつで突破できるのは覚えておくと便利です。
Claudeの場合

画像を返してくれると思いきや、なんと2分程度考え込んでからHTMLコードで提案してきました。
そうじゃないんや…。と思いつつ、仕方なくSnippingToolで切り取りすることに。
Claudeらしいといえばらしいのですが、今回求めていたのはバナー画像。
仕上がりは「う〜ん」という感じで、正直このままでは使えません。
ある程度細かく指定してみると
次は、テイストや仕様を細かく指定した指示文で試しました。
タイトル「どのAIが一番使える? ChatGPT / Gemini / Claude 比較」を上部に大きく入れる。
・イラスト:AIを比較検討している女性 / 仕事場 / テック系
・スタイル:モダンなフラット系ベクターイラスト
・線:太め・輪郭は柔らかく・カートゥーン寄り
・塗り:フラットベース+柔らかいグラデーション・強い影なし
・サイズ:3:2
その結果は以下のとおり。
ChatGPTの場合

いい感じの仕上がりで出てきました。
こちらが指定していないサブタイトルも入れてくれて気が効いてます。
すこし微調整しましたが、修正対応が得意で、意図をくみ取る力が高いと感じました。
ただしやり取りを重ねるとサイズが変わることがあり、最後に再指定が必要になったりも。
ChatGPTは文字崩れが多いイメージがありましたが、今回は奇跡的にうまくいきました。
確かに以前よりも文字崩れは改善されてきている印象があります。
Gemini(nanobanana)の場合

こちらもいい感じの仕上がりで出てきました。
ただし、ややクセの強い一面もあり、一度イラストを提示すると、その後の修正がしづらいと感じる場面がありました。
別の画像生成で試した際には、同じチャット内で修正指示を出しても押し問答のようになってしまうことがあり、別のチャットを立ち上げて改めて指示を出す必要がありました。
Claudeの場合

今回もなにやら難しく考え込んだ後、なぞの怪物が生成されました。
頑張ったことは伝わりますが、「直す直さない以前の問題」というのが正直なところです。
画像生成は専門外と割り切るべきかもしれません。
テスト① まとめ
テキストで細かく指示を出せる場合や、文字入りの画像を作りたい場合は Gemini(nanobanana)。
一方で、参考画像を渡して「このタッチに寄せてほしい」といった指定をしたい場合は ChatGPT のほうが使いやすい印象でした。
テスト②:既存の写真を加工する
次に1から画像生成するのではなく、すでにある写真に加工をお願いする検証もしてみました。

加工したい画像を渡して、以下の通り指示出し。
この画像を加工してください。
・右に人が写ってしまっているので消してください
・オブジェの後ろの建物をなくして、背景を空にしてください
・全体の彩度と明度を調整して、オブジェが光っているのがわかりやすくしてください
3つのAIともに処理に多少時間がかかりました。
GeminiもChatGPTも加工をきちんとこなしてくれましたが、仕上がりのテイストに差がありました。
仕上がりを比較
ChatGPTの場合

こちらの希望を完全に叶えてくれました。
加工精度は高いですが、いわゆる「AI感」が少し出た仕上がりに。
個人的にはこの加工感がある感じは好きです。
Gemini(nanobanana)の場合

こちらも希望を完全に叶えてくれました。
ChatGPTと比較すると少し控え目で、AI感が抑えられて自然な仕上がりです。
Claudeの場合

こちらの希望は一切無視の仕上がりに。
君は2分以上も一体何をしていたんだ…。
画像加工においても厳しい結果になりました。
テスト② まとめ
自然な仕上がりの画像加工という点では Gemini が最も安定している印象でした。
違和感の少ない調整ができる点は大きな強みです。
次点としては ChatGPT が続き、こちらも実用レベルの仕上がりでした。
総評まとめ | 画像生成に最適なAIは?実際に使って分かった3つのAIの違い
画像生成という領域では、今回はGeminiに軍配が上がりました。
| 評価項目 | ChatGPT | Gemini | Claude |
|---|---|---|---|
| ゼロからの画像生成 | ○ | ◎ | △ |
| 既存画像の加工 | ○ | ◎ | △ |
| 処理スピード | ○ | ◎ | △ |
| 修正対応・意図のくみ取り | ◎ | ○ | — |
| テキスト指示での再現精度 | ○ | ◎ | — |
| 参考画像ベースの生成 | ◎ | ○ | — |
もちろんClaudeが画像生成向きでないことは最初からわかっていましたし、ChatGPTにも修正対応という面も含めて光る部分があります。
大事なのは「何をお願いしたいか」でAIを選ぶこと。
AIは日々進化しているので、定期的に触りながら自分なりの使い分けを更新していくことが大切だと感じています。
おまけ:AIへの指示はAIに作ってもらう
最後に、個人的に使っているテクニックをひとつご紹介します。
実践Tips
「Geminiに出す指示文がうまく作れない…」というとき、その指示文をChatGPTに作ってもらっています。
ChatGPTに参考イラストを渡して「このタッチに寄せたイラストをGeminiに作ってもらいたい。そのままGeminiに渡せる指示文を作って」とお願いするだけ。
AIの使い方がわからないなら、その答えもAIに聞いてしまうのが近道です。