画像生成AIを使うとなると英語のプロンプトを使用して組み合わせや調整をしないといけないイメージですが今回紹介する「Whisk」ではそんな難しい作業が不要で画像生成が可能となります。
各ジャンルのスタイルを選んで画像をアップするだけで特徴をとらえた画像が自動的に生成されます。
またスタイルがなくても「ゼロから作ってみる」ということも可能です。
スタイルとアップロードするモデル画像を組み合わせれば自身の思うイメージに近づけることが出来るでしょう。
もちろん画像だけではなくテキストでも画像生成が出来るので今回2つのパターンを比べ、どこまでイメージに近い画像が表示されるのか見てみてください。
Whiskを実際に使って画像生成してみた
■Whisk
https://labs.google/fx/ja/tools/whisk
アップロードされた画像はGeminiにテキストへと変換され、 そのテキストが高性能画像生成モデルImagen 3を使い、新しい画像が生成されます。

ゼロから作ることもできますが、トップページの画像アップだけで生成できる画面を試してみます。
現状スタイルは以下より選択可能↓
- カプセルトイ
- お弁当
- カード
- チョコレート
- ぬいぐるみ

モデルに事前に用意した華やかなピンク色のギフト画像を入れて、「チョコレート」のパターンと「お弁当」のパターンで生成してみます。
モデルに画像をドラッグ&ドロップするだけで画像が生成されます。
どちらもチョコレートギフトやお弁当の華やかさが目立つ仕上がりとなりました。
ツールで開くことによりダウンロードや詳細の編集画面に移動します。
プロンプト(テキスト)のみ入れて生成
こちらでは左側(黄背景)にモデル、背景、スタイル(サイト内で用意されているデフォルトのチョコレート画像)を入れて右側(白背景)には詳細のプロンプトを入れてみます。

モデル:animal(animalと入れたら高確率でCOW→牛が出てきました。)なぜ牛ばかり…
背景:gift
スタイル:既存テンプレートのチョコレートを選択
現在ではプロンプトは日本語ではなく英語であれば画像が生成された
右側(白背景)詳細プロンプトには以下を入力↓
バレンタインデー用の動物のおいしいそうな彩チョコレート
熊?の形をしたようなチョコレートが入ったギフト画像が生成されました。
試しにモデルにdogやcatを入れて再生成するとチョコ感がなくなった、画像のようなチョコサイズの犬や猫のオブジェやリアルなものが生成されました。
プロンプトだけではより細かい指定は難しいのでしょうか。
画像のみ入れて生成
こちらでは左側(黄背景)にモデル、背景、スタイルに画像をアップロードして右側(白背景)には詳細のプロンプトを入れてみます。

詳細テキストに先ほどと同じ文
バレンタインデー用の動物のおいしいそうな彩チョコレート
と入れてみました。
すると上記のように楽器を持った複数の動物がチョコレート化?しているのか分かりづらいですが、それっぽい質感で背景やスタイルといくつか合致するイメージが現れています。
プロンプトのみより複数画像を組み合わせたほうがAI側が分かりやすくイメージされた画像を生成してくれます。
商用問題について
Imagen 3で生成された画像は商用利用可能と明記されています。
https://imagx.ai/ja
といってもImagen 3を使っているWhiskも商用可能?と言われると、必ずしもそうとは限られません。
Whiskは現在、試験運用版画像生成ツールつまり開発途中で明確に商用利用可能とも不可とも書かれていません。
最後に
プロンプトを考える手間が省けて画像をアップするだけでAI画像を生成してくれるWhiskを紹介しました。
Imagen 3から生成されるならそちらから使えば良いのでは?と思うかもしれません。
たしかにImagen 3は特定のイメージが固まっている場合に高画質の画像を生成してくれるでしょう。
ですがWhiskはイメージが固まっていない場合、複数画像を組み合わせることでまったく新しいイメージの画像を生成することに特化しています。
それにまだ試験運用中で今後のアップデートも期待されるでしょう。
Whiskに興味がある方はぜひ一度試してみてください。