PerplexityAIを利用したイラスト作成(1)-ピーターパンの挿絵を題材として

Barrie,J. M.(1911)Peter and Wendyに掲載されているピーターパンに関するF. D. Bedfordの下記挿絵を素材として、先にChatGPT4oで画像生成を試みたが、今度はPerplexityAIで同様のことをさせた。

converted PNM file

PerplexityAIに与えたプロンプト文
プロンプト文は「アップロードしたイラスト画像をカラー化してください。」という単純なものであったが、Perplexity AIはアップロードした画像のファイル名Peter_pan_1911_pipes.jpgをヒントとしたのか、下記のような回答文が返ってきた。
 
PerplexityAIによる第1回目の回答
この画像は1911年に出版されたピーター・パンの挿し絵のようです。熱帯雰囲気の風景の中で、動物や妖精に囲まれた少女が描かれています。
この古典的な白黒イラストにAIを使ってカラー化を施すことができます。画像認識とディープラーニングの技術を使い、自然な色合いを再現することが可能です。ただし、元の作品の雰囲気を損なわないよう、慎重に色付けする必要があります。
カラー化の処理には数分かかる可能性がありますが、完了次第カラー化された画像を共有させていただきます。作業にお時間をいただけますでしょうか?
 
PerplexityAIによる第1回目の回答に基づく生成画像
Perplexity AIは、上記回答文では、アップロードした画像に描かれているピーターバンに関して、「熱帯雰囲気の風景の中で、動物や妖精に囲まれた少女」と認識しているため、生成された画像の中の人物は、下記のように少年ではなく、少女となっている。
 なおPerplexity AIは、OPEN AIのChatGPT4oのように、テキスト、画像、音声などをシームレスに一元的に取り扱う生成AI(マルチモーダルな生成AI)ではないため、「アップロードしたイラスト画像をカラー化してください。」というプロンプト文に応じて画像を直接的に生成することはできない。
 下記に挙げた生成画像は、アップロードしたイラスト画像に関する直接的に分析結果に基づいて生成されたわけではない。プロンプト文の中の文章「熱帯雰囲気の風景の中で、動物や妖精に囲まれた少女が描かれています。(中略)元の作品の雰囲気を損なわないよう、慎重に色付けする必要があります。」に対応して、画像を生成したに過ぎない。

 またPerplexity AIは、画像生成エンジン(Image Generation Model)として、Stable Diffusion XL、Playground v2.5、DALL-E3の3つを選択できるようになっている。そのため下記ではそうした3種類の画像生成エンジンを利用して画像生成を行っている。

 

画像生成エンジンとして、Playground v2.5を利用した画像


 

画像生成エンジンとして、Stable Diffusion XLを利用した画像


 

画像生成エンジン(Image Generation Model)として、DALL-E3を利用した画像

 
カテゴリー: イラスト作成, ピーターパン パーマリンク