ChatGPT4oは、テキストだけでなく、イラストなどの静止画像も同時に生成できるようになっている。(2024年5月16日16時現在ではOpenAIのサーバーの不調のためか、AI音声読み上げ機能が利用できない。ChatGPT4oの特長の一つである、人間によるものとの区別ができないほど自然なAI音声読み上げについては後日、紹介する。)
例えば、下記のように、芥川龍之介の5作目の短編小説『羅生門』(初出:『帝国文学』1915年11月号、エンディング改稿:『新興文芸叢書第八編 鼻』春陽堂、1918年)に関して、そこに登場する各種の事物に関してイラスト付き解説作成をさせることもできる。
- 「芥川龍之介の『羅生門』という小説に登場する羅生門とはどのようなものか教えてください。また羅生門のイラストを作成してください。」というプロンプト文を与えると、下記のような回答が返ってきた。
- 「芥川龍之介の『羅生門』という小説の主人公である、若い下人のイラストを作成してください。」というプロンプト文を与えると、下記のようなイラストが作成されてきた。
芥川龍之介『羅生門』の中で、主人公の下人は、「右の頬に大きなニキビがある」とか、山吹色の「汗袗」(かざみ。汗で衣類がべとつかないようにしたり、汗が衣類にじむのを防止するために用いた肌着)の上に、「洗いざらした紺の襖」(襖は「あお」と呼び、平安時代の庶民が来ていた上着)を着ていた、と記載されている。そのため、下記の注に挙げたWEBページを参照して、着物を修正するように指示したが、その通りに修正したイラストを作成させることはできなかった。
そのようになった理由の一つは、ChatGPT4oの学習(training)データが日本の江戸時代の和服を基本としたものであり、平安時代の衣装に関する学習をしていないことによるものであると思われる。
さらにまたこのことはChatGPT4oの性能の低さを示すというよりは、「著作権問題に配慮し、アップした画像データを基にした画像生成をWEB経由でのオープンな対話的利用ではさせないような設計になっている」ことを示すものとも推定される。<注>襖という上着は、下記WEBにあるような水干(すいかん)と類似の物であった、と言われている。風俗博物館「附つけものをつけた水干を着ている放免」日本服飾史home>衣装一覧>平安時代
https://costume.iz2.or.jp/costume/527.html
日本語版ウィキペディア「水干」
https://ja.wikipedia.org/wiki/水干
[写真の出典]日本語版ウィキペディア「水干」にある、投稿者Corpse Reviver氏の画像を基に、そのバックを切り取った写真 - 「芥川龍之介の『羅生門』という小説に登場する市女笠とはどのようなものか教えてください。また市女笠のイラストを作成してください。」というプロンプト文を与えると、下記のような回答が返ってきた。市女笠(いちめがさ)は、平安時代から江戸時代にかけて、特に女性が使用した日本の伝統的な帽子です。形状は広い円形で、縁が下に垂れています。主に竹や葦で編まれ、布で覆われることが多かったです。この帽子は、雨や日差しから顔を守るために使用されました。
『羅生門』に登場する市女笠は、物語の時代背景と合わせて、古風で実用的なデザインとなっているでしょう。以下のイラストで市女笠のイメージを具体化します。
こちらが市女笠のイラストです。芥川龍之介の『羅生門』に登場する市女笠は、平安時代の雰囲気を持つ伝統的なデザインが特徴です。このイラストが、物語の中で描かれている市女笠のイメージを具体化する一助となれば幸いです。
なお残念ながら、ChatGPT4oが作成した上記の市女笠のイラスト図は、平安時代の市女笠とはかなり異なっている。別ページでも紹介したが、平安時代の市女笠は「周縁部が大きく深く,肩,背をおおうほどであった」とされている。また市女笠の中央部の突起は、上記のイラストのような布製の半円球型の帽子形状ではなく、菅(スゲ)製の円柱型であった。
市女笠に関する、より正確な画像を見付けるには、下記に挙げた中では、Microsoft Bingで”a city woman in her ichimegasa hat”を検索させた画像検索が有用である。Googelの画像検索結果はあまり好ましいものではない。
- Microsoft Bingで ”a city woman in her ichimegasa hat”を検索させた結果
- Microsoft Bingで「市女笠を被った女性」を検索させた結果
- Google検索で「市女笠を被った女性」を検索させた結果
- Google検索で”a city woman in her ichimegasa hat”を検索させた結果
なお、国際日本文化研究センターの「怪異・妖怪画像データベース」で「市女笠」をキーワード検索させると下記がヒットする。
J.Dautremer、「旅装束の老婆。鬼が化けた姿である。白髪を長く伸ばし、松のような模様が入った打掛をまとい、足袋と草履をはいている。腰を屈めて、門扉の前に立ち、右手に市女笠と杖を持ち、左手で扉を叩こうとしている。」
上記の図は、「縮緬本」(和紙に印刷した後に、絞って加工し和本に仕立てたもの。柔らかい手触りと、絹の縮緬布に似た風合いから「縮緬本」と呼ばれる。)のLes contes du vieux Japon, NO.18 Le bras de l’ogre(ちりめん本データベース)の中に所収されている図である。
物語の中で描かれる羅生門は、荒廃し、崩れかけた状態にあります。天災や戦乱の影響で荒れ果て、人々に見捨てられた場所として描かれています。門の上には死体が放置され、夜になると鬼や盗賊が現れるという噂も立っていました。主人公の下人が羅生門の下で雨宿りをし、その後、門の上で老婆と出会う場面が物語のクライマックスとなります。
羅生門のイラストについては、以下のように描写できます。
– 古びた木材や石で作られた大きな門
– 崩れかけていて、一部が壊れている
– 雨が降りしきる中、暗く陰鬱な雰囲気
– 門の上には荒れた屋根があり、その上には古びた藁や瓦が散らばっている
– 門の周囲には雑草が生い茂り、放置された感じが強調されている
– 人々が避けるような不気味な雰囲気
これを基に、イラストを作成します。
こちらが芥川龍之介の短編小説『羅生門』に登場する羅生門のイラストです。このイラストは、荒廃し、崩れかけた状態の羅生門を描いています。暗く陰鬱な雰囲気で、雨が降りしきる中、放置された不気味な感じが強調されています。
なお上記のように最初に生成されたイラストがモノクロであったので、「上記の羅生門のイラストを、モノクロではなく、カラーにしてください。」というプロンプト文で新たなイラスト図を生成させた結果を下記に二つ紹介する。ChatGPToが「こちらがカラーで描かれた羅生門のイラストです。色彩が追加され、暗く陰鬱な雰囲気がより一層強調されています。荒廃した木材や石、古びた藁や瓦、そして茂った雑草が描かれています。」と記している通り、カラー・イラストの方がより雰囲気が出ている。
なお「「羅生門は崩れかけていて、一部が壊れている」点、および、「羅生門の上には荒れた屋根があり、その上には古びた藁や瓦が散らばっている」点がもっとはっきりとわかるようなカラーのイラストにしてください。」というように、描写に関するより詳細な追加注文をした方が下記のようにより適切なイラストとなる。
なお羅生門のモデルとなった羅城門は横幅が9間、すなわち、約16mとかなり横長で2階建ての建物であった。京都駅にある羅城門の復元模型は下記の通りである。
[図の出典]日本語版ウィキペディア「羅城門」所収の京都駅の復元模型の写真をもとに、背景を切り取った。
https://ja.wikipedia.org/wiki/羅城門
この復元模型を参考として、先のイラスト図を修正するようにするプロンプト文を与えた結果は下記の通りである。「円柱が横並びで8本になるようにしてください。」とか、「横幅は9間、すなわち、約16mと、かなり横長の建物です。」といった指示を与えたが残念ながらそうした指示通りのイラスト図には生成されなかった。円柱は6本であるが、先の図よりは横長の建物にはなった。
ピンバック: ChatGPT4oを利用したイラスト作成-ChatGPT4oにおける情報バイアス – コスモピア AI研究室