ChatGPT4oの情報バイアス ー ChatGPT4o作成イラストに見るAIの「思い込み」

学習データ(training data)の不十分性=偏りに起因するバイアス

生成AIにおける問題の一つは、生成AIの学習(training)に使用されたデータの質や量の不十分性、データの偏りといった点である。テキスト生成でもそうしたことが問題となるが、画像生成ではさらにそのことが大きな問題になるように思われる。

「ChatGPT4oを利用したイラスト作成-芥川龍之介『羅生門』を題材として」の中で紹介したように、平安時代の主人公のイラストを作成させたところ、筆者のプロンプト文作成能力では思い通りのイラスト図を作成させることができなかった。

「芥川龍之介の『羅生門』という小説の主人公である、若い下人のイラストを作成してください。なお時代は平安時代であることを踏まえた衣装にしてください。」というプロンプト文に対するChatGPT4o作成のイラスト図をいくつか作成させた結果は、下記のようなものである。


上記イラストに関するChatGPT4oによる説明文「Here’s the illustration of the young servant from Ryunosuke Akutagawa’s novel “Rashomon,” set in the Heian period. The character is depicted with traditional Heian clothing and the iconic Rashomon gate in the background, capturing the dark and atmospheric tone of the story.」(なぜか英語での説明文となっている。)


ChatGPT4oによる説明文「こちらが芥川龍之介の『羅生門』の主人公である若い下人のイラストです。平安時代の衣装を着ており、物語の暗く絶望的なトーンを反映した表情をしています。背景には平安時代の建築物の要素も含まれています。」(繰り返し作成させたところ、今度は日本語での説明文となった。)



ChatGPT4oによる説明文「Here is the illustration of the young servant from Ryunosuke Akutagawa’s novel “Rashomon,” dressed in Heian period attire. The setting is dark and ominous, reflecting the grim atmosphere of the story. The young servant appears wary and thoughtful, standing in front of the Rashomon gate with a somber expression. The stormy clouds in the background enhance the overall sense of despair and uncertainty.」(さらに繰り返し作成させたところ、今度はまた英語での説明文となった。)

 このように、時代設定を平安時代としているにも関わらず上記のように時代的に合わないイラストが作成されてしまう。

そのようになる理由は、服装に関するChatGPT4oの学習データの中に平安時代の衣装が含まれてはいないことが一因であると推定される。そしてそのことによって、昔の日本人男性が着る和服は羽織・袴スタイルであるという「バイアス」が形成されてしまっているためではないかと考えられる。

 
著作権問題対応(?)に起因するバイアス補正の困難性

 上述のバイアスの存在に対応するために、ChatGPTに対する追加的指示として、平安時代の衣装に関する情報を与えることによって、意図したイラストを作成させようとしたが、簡単には成功できなかった。API利用では可能なのかもしれないが、WEB経由でのオープンな対話的利用ではバイアスへの対応が必ずしもうまくできないと思われる。

バイアス補正のために、ChatGPTに与えた追加のプロンプト文は下記のようなものである。

平安時代の庶民の衣装は、下記WEBにあるような水干(すいかん)であった、と言われている。

風俗博物館「附つけものをつけた水干を着ている放免」日本服飾史home>衣装一覧>平安時代
https://costume.iz2.or.jp/costume/527.html
日本語版ウィキペディア「水干」
https://ja.wikipedia.org/wiki/水干

[写真の出典]日本語版ウィキペディア「水干」にある、投稿者Corpse Reviver氏の画像を基に、そのバックを切り取った写真

平安時代の庶民の衣装に関する上記WEBページの記載を踏まえたイラストにしてください。

上記の指示に従って作成されたイラスト図は下記の通りである。

ChatGPT4oが描くイラスト図は江戸時代の武士風であり、プロンプト文で指定した平安時代の庶民の服装とは似ても似つかない。上記に挙げた日本語版ウィキペディア「水干」にある、投稿者Corpse Reviver氏の画像を修正した写真をもとに修正するように指示しても結果は下記の通りであり、変わっていない。

このようになる理由は、ChatGPT4oのバイアスということだけでは説明がつかない。上記のように基にすべき写真を明示的に与えているにも関わらず、それとはまったく異なる形の服装になる理由は、ChatGPT4oの機能的限界や描画性能の低さを示すというよりは、「著作権問題に配慮し、アップした画像データを基にした画像生成をWEB経由でのオープンな対話的利用ではさせないような設計になっている」ことを示すものとも推定される。
 すなわち元画像とはあえて異なるイラスト図を作成するように設計されているのではないかと思われる。

このことは日本語版ウィキペディア「水干」の中の写真を加工した上記画像をChatGPT4oにアップした上で「水彩画風にしてください」というプロンプト文を与えたにも関わらず、下記のように服装だけでなく、髪型も平安時代とはまったく異なるイラスト図を生成してきたことにも示されている。

なおさらにまた「ChatGPT4oを利用したイラスト作成-芥川龍之介『羅生門』を題材として」の中で紹介した市女笠の説明に関するChatGPT4oの回答に続けて、「市女笠をかぶった平安時代の女性のイラスト図を作成してください。」という追加プロンプト文を与えた結果は下記の通りである。

 上記のイラスト図に対してChatGPT4oは、「こちらが市女笠をかぶった平安時代の女性のイラストです。彼女は優美な着物を着ており、古典的な日本庭園を背景にしています。このイラストが『羅生門』の世界観を視覚的に捉える助けとなれば幸いです。」という説明文を付しているが、まったく的外れである。
 まず第一に、笠はChatGPT4oが最初に作成したイラスト図とは異なり、現代の傘に近い形になっている。次に、市女笠をかぶっている女性は、幅が広い帯をし、派手な簪を付けて髪を結っているなど、どう見ても平安時代の女性の姿・形ではない。(なお、幅が広い帯の着用は江戸時代以降と言われている。)
 これもChatGPT4oの情報バイアスを示すものである。

なお上記のイラスト図に対して、「上記のイラスト図は現代の舞妓さんのようなイラスト図です。また市女笠は最初の説明にあったイラスト図とはまったく異なるものです。訂正してください。」というプロンプト文を与えたが、やはり不適切なままである。

カテゴリー: AIに関する技術論的考察, AIのバイアス, AIの設計問題, ChatGPT4o, 著作権問題対応 パーマリンク