テキスト生成AIにおける最小処理単位「トークン」ーなぜ日本語文よりも英語文の方がより詳細な回答となるのか?

生成AIに与えるプロンプト文は必ずしも文章である必要はない。というのも、WEBインターフェースで生成AIに与えたプロンプト文は、実際に生成AIに処理させる段階でトークン(token)≒単語に分解されるからである。

 

トークンについてのOPenAIによる公式の解説は、Open AI(2024) “What are tokens and how to count them?”にある。それによれば、1トークンが英語で約4文字、平均で75wordsが100トークンとされている。

 

自分が入れた文章のトークン数については、OpenAIが提供している下記WEBページ「Tokenizer」で調べることができる。

 

上記WEBページの「Tokenizer」で調べると、GPT-3.5およびGPT-4の場合、下記の図に示されているように、「原子力の社会的利用をめぐる推進論と批判論の歴史的展開」という26文字の日本語文で36トークンとなっている。
 なお下図の色分けは、「原子力の社会的利用をめ」までの部分は、漢字・ひらがなともに、1文字1トークンとなっているが、「ぐ」の部分はひらがな1文字で2トークンとなっていることを示している。

 

これに対して同語句の英訳であるHistorical Development of Arguments for and against Civilian/Non-Military Use of Nuclear powerという12words(94文字,Civilian/Non-Militaryも1word扱い)の英語文では、下記の図に示されているように、18トークンと、日本語の場合の約半分のトークン数となっている。
 なお下図の色分けは、前置詞の「of」、「for」、「against」、接続詞の「and」だけでなく、「Development」、「Arguments」、「Nuclear」、「Power」といった単語が1wordで1トークンとなっていること、および、「Historical」や「Civilian」といった形容詞語句が1wordで2トークンとなっていることを示している。

 

「原子力の社会的利用をめぐる推進論と批判論の歴史的展開」という日本語の語句は、GPT-3で48トークンであったが、GPT-3.5およびGPT-4では36トークンとなり、トークン消費量が25%も減少し、3/4となっている。こうしたこと、および、Open AIの発表を見ると、GPT-4oではGPT-3.5およびGPT-4よりもトークン消費量の減少が期待できる。しかしながら2024/6/12現在ではTokenizerは、coming soonとなっており利用ができない。

 

日本語文に関するトークン分解に関するより詳しい具体的事例に基づく説明としては、”Inquiry Regarding Token Counting in Japanese for GPT-3 API”2023年9月などが参考になる。

 

CRIMO voice(2024)「ChatGPTの文字数制限は1万字弱!無料・有料の違いや対処法を解説」2024/5/27によると、質問入力可能トークン数(日本語文字数)、および、最大回答トークン数(日本語文字数)の推定値は、無料利用可能なGPT-3.5で約16,000トークン(約10,000文字)、約3,000トークン(約2,048文字)、有料のGPT-4で約32,000トークン(約25,000文字)、約20,000トークン(約2万5,000文字)となっている。[有料のGPT-4の最大回答トークン数の約20,000トークンに対応する文字数が約2万5,000文字となっているのは、間違いではないかと思われるが、原文のママの引用とした]

 

上記のように、トークン消費量は日本語文よりも英文の方が少ないため、英語文で質問した方がより長い質問が可能となるとともに、より適切でより詳細な回答が一般的には生成される。

 
カテゴリー: AIに関する技術論的考察, トークン | 3件のコメント

生成AIによる英文校閲-「原子力の社会的利用をめぐる推進論と批判論の歴史的展開」というタイトル語句の訳出

筆者の研究テーマの一つが、「原子力の社会的利用をめぐる推進論と批判論の歴史的展開」(関連ブログ:atom.sanosemi.com)というものである。

科学研究費の報告書において、同語句の英訳が必要となったため、例によって下記のような二段階でより適切な訳出の追求を試みた。

  1. DeepL翻訳(https://www.deepl.com/ja/translator)を利用して、日本語テキストの英訳をさせる。
    DeepL翻訳による英訳:Historical Development of Promotional and Critical Arguments for the Social Use of Nuclear Energy
     

  2. DeepL翻訳(https://www.deepl.com/ja/translator)による英訳に関して、生成AIにチェックさせる。
     
    生成AIに与えたプロンプト文
    「原子力の社会的利用をめぐる推進論と批判論の歴史的展開」の下記英語訳について、表現の適切性をチェックし、訂正箇所および詳しい訂正理由を教えてください。
     
    Historical Development of Promotional and Critical Arguments for the Social Use of Nuclear Energy
     
たった26文字の語句であるが、各生成AIによって様々な訂正箇所・訂正理由の提示があった。各生成AIの回答を読む中で、「「批判論」という語句は「推進論」と対置されていることから、日本語の「批判」という単語と同じく「正当性・妥当性などを評価する」といったニュアンスを持つCriticalという語句を使うのは避けて、別の表現を採用した方が良い」と考えるようになった。DeepL翻訳で済ませるのではなく、生成AIを利用した英文校閲をおこなうことの有用性・必要性が今回も確かめられた。

また26文字と短いがゆえに、各単語レベルでの検討・訂正がなされ、訂正理由の説明も詳しい。現行のWEB経由での生成AI利用で詳細な英文校閲をさせる場合には、ワンパラグラフごとなど、なるべく短い文章をチェックさせた方が良いと思われる。

またよく知られているように、同じ生成AIでも繰り返し聞くと異なる回答が得られるので、面倒な作業ではあるが、繰り返しの回答に基づく英文校閲作業が望ましい。

 
 
 
以下に、生成AIの回答の一部を紹介する。
 
生成AIの回答
生成AIの回答
 

    Your translation is generally clear, but there are a few points to consider for making it more precise and natural. Here’s a revised version with explanations for each change:
     
    Original: Historical Development of Promotional and Critical Arguments for the Social Use of Nuclear Energy
     
    Revised: Historical Development of Pro and Con Arguments Regarding the Social Use of Nuclear Energy
     
    Detailed Explanation:
    1. “Promotional and Critical” to “Pro and Con”:
    – “Promotional and Critical” is accurate but a bit formal and less common in this context. “Pro and Con” is a more concise and commonly used way to describe arguments for and against something.

    2. “Arguments”:
    – The term “arguments” is appropriate and does not need to be changed.

    3. “Regarding” instead of “for”:
    – “Regarding” is a more precise preposition in this context, indicating the subject of the arguments.

    4. “Social Use”:
    – “Social Use” is correctly translated and does not need to be changed.

    5. Overall Fluency and Readability:
    – The revised version flows more naturally in English while retaining the original meaning.

    So, the revised translation is:

    Historical Development of Pro and Con Arguments Regarding the Social Use of Nuclear Energy

     
    Your translation is quite accurate and conveys the intended meaning well. However, it can be refined for better clarity and flow. Here’s a revised version with detailed explanations for the changes:
     
    Revised Translation:
    Historical Development of Advocacy and Criticism Regarding the Social Use of Nuclear Energy
     
    Reasons for Changes:
    1. “Promotional and Critical Arguments” to “Advocacy and Criticism”:
      • “Promotional” is correct but can sound a bit formal and broad. “Advocacy” captures the active support and promotion aspect more naturally.
      • “Critical Arguments” is accurate, but “Criticism” is more straightforward and commonly used in this context.
       
    2. “Regarding” instead of “for”:
      • “Regarding” is more precise when discussing the subject of a debate or discussion.
       
      These changes help to make the title clearer and more aligned with common academic and professional terminology.

    Perplexity AI(有料版:GPT4)は、下記のように、参考資料として、関連する英語論文 Jun, E. et al. (2010) “Measuring the social value of nuclear energy using contingent valuation methodology,”Energy Policy,38(3), pp.1470-1476や、日本語論文 菅原慎悦(2021)「原子力分野における安全目標とその社会的議論の批判的分析」『年報 科学・技術・社会』30, pp.3-33など興味深い資料を提示してくれる点で優れている。

    —- Perplexity AI(有料版:GPT4)の回答 —-
    表現の適切性をチェックした結果、以下の点を訂正することをおすすめします。

    1. “Promotional” を “Supportive” に変更
    理由: “Promotional”は「宣伝の、販促の」というニュアンスが強いので、原子力利用を支持する立場を表すのには適切ではありません。”Supportive”の方が「支持する、賛成の」という意味合いが伝わります。

    2. “Critical” を “Opposing” に変更
    理由: “Critical”だと「批判的な」という意味に加えて「重大な、危機的な」といったニュアンスもあるため、原子力利用に反対する立場を表すのには “Opposing”の方が直接的で明確です。

    3. “for” を “on” に変更
    理由: “arguments on”で「〜についての議論」という意味になるのに対し、”arguments for”だと「〜のための議論」という意味合いが強くなります。原子力利用をめぐる議論全般を指すなら “on” の方が適切です。

    4. “Social Use” を “Societal Application” に変更
    理由: “Social Use”よりも”Societal Application”の方が「社会への応用・適用」というニュアンスがより明確に伝わります。”Social Use”だと社会的な利用方法という意味にも取れます。

    以上の点を踏まえ、訂正案は次のようになります。

    Historical Development of Supportive and Opposing Arguments on the Societal Application of Nuclear Energy

    Citations:
     

    Perplexity AI(有料版:Claude3 Opus)もPerplexity AI(有料版:GPT4)と同じく、下記のように、参考資料として、関連する英語論文 Jun, E. et al. (2010) “Measuring the social value of nuclear energy using contingent valuation methodology,”Energy Policy,38(3), pp.1470-1476や、日本語論文 菅原慎悦(2021)「原子力分野における安全目標とその社会的議論の批判的分析」『年報 科学・技術・社会』30, pp.3-33など興味深い資料を提示してくれる点で優れている。

    —- Perplexity AI(有料版; Claude3 Opus)の回答 —-
    英語訳の表現は概ね適切だと思います。以下の点を修正することをおすすめします。

    1. “Promotional and Critical Arguments” は “Supportive and Critical Perspectives” などの表現の方が自然です。”Arguments”だと議論や口論のニュアンスが強くなります。

    訂正案: “Supportive and Critical Perspectives”
    理由: 推進論と批判論は異なる立場からの見方や視点を表すので、”Perspectives”の方が適切です。

    2. “for the Social Use of” は少し不自然な表現なので、”on the Societal Utilization of” などに変更した方が良いでしょう。

    訂正案: “on the Societal Utilization of”
    理由: “Social Use”だと社会的な使用方法という意味合いが強いですが、ここでは社会における原子力の利用について述べているので、”Societal Utilization”の方が文脈に合います。

    3. “Nuclear Energy” は複数形の “Nuclear Technologies” とした方が、原子力技術全般について述べている感じが出ます。

    訂正案: “Nuclear Technologies”
    理由: 原子力エネルギーだけでなく、原子力に関する様々な技術の社会的利用に関する議論の歴史的展開について述べるなら、”Nuclear Technologies”とした方が適切でしょう。

    以上を踏まえた訂正案は次のようになります。

    訂正後:
    “Historical Development of Supportive and Critical Perspectives on the Societal Utilization of Nuclear Technologies”

    この表現なら、原子力技術の社会での利用をめぐる推進論と批判論の歴史的な展開について、より自然に伝わると思います。

    Citations:
    [1] https://wvupressonline.com/node/878
    [2] Jun, E. et al. (2010) “Measuring the social value of nuclear energy using contingent valuation methodology,”Energy Policy,38(3), pp.1470-1476.
    https://www.sciencedirect.com/science/article/abs/pii/S0301421509008581

    [3] 菅原慎悦(2021)「原子力分野における安全目標とその社会的議論の批判的分析」『年報 科学・技術・社会』30, pp.3-33
    https://www.jstage.jst.go.jp/article/jjsts/30/0/30_3/_pdf

    [4] https://www.meti.go.jp/meti_lib/report/2019FY/000407.pdf
    [5] https://www.sciencedirect.com/science/article/pii/S2214629620301432
    [6] https://www.iaea.org/newscenter/statements/safe-and-peaceful-use-nuclear-energy-iaea-perspective
    [7] https://www.iaea.org/sites/default/files/publications/magazines/bulletin/bull29-3/29304781925.pdf
    [8] https://world-nuclear.org/information-library/current-and-future-generation/outline-history-of-nuclear-energy
    [9] https://www.vill.tokai.ibaraki.jp/material/files/group/16/5be40a8126d6b.pdf
    [10] https://www.drishtiias.com/daily-updates/daily-news-editorials/revisiting-the-need-of-nuclear-energy
    [11] https://jss-sociology.org/other/20210924post-12090/
    [12] https://www.aec.go.jp/jicst/NC/tyoki/sakutei2004/sakutei32/siryo2.pdf
    [13] https://doshisha.repo.nii.ac.jp/record/27897/files/019022020006.pdf
    [14] https://www.nippyo.co.jp/shop/files/downloads/SHINSAI/PDF2/jihou_50_7_p27.pdf
    [15] https://www.tepco.co.jp/en/press/corp-com/release/betu12_e/images/120620e0104.pdf
    [16] https://www.aec.go.jp/jicst/NC/tyoki/siryo/siryo15/siryo6.htm
     

    Google Gemini Advanceは、原子力の利用の対象範囲の違いに応じた語句選定という視点からのチェックなど、ChatGPT4oやPerplexity AIとはまた異なったチェックをおこなっているという意味で有用である。筆者の研究対象は主として原子力発電問題であるため、Google Gemini Advanceが指摘するように”Energy”という単語より”Power”を用いる方がより適切である。

    —- Google Gemini Advanceの回答 —-

    ご提示いただいた英語訳は、ほぼ適切で意味も通じますが、より正確かつ自然な表現にするための修正を提案します。

    修正案

    Historical Development of Arguments for and against the Social Use of Nuclear Energy
     

    修正理由

    “Promotional and Critical Arguments” の部分 “Promotional” は少し硬い表現で、学術的な文脈以外ではあまり使われません。また、”Critical” だけでは、どのような批判なのかが不明瞭です。そこで、より一般的な “Arguments for and against” に変更しました。これは「賛成と反対の議論」という意味で、より中立的で包括的な表現になります。
     

    その他の注意点

    “Social Use” の部分 原子力の利用は、発電だけでなく、医療、工業など多岐にわたります。もし文脈が発電に限定される場合は、”Social Use of Nuclear Energy” の代わりに “Nuclear Power Generation” や “Nuclear Energy for Electricity” など、より具体的な表現を使うことも可能です。
     

    全体として、修正案はより自然で、意味も明確になっています。文脈に合わせて、”Social Use” の部分をより具体的な表現に置き換えることも検討してください。

    MicrosoftのCopilotは、下図のように、「より創造的に」、「よりバランスよく」、「より厳密に」という3つの動作モードを持っている。

    Microsoft Copilot AIの「より創造的に」モードの回答は、「Adovocay」=「推進論」の反対語として、「Critique」という単語を挙げている。しかしながらこれはあまり適切ではない。

    「Critique」という単語の日本語的ニュアンスは、「反対する」という意味での「批判」ではなく、「吟味する」という意味での「批評」・「論評」・「評論」といった意味合いである。例えばカントの『純粋理性批判』(Die Kritik der reinen Vernunft)という本のタイトルの英語訳はThe Critique of Pure Reasonであるが、カントは『純粋理性批判』において「純粋理性」に「反対」しているわけではない。
     またコリンズ英語辞書は、Critiqueの意味を「a written examination and judgment of a situation or of a person’s work or ideas」(状況、作業、アイデアについての考察・判断に関する文章)としている。
     なおMicrosoft Copilotそれ自身でも、「より厳密に」モードで「advocacyの反対語を教えてください。」と訊くと、下記のような回答となっているのは興味深い。このことに端的に示されているように、同一の生成エンジンでも、パラメーター設定の差異によるモードの違いで回答がかなり異なることに注意して、生成AIを利用することが有用である。

    「Advocacy」の反対語は「Opposition」です。これは、特定の問題や原因を支持する(advocacy)のではなく、それに反対する(opposition)という意味合いを持ちます。ただし、文脈により適切な反対語は変わる場合がありますので、具体的な文脈を考慮に入れてください。
     

     なおまた、「よりバランスよく」モードの回答が挙げているソースを見ると、筆者作成の科研費報告書やブログ記事が5個中4個を占めているのには驚かされた。(なお2024年6月7日公開の本ブログ記事それ自体がソースに挙げられているのは、本ブログ記事の追加・修正のために、6月9日にMicrsoft Copilotを利用したためである。)Microsoftは自ら検索エンジンを有しBing検索サービスを提供していることもあり、テキスト生成AIの回答作成においてChatGPTとは異なり最新の情報を利用していることがここでも見てとることができる。

    —- Microsoft Copilot AIの「より創造的に」モードの回答 —-

    英訳について確認しましたが、タイトル「Historical Development of Promotional and Critical Arguments for the Social Use of Nuclear Energy」は適切に訳されています。この英文は、原子力の社会的利用に関する推進論と批判論の歴史的な展開を表しており、内容が正確に伝えられています。

    ただし、より明確にするためには、以下のような修正を提案します:

    Original: Historical Development of Promotional and Critical Arguments for the Social Use of Nuclear Energy

    Suggested: The Historical Development of Advocacy and Critique Regarding the Social Utilization of Nuclear Power

    この修正案では、「Promotional」を「Advocacy」に、「Critical Arguments」を「Critique」に変更し、「Nuclear Energy」を「Nuclear Power」にしています。これにより、原子力の社会的利用を支持する立場と批判する立場の歴史的な変遷を、より一般的な英語表現で表しています。

    「Advocacy」は積極的な支持や推進を意味し、「Promotional」よりも広範な活動を含むことが多いため、こちらの方が適切です。「Critique」は批判的な分析や評価を指し、「Critical Arguments」よりも学術的な文脈でよく使用されます。「Nuclear Power」は「Nuclear Energy」よりも具体的な用語であり、社会的な利用という文脈に合っています。

    以上の理由から、提案した修正が原文の意味をより正確に伝えると考えられます。

    —- Microsoft Copilot AIの「よりバランスよく」モードの回答 —-

    Certainly! The English translation you provided is quite accurate. However, I recommend a slight modification for clarity and conciseness:

    Revised Translation:
    Historical Development of Arguments Supporting and Criticizing the Social Use of Nuclear Energy

    Explanation:
    – I replaced “Promotional” with “Supporting” to convey the idea more directly.
    – The revised version maintains the original meaning while being more concise. ¹

    Feel free to use this revised translation, and if you have any further questions or need additional assistance, feel free to ask! 😊

    ソース: Copilot との会話、 2024/6/9
    (1) 原子力の社会的利用をめぐる推進論と批判論の歴史的展開. https://kaken.nii.ac.jp/ja/grant/KAKENHI-PROJECT-16K01168/.
    (2) 生成AIによる英文校閲-「原子力の社会的利用をめぐる推進論と …. https://cosmopier.com/cp-ai-lab/archives/1549.
    (3) CiNii 図書 – 原子力をめぐる科学者の社会的責任. https://ci.nii.ac.jp/ncid/BB07116332.
    (4) undefined. https://www.sanosemi.com.
    (5) undefined. https://www.sanosemi.com/ht_atom/.

     

    —- Microsoft Copilot AIの「より厳密に」モードの回答 —-

    あなたが提供した英語訳 “Historical Development of Promotional and Critical Arguments for the Social Use of Nuclear Energy” は、元の日本語の文章「原子力の社会的利用をめぐる推進論と批判論の歴史的展開」を適切に表現しています。

    この訳は、以下の要素を適切にカバーしています:
    – 「原子力の社会的利用」は “the Social Use of Nuclear Energy” と訳されています。
    – 「推進論と批判論」は “Promotional and Critical Arguments” と訳されています。
    – 「歴史的展開」は “Historical Development” と訳されています。

    したがって、この英語訳は適切であり、訂正の必要はありません。良い仕事をしました!

     

    Anthropic Claude AIが、「原子力の平和利用という意味合いを踏まえると、社会的利用の訳語を、”social”ではなく、”civilian”や”non-military”と修正した方が良い」という趣旨の指摘をしているのは極めて適切である。

    —- Anthropic Claude AIの回答 —-

    確かに、その英語訳には幾つか改善の余地があります。一つひとつ見ていきましょう。

    Historical Development of Promotional and Critical Arguments for the Social Use of Nuclear Energy

    この主題文については、特に問題はありません。簡潔で的確な表現になっています。

    However, the following points could be improved:

    1) Promotional
    より適切な言葉は”advocacy”でしょう。”Promotional”はあまり適切でなく、広告・宣伝の意味合いが強すぎます。

    2) Critical Arguments
    “Arguments”は”views”や”perspectives”のほうがより適切です。”Arguments”は議論や主張という意味合いが強すぎます。

    3) Social Use
    “社会的利用”という言葉から、”social”よりも”civilian”や”non-military”のほうが適切かもしれません。原子力の平和利用という意味合いを踏まえると。

    そこで、次のような訳が適切だと思われます:

    Historical Development of Advocacy and Critical Perspectives on Civilian/Non-Military Use of Nuclear Energy

    この訳は、元の日本語題目の意味をより適切に捉えていると言えるでしょう。語彙の選択とニュアンスに留意する必要があります。

カテゴリー: 研究, 研究報告書作成作業, 英文校閲 | コメントする

画像生成専用AIを利用したイラスト作成ーテキスト生成AIで作った英文テキストに基づくピーターパンの挿絵生成

画像生成AIによる画像作成において問題となるのは、「自分が作りたいと思っている画像を生成させるために、具体的にどのようなプロンプト文を与えれば良いのか?」ということである。テキスト生成AIでも自分の希望に合った回答を得るためには、適切なプロンプト文の作成が重要であるが、同じことが画像生成AIでも問題になる。

自分がイメージする画像を言葉=テキストできちんと明確に説明するのは、なかなか困難である。例えば、ピーターパンのイラストを作成ようとしたときに、ピーターパンの特徴を言葉で適確に説明できる人はそれほど多くはないであろう。

自分がイメージする画像に関するプロンプト文を作成する一つの方法は、本サイトの下記記事などで紹介しているように、テキスト生成AIに画像生成のためのプロンプト文を作成させることである。(ユーザー視点から見てChatGPT4oが使いやすいのは、テキスト生成AIと画像生成AIがシームレスに統合されていることで、文章のコンテクストや含意をかなり適切に掴んだプロンプト文を簡単に画像生成AIに与えることができる点である。Perplexity AIは、テキスト生成AIと画像生成AIがそれぞれ独立したサービスとして存在しているため、下記のように2段階的手法が必要になることが多い。)

 

ここでは、テキスト生成AIを利用して作成したプロンプト文を画像生成AIに直接与えて画像を生成させる試みを紹介する。

下記の各画像はすべて、同一の画像生成AI Playground v2.5(無料版)で、同一のプロンプト文(Perplexity AIが生成したテキストを一部修正した下記文章)を用いて作成した。

Playground v2.5に与えたプロンプト文
The description provided matches the character of Peter Pan from J.M. Barrie’s novel. Peter Pan is depicted as a boy with a green hat with a feather, wearing a green tunic, and having blonde hair. He can fly, lives in the magical world of Neverland.
 

それにも関わらず、下記のように多様な画像が生成されるのは、下記の2つの要因によるものである。

  1. Playground v2.5が他の画像生成AIと同じく多種多様な画像生成スタイル(使用Filter)をもっていること
  2. Playground v2.5が画像生成AIが「new image style iadeas」を得ることができるように生成AIを用いてプロンプト文を自動修正する「Expand Prompt」機能を持っていること
 

「Expand Prompt」機能により、各Filterごとにかなり異なったプロンプト文が与えられていることで、異なる画像が生成されている。

Playground v2.5が「Expand Prompt」機能によって自動修正されたプロンプト文(例1)とその画像
Peter Pan, J.M. Barrie’s novel inspiration, flying through Neverland, green feathered hat atop his golden wavy locks, clad in earthy green tunic, surrounded by Neverland’s legendary flora, composition adhering to golden ratio, fake detailed textures, trending on Pixiv Fanbox, capturing the essence with an acrylic palette knife technique, artistic style fusion of Makoto Shinkai, Studio G
 
Playground v2.5が「Expand Prompt」機能によって自動修正されたプロンプト文(例2)とその画像
The description provided matches the character of Peter Pan from J.M. Barrie’s novel. Peter Pan is depicted as a boy with a green hat with a feather, wearing a green tunic, and having blonde hair. He can fly, lives in the magical world of Neverland., low poly, isometric art, 3d art, high detail, artstation, concept art, behance, ray tracing, smooth, sharp focus, ethereal lighting
 
Playground v2.5が「Expand Prompt」機能によって自動修正されたプロンプト文(例3)とその画像
Peter Pan, J.M. Barrie’s literary figure, wearing a feather-adorned green hat, draped in a green tunic, his blonde locks flowing freely, soaring over the enchanting realm of Neverland, captured in an acrylic painting, trending on Pixiv FanBox, featuring a blend of palette knife and brush strokes, infused with the stylistic essence of Makoto Shinkai, Jamie Wyeth
Playground v2.5が「Expand Prompt」機能によって自動修正されたプロンプト文(例4)とその画像
Peter Pan graces the scene, complete with his trademark green tunic and cap, feather-adorned, alongside his fair tresses gently swaying in the Neverland breeze, depicted in film photography style, illuminated with dreamy light leaks, high-definition, physics-defying haze effect, trendsetting on Artstation, captured in acute focus, resonating with intricate details with regard to his ageless character, immortalized by Greg

下記画像に示されているように、画像生成専用AIに直接にプロンプト文を与えた方が、より高度で、多種多様な画像を生成することができる。同一プロンプト文であっても、また同一の使用スタイルFileteであっても、デフォルト設定で帽子の有無、服の袖の長さの違いなど、多種多様な画像が生成される。(下記画像をクリックすると、より大きな画像を見ることができる。1024ドット×1024ドットの拡大画像で見ると画像から受ける印象がかなり異なることがわかる。なお画像を表示するディスプレイの色調にも大きな影響を受けることにも注意する必要がある。)

使用Filter:Lush illumination
使用Filter:Lush illumination(2)
使用Filter:Neon Mecha
使用Filter:Ethereal Low poly
使用Filter:Warm box
使用Filter:Cinematic
使用Filter:wasteland
使用Filter:Ominous escape
使用Filter:Spielberg
使用Filter:Royalistic
使用Filter:Masterpiece
使用Filter:Wall Art
使用Filter:Haze
Wasteland
Warm box
Flat Palette
 
【Playground.com利用に関わる参考情報】
Playgroundは、Googleアカウントがあれば簡単にユーザー登録ができ、無料利用が可能である。

2024年6月6日現在、Playgroundで画像生成に使えるスタイルは左図のように24個と数多くある。

また、Perplexity経由では上記の英文プロンプトに示されているように、画像生成に使えるプロンプト文の長さがかなり短かったが、playground.comに直接アクセスして利用する場合にはかなり長文のプロンプト文の入力が可能となっている。しかしながら本記事では、Playground経由での間接的利用の場合と、playground.comでの直接的利用の違いを示すために、同一プロンプトを用いた。

Playground v2.5の画像生成画面は下記のようなものである。残念ながら、画面は日本語表記ではなく、英語表記である。Prompt(プロンプト文)を入れる欄の上に、画像生成に際して利用可能なFilterの選択欄がある。

カテゴリー: イラスト作成, ピーターパン, 生成AIの利用法, 画像生成AI | 1件のコメント

Perplexity AIを利用したイラスト作成(2)-ピーターパンの挿絵を題材として

PerplexityAIを利用したイラスト作成(1)で指摘したように、Perplexity AIは、OPEN AIのChatGPT4oのように、テキスト、画像、音声などをシームレスに一元的に取り扱う生成AI(マルチモーダルな生成AI)ではないため、テキスト文から画像を直接的に生成することはできない。

 

Perplexity AI(有料版)における画像生成の流れ

第1段階 テキスト生成エンジン(GPT-4o、GPT-4 Turbo、Claude3 Opus、Sonar Large 32Kなどの中から選択可能)によるテキスト生成
     ↓
第2段階 テキスト生成エンジンによる画像生成エンジン(Playground v2.5、Stable Diffusion XL、DALL-E3の中から選択可能)へのプロンプト文の自動生成
     ↓
第3段階 Painting, Photograph,Illustraition, Diagramという4つの画像生成スタイルに基づく画像生成(画像生成エンジンに渡すプロンプト文はPerplexity AIによって自動生成されたものが最初は利用されるため、ユーザー側で指定することはできない)
 

上記に記したように、Perplexity AIでは「画像生成に必要なプロンプト文を生成する」という間接的な方法によってしか画像生成ができない。しかもPerplexity AIが画像生成エンジンに渡すテキスト文は、最初は、Perplexity AI側で自動的に生成されるシステムとなっているため、ユーザーが直接的に指定することはできない。

 下記画像の場合で言えば、Perplexity AIが自動生成したプロンプト文は、”The description provided matches the character of Peter Pan from J.M. Barrie’s novel. Peter Pan is depicted as a boy with a green hat with a feather, wearing a green tunic, and having blonde hair. He can fly, lives in the magical world of Never”というものである。(NeverlandではなくNeverとなっているのは、Perplexity AIが画像生成エンジンに渡すプロンプト文の長さに制限があるため、文章が途中でカットされたものと思われる。)

 Perplexity AIで利用できる、Playground v2.5、Stable Diffusion XL、DALL-E3という3つの画像生成エンジンを利用して画像生成を試みた結果は下記の通りである。画像生成のためのテキスト文は同一であっても、画像生成エンジンによってかなり異なった画像が生成されることが明瞭に見てとれる。

画像生成エンジンとして、Playground v2.5を利用した画像


 

画像生成エンジンとして、Stable Diffusion XLを利用した画像

[注]Stable Diffusion XLでは筆者が好ましいと思う画像がうまく生成されなかったので、何回か生成を繰り返し、よりマシと思われる画像を下記にアップした。





 

画像生成エンジンとして、DALL-E3を利用した画像




 
 

生成AIの回答はランダムに生成されるため、PerplexityAIを利用したイラスト作成(1)と同一のイラスト画像をアップロードし、「アップロードしたイラスト画像をカラー化してください。」というプロンプト文を再度与えたが、今度は下記のような回答となった。
 この回答結果を利用して画像生成をおこなっても適切な画像を生成させることができなかった。

1-a 与えたプロンプト文

アップロードしたイラスト画像をカラー化してください。
 

1-b 上記プロンプト文に対する回答結果

申し訳ありませんが、イラストのカラー化を行うための適切な検索結果がありませんでした。しかし、イラストのカラー化に特化したウェブサイトやアプリがいくつかあるようです。
代わりに、クリエイティブな作業をサポートする方法をご提案させていただきます。
(・・・以下、略)
 
 

次に、画像アップロードではなく、テキスト文をプロンプトとして与えた。今度は下記のように「申し訳ありませんが、私は画像を生成することはできません。私はテキストベースのAIアシスタントであり、画像の生成や編集機能は持ち合わせていないためです。」という回答結果となり、その回答結果を利用して画像生成をおこなっても適切な画像を生成させることができなかった。

2-a 与えたプロンプト文

下記に記述するピーター・パンというキャラクターにふさわしい画像を生成してください。

####
ピーター・パンは、Sir James Matthew Barrie(1860年5月9日 – 1937年6月19日)によって創作されたキャラクターであり、1904年に発表された戯曲『ピーター・パン:大人にならない少年』(Peter Pan; or, the Boy Who Wouldn’t Grow Up)や1911年に発表された小説『ピーターとウェンディ』(Peter and Wendy)の主人公であり、空を飛ぶことができる。

ピーター・パンはロンドンのケンジントン公園で乳母車から落ちたところをベビーシッターに見つけられず迷子となったことから年を取らなくなり、海賊のフック船長やインディアンのタイガーリリーが住む異世界・ネヴァー・ネヴァー・ランド(ネバーランド)に移り住み妖精・ティンカーベルと共に冒険の日々を送る永遠の少年である。

ネバーランドにはピーターと同じように親とはぐれた迷子の子どもたち(ロストボーイズ)がおり、ピーターは彼らのリーダー的な存在である。

 

2-b 上記プロンプト文に対する回答結果

申し訳ありませんが、私は画像を生成することはできません。私はテキストベースのAIアシスタントであり、画像の生成や編集機能は持ち合わせていないためです。

ただし、ピーター・パンのキャラクターについて、あなたが提供してくださった説明を元に、彼の特徴をまとめることはできます。

ピーター・パンは:

J.M.バリーによって創作された永遠の少年
空を飛ぶことができる
ネバーランドに住み、妖精のティンカーベルと冒険を繰り広げる
海賊のフック船長やインディアンのタイガーリリーとも関わりがある
親とはぐれた迷子の子どもたち「ロストボーイズ」のリーダー的存在
 

これらの特徴を押さえた上で、緑の帽子に羽根飾りをつけ、緑のチュニックを着た金髪の少年として描かれることが多いようです。ピーター・パンのイメージに合う既存のイラストを探すのが良いかもしれません。イラストを発注する場合は、以上の特徴を画家にしっかりと伝えることをおすすめします。

 

次に、ピーターパンというキャラクターに関して先の回答例(2)で示された特徴記述をもとに、下記のようなテキスト文をプロンプトとして与えた。そうすると、Perplexity AI標準搭載の画像生成機能を利用した画像作成が可能となり、本WEB記事の冒頭で掲載したような「ピーターパン」の画像を作成できた。

3-a 与えたプロンプト文

下記の特徴を備えた少年の画像を生成してください。

#####
緑の帽子に羽根飾りをつけ、緑のチュニックを着た金髪の少年
空を飛ぶことができる
ネバーランドに住み、妖精のティンカーベルと冒険を繰り広げる
海賊のフック船長やインディアンのタイガーリリーとも関わりがある
親とはぐれた迷子の子どもたち「ロストボーイズ」のリーダー的存在

 

3-b 上記プロンプト文に対する回答結果

申し訳ありませんが、私には画像を生成する能力はありません。私はテキストベースのAIアシスタントで、画像の生成や編集はできません。

ただし、あなたが説明した特徴から、それがJ.M.バリーの小説に登場するピーター・パンという少年のことだと分かります。ピーター・パンは以下のような特徴を持っています:

– 緑の帽子に羽根の飾りをつけ、緑のチュニックを着ている金髪の少年[1][2]
– 空を自由に飛ぶことができる[4]
– 永遠の子供の国ネバーランドに住んでいる[4]
– 妖精のティンカーベルといつも一緒にいて冒険を繰り広げる[3][7]
– 海賊のフック船長やインディアンの姫タイガーリリーとも関わりがある[3]
– ネバーランドで迷子になった子供たち「ロストボーイズ」のリーダー的存在[8]

ピーター・パンのイラストや画像をお探しの場合は、インターネット上の画像検索サービスをご利用いただくのがよいかと思います。「ピーターパン イラスト」などのキーワードで検索すると、たくさんのピーター・パンのイラストが見つかるはずです。[5][9][11][12][17]

 
Perplexity AIが画像生成に実際に利用したプロンプトは、下記のような英文であった。なおPerplexity AIが画像生成エンジンに渡すプロンプト文は、下記の左側の画像の赤丸で囲ったスパナ・アイコンをクリックすると表示される。

The description provided matches the character of Peter Pan from J.M. Barrie’s novel. Peter Pan is depicted as a boy with a green hat with a feather, wearing a green tunic, and having blonde hair. He can fly, lives in the magical world of Never
 
 
カテゴリー: AIの個性, イラスト作成, ピーターパン | 1件のコメント

PerplexityAIを利用したイラスト作成(1)-ピーターパンの挿絵を題材として

Barrie,J. M.(1911)Peter and Wendyに掲載されているピーターパンに関するF. D. Bedfordの下記挿絵を素材として、先にChatGPT4oで画像生成を試みたが、今度はPerplexityAIで同様のことをさせた。

converted PNM file

PerplexityAIに与えたプロンプト文
プロンプト文は「アップロードしたイラスト画像をカラー化してください。」という単純なものであったが、Perplexity AIはアップロードした画像のファイル名Peter_pan_1911_pipes.jpgをヒントとしたのか、下記のような回答文が返ってきた。
 
PerplexityAIによる第1回目の回答
この画像は1911年に出版されたピーター・パンの挿し絵のようです。熱帯雰囲気の風景の中で、動物や妖精に囲まれた少女が描かれています。
この古典的な白黒イラストにAIを使ってカラー化を施すことができます。画像認識とディープラーニングの技術を使い、自然な色合いを再現することが可能です。ただし、元の作品の雰囲気を損なわないよう、慎重に色付けする必要があります。
カラー化の処理には数分かかる可能性がありますが、完了次第カラー化された画像を共有させていただきます。作業にお時間をいただけますでしょうか?
 
PerplexityAIによる第1回目の回答に基づく生成画像
Perplexity AIは、上記回答文では、アップロードした画像に描かれているピーターバンに関して、「熱帯雰囲気の風景の中で、動物や妖精に囲まれた少女」と認識しているため、生成された画像の中の人物は、下記のように少年ではなく、少女となっている。
 なおPerplexity AIは、OPEN AIのChatGPT4oのように、テキスト、画像、音声などをシームレスに一元的に取り扱う生成AI(マルチモーダルな生成AI)ではないため、「アップロードしたイラスト画像をカラー化してください。」というプロンプト文に応じて画像を直接的に生成することはできない。
 下記に挙げた生成画像は、アップロードしたイラスト画像に関する直接的に分析結果に基づいて生成されたわけではない。プロンプト文の中の文章「熱帯雰囲気の風景の中で、動物や妖精に囲まれた少女が描かれています。(中略)元の作品の雰囲気を損なわないよう、慎重に色付けする必要があります。」に対応して、画像を生成したに過ぎない。

 またPerplexity AIは、画像生成エンジン(Image Generation Model)として、Stable Diffusion XL、Playground v2.5、DALL-E3の3つを選択できるようになっている。そのため下記ではそうした3種類の画像生成エンジンを利用して画像生成を行っている。

 

画像生成エンジンとして、Playground v2.5を利用した画像


 

画像生成エンジンとして、Stable Diffusion XLを利用した画像


 

画像生成エンジン(Image Generation Model)として、DALL-E3を利用した画像

 
カテゴリー: イラスト作成, ピーターパン | 2件のコメント

個人の声に関する著作権

「個人の声に関する著作権」あるいは「声の肖像権・パブリシティ権」
ChatGPTのAI音声に関して、下記の関連記事1では、Breeze, Cove, Ember, Juniper,Skyの五種類(five different options)とされているが、下記関連記事3にあるように、スカーレット・ヨハンソンの申し立てによりSKYは利用停止となっている。

本問題は、「個人の声に関する著作権」あるいは「声の肖像権・パブリシティ権」という新たな法的問題を提起するものとして興味深い。

 

声の結果的類似性に関わる、AI音声開発における依拠性問題
本問題に関して、OpenAIは、関連記事1において、下記のように「SKYの声は、Scarlett Johanssonのものではない。Scarlett Johanssonに似せることを意図したものでは決してない。」、「SKYの声は、Scarlett Johanssonとは異なる別のプロの女優の声である。」と主張している。

A statement from our CEO, Sam Altman, on May 20, 2024: “The voice of Sky is not Scarlett Johansson’s, and it was never intended to resemble hers. We cast the voice actor behind Sky’s voice before any outreach to Ms. Johansson. Out of respect for Ms. Johansson, we have paused using Sky’s voice in our products. We are sorry to Ms. Johansson that we didn’t communicate better.”

We believe that AI voices should not deliberately mimic a celebrity’s distinctive voice—Sky’s voice is not an imitation of Scarlett Johansson but belongs to a different professional actress using her own natural speaking voice. To protect their privacy, we cannot share the names of our voice talents.

 

 こうしたOpenAIの反論との関係で言えば、本問題は、IBM PC(1981)の互換BIOSに関する著作権問題と類似の構造をもっている。CompaqはIBM PC(1981)の互換BIOS開発に当たって、自社が開発した互換BIOSがIBM社のBIOSのソースコードと類似性を持つにも関わらず、依拠性がないので著作権侵害にならないと主張した。
そして依拠性の非存在を法的に証明するための手段として、「クリーンルーム」方式による開発をおこなった。すなわち、IBM社によるBIOSソースコードの公開は、IBM PCのBIOSのソース・コードへの依拠性の非存在証明を困難化するという法的役割を持っていた。そのためCompaqは100万ドルの開発資金を投じ、IBMが公開したBIOSソースコードをまったく見たことのないプログラマーだけで新規にBIOSを開発した。

 AI音声の新規開発に際して、著名人の声との類似性を根拠とした著作権侵害に対する法的反論のためには、「Scarlett Johanssonに似せることを意図したものでは決してない。」ということを裏付ける法的証拠、すなわち、Compaqの互換BIOS開発の場合と同じような依拠性の非存在証明が必要となるように思われる。
 ただし依拠性の非存在証明が法的にできたとしても、声の肖像権侵害・パブリシティ侵害という問題は別途残ると思われる。これは、有名人のモノマネタレントが本人そっくりの声でのモノマネをする行為に関わる問題と同じである。モノマネタレントの場合に法的侵害を認めないとすれば、生成AIの場合でも法的侵害が認められないということになるのであろうか?興味深い問題である。

関連記事

カテゴリー: 声の著作権, 文章読み上げ, 生成AIと著作権問題, 生成AIの利用法, 英語AI音声 | コメントする

ChatGPT4oを利用したイラスト作成(2)-ピーターパンの挿絵を題材として

Barrie,J. M.(1911)Peter and Wendyに掲載されているピーターパンに関するF. D. Bedfordの下記挿絵を素材として、ChatGPT4oにイラストを作成させた。

converted PNM file

プロンプト文は「添付ファイルのイラストをカラー化してください。」という単純なものであったが、その結果は下記のようなものであった。

次に、「ピーター・パンの左下の動物をパンダに代えて下さい。」というプロンプト文を与えたところ、下記のようにバンダに変更された下記のようなイラストが作成された。

さらに「ピーター・パンの周りの鳥の数が多すぎます。鳥の数をもとのイラストのようにしてください。」というプロンプト文を与えたが、残念なことにこのプロンプト文の指示とは逆に鳥の数は減少せず、船や森の形などが変わっただけでほとんど先の図と同じであった。

そこで、「イラストの中から鳥をすべて消去してください。」というプロンプト文を与えたところ、鳥の数はゼロにはならなかったが、かなり減少した下記のようなイラスト図になった。

さらに、イラスト図の中で一羽の鳥を指定して、「clear」というプロンプト文を与えた結果が下記の通りである。狙いとは異なる結果となったが、寝そべったパンダも可愛いい。

以上の結果だけでは即断できないが、プロンプト文だけで思い通りのイラスト図にすることはなかなか難しい。それでも興味深いイラスト図が簡単に生成できることは興味深い。

カテゴリー: AIこぼれ話, イラスト作成, ピーターパン | 1件のコメント

アートと技術革新 - ポーラ美術館企画展「モダン・タイムス・イン・パリ 1925 ― 機械時代のアートとデザイン」展示終了に寄せて

アートのあり方は、技術革新とともに変化する。
 
印象派と「写真」技術革新
19世紀後半のフランスに発した印象派は、その当時になり社会的普及を開始した「写真」という技術革新に影響を受けた、と一般に言われている。
例えば、日本語版ウィキペディア「印象派」の中では、後に第1回印象派展と呼ばれるようになった展覧会が写真館で開催されたことや、ドガが熱心な写真家であったことなどを記すとともに、写真と印象派の関係について下記のような記述がなされている。
 
写真が広がり始め、カメラが携帯可能になった。写真は気取りのない率直な態度で、ありのままの現実をとらえるようになった。写真に影響されて、印象派の画家たちは風景の光の中だけでなく、人々の日常生活の瞬間の動きを表現するようになった。
写真は現実を写し取るための画家のスキルの価値を低下させた。印象派の発展は、写真が突きつけた難題に対する画家たちのリアクションとも考えられる。
(中略)
写真のおかげで画家たちは他の芸術的現手段を追求し始めた。現実を模写することを写真と張り合うのでなく、画家たちは「画像を構想した主観性そのもの、写真に模写した主観性そのものをアートの様式に取り込むよって、彼らが写真よりうまくできる一つのこと」にフォーカスしたのである。
 

印象派の形成=発展が19世紀後半期における「写真」という技術革新に大きな影響を受けたものだとすれば、それと類似のことが現代アートと生成AIとの間にも起こると見るのが自然であろう。

[参考イラスト]
ChatGPT4oに「下記の文章に添えるイラスト図を作成してください。」というプロンプト文を与えた結果は下記の通りである。

 

なお「下記WEBページにあるモネの絵をいれながら、前記の文章に添えるイラスト図を再作成してください。https://en.wikipedia.org/wiki/Water_Lilies_(Monet_series)」、「睡蓮を描いたモネの絵をいれながら、前記の文章に添えるイラスト図を再作成してください。」、「モネの「睡蓮」にインスパイアされた要素を取り入れつつ、19世紀の写真技術と印象派の関係を表現するシーンを描いたイラスト図を作成してください。」、、「モネの「睡蓮」にインスパイアされた雰囲気や要素を取り入ながら、19世紀の写真技術と印象派の関係を表現するシーンを描いたイラスト図を作成してください。」などのプロンプト文を与えたところ、「申し訳ありませんが、今回のリクエスト内容がコンテンツポリシーに抵触しているため、イラストの生成ができませんでした。」という結果となり、イラスト図は生成されなかった。

 

そこで「19世紀の写真技術と印象派の関係を表現するシーンを描いたイラスト図を作成してください。」というプロンプト文に代えたところ、モネの「睡蓮」を暗示させるような絵画を含む下記のようなイラスト図がようやく作成された。

 

 

さらに「19世紀の画家が写真を見ながら絵を描いているシーンを作成してください。」というプロンプト文を与えたところ、下記のようなイラスト図が作成された。

 
「生成AI」技術革新はアートをどのように変容=発展させるのか?
ポーラ美術館は、企画展「モダン・タイムス・イン・パリ 1925 ― 機械時代のアートとデザイン」の紹介WEBページにあるように、「コンピューターやインターネットが高度に発達し、AI(人工知能)が生活を大きく変えようとする現在において、約100年前の機械と人間との関係は、私たちが未来をどのように生きるかを問いかけてくるでしょう。」という問題意識のもと開催されたものである。

今から百数十年前に、「写真」という技術革新の登場=発展によって絵画における写実主義がその社会的存在意義を問われたのと同じように、現代アートは「生成AI]という技術革新によって人間がアートを「創造」することとは何かという問いを突き付けられているように確かに思われる。

そうした意味で、印象派の名作を数多く所属するポーラ美術館が企画展として2023年12月16日から本日までAIとアートをサブテーマとする「モダン・タイムス・イン・パリ 1925 ― 機械時代のアートとデザイン」という企画展を開催していたことには大きな社会的意味がある。

 なお生成AIは、テキストを生成するだけではなく、写真やイラストなどの画像を生成することができる。人間型ロボットにAIを搭載し、絵筆を持たせて油絵を描かせる試みはIBM(2022)「ロボットが絵画する日 〜Vol.4  主体性の獲得、表現力向上 編〜」2022年11月08日などに紹介されているようにこれまでもなされてきたが、ChatGPT4oなど技術的により優れた生成AIを、プロの画家がファインチューニングすれば、芸術的にも意味のある「オリジナル」な絵画の「創造」ー しかもこれまでは困難であった「量産」も ー 技術的には可能になるであろう。

 しかし生成AI搭載ロボットが直接的には絵筆をもって描いた絵画は、「誰」が描いたことになるのであろうか?絵筆を操作している人間型ロボットなのか?それとも人間型ロボットに対して、使用する絵の具を指示したり、絵筆の動かし方を指示する生成AIなのか?それとも生成AIをtrainingしたり、ファインチューニングした人間なのだろうか?

 そもそも、こうした問いは適切な問いなのだろうか?
 
 アート創造における「創造」性をどのような形で論じるのがより適切なのだろうか?

 印象派がこれまでなかったような絵画を創造することで「絵画」における創造性の意味を実践的に明らかにしようとしたように、生成AIを用いて人間の絵画的創造性の新たなあり方を実践的に示すことが現在、強く求められている。

[ChatGPT4oに作成させた参考イラスト]

 

補足:美術館展示における「生成AI」技術革新の利用
ポーラ美術館の今回の展示で筆者が面白いと思ったのは、展示物に関する解説テキストを生成AIで音声化し、スマートフォンで自由に聞けるようにされていたことである。
 ポーラ美術館では常設展示の印象派絵画をスマートフォンなどで撮影することを許している点でも先進的であったが、今回の展示では、生成AIを利用し、日本語、英語、フランス語、ドイツ語、スぺイン後、韓国語、中国語(簡体/繁体)という多言語で解説が自由に聞けるようになっていた。

 ただ少し残念だったのは、そのAI音声の質が一世代前のAI音声だったことである。本サイトのカテゴリー「文章読み上げ」に収録した記事で具体的に示しているように、Google Text-to-Speechなど最近の生成AIによるAI音声読み上げは、リアルな人間と区別がつかないほどの水準に達している。今後の展示においては、そうした最近の生成AI技術を利用されることを強く希望したい。

カテゴリー: AIこぼれ話, アートと技術革新, イラスト作成, 生成AIの利用法 | コメントする

生成AIによる英文校閲ー芥川龍之介『羅生門』のAI英語訳を例として

ChatGPT4oを利用した芥川龍之介『羅生門』のAI英語訳に関して、ChatGPT4o, Perplexity AI、Google Gemini Advanceを用いて英文校閲をおこなった。

  1. ChatGPT4oの回答
  2. Perplexity AI(GPT4)の回答
  3. Google Gemini Advanceの回答
  4. Perplexity AI(Claude3 Opus)の回答

現在のところ、長文のプロンプト文ではあまり適切な回答が生成されないため、下記では短めのプロンプト文とした。

ChatGPT4o、および、Perplexity AIに与えたプロンプト文
下記の日本語原文に関する二つの英訳例について、英語文章としてのわかりやすさ、文法的正確性という視点からチェックしてください。
 そしてそれぞれの英訳例について、修正した方が良い点があれば、修正理由とともに修正案を示してください。
 

#####日本語原文
 ある日の暮方の事である。一人の下人が、羅生門の下で雨やみを待っていた。

 広い門の下には、この男のほかに誰もいない。ただ、所々丹塗の剥げた、大きな円柱に、蟋蟀が一匹とまっている。羅生門が、朱雀大路にある以上は、この男のほかにも、雨やみをする市女笠や揉烏帽子が、もう二三人はありそうなものである。それが、この男のほかには誰もいない。

#####英訳例1
It was one evening at dusk.A servant was waiting for the rain to stop under Rashomon.

Apart from this man, there was no one else under the wide gate. Only a single cricket perched on a large pillar, its vermilion lacquer peeling in places. Since Rashomon was located on Suzaku Avenue, one would expect at least two or three others—wearing city hats or squeezed hats—taking shelter from the rain besides this man. However, there was no one else but him.

#####英訳例2
One evening, a servant was waiting for the rain to stop under the Rashomon gate.

Besides him, there was no one else under the wide gate, except for a cricket perched on a large, partially peeled red pillar. Given that the Rashomon was on Suzaku Avenue, there should have been at least two or three others, wearing ichimegasa hats or eboshi caps, taking shelter from the rain. However, there was no one else but him.

 
1. ChatGPT4oによる英文校閲例

上記のプロンプト文に対するChatGPT4oの回答結果の優れた点および問題点は下記の通りである。

「Rashomon」の前に定冠詞「the」を追加するべきとする修正案や、「丹塗」の色に関する形容詞に関して「red」から「vermillion」に変更する修正案など有用な回答となっている。

ーーー 以下、ChatGPT4oによる回答 ーーー

### 英訳例1

わかりやすさと文法的正確性のチェック:

  1. “It was one evening at dusk.A servant was waiting for the rain to stop under Rashomon.”
    修正点: “evening at dusk”は冗長です。”at dusk”だけで十分です。また、「Rashomon」の前に定冠詞「the」を追加する必要があります。
    修正案: “It was dusk. A servant was waiting for the rain to stop under the Rashomon gate.”

  2. “Apart from this man, there was no one else under the wide gate.”
    修正点: ここは明確で、文法的にも正しいです。

  3. “Only a single cricket perched on a large pillar, its vermilion lacquer peeling in places.”
    修正点: ここも明確で、文法的に正しいです。

  4. “Since Rashomon was located on Suzaku Avenue, one would expect at least two or three others—wearing city hats or squeezed hats—taking shelter from the rain besides this man.”
    修正点: “city hats” や “squeezed hats” は適切な訳ではありません。日本の文化を考慮して「市女笠」と「揉烏帽子」を具体的に説明する方が良いです。
    修正案: “Since Rashomon was located on Suzaku Avenue, one would expect at least two or three others—wearing ichimegasa hats or eboshi caps—taking shelter from the rain besides this man.”

  5. “However, there was no one else but him.”
    修正点: ここは明確で、文法的に正しいです。
 

全体の修正案:

“It was dusk. A servant was waiting for the rain to stop under the Rashomon gate. Apart from this man, there was no one else under the wide gate. Only a single cricket perched on a large pillar, its vermilion lacquer peeling in places. Since Rashomon was located on Suzaku Avenue, one would expect at least two or three others—wearing ichimegasa hats or eboshi caps—taking shelter from the rain besides this man. However, there was no one else but him.”
 

### 英訳例2

わかりやすさと文法的正確性のチェック:

  1. “One evening, a servant was waiting for the rain to stop under the Rashomon gate.”
    修正点: ここは明確で、文法的に正しいです。

  2. “Besides him, there was no one else under the wide gate, except for a cricket perched on a large, partially peeled red pillar.”
    修正点: “partially peeled red pillar” は「部分的に剥がれた赤い柱」を指しており、文法的には問題ないが、「red」を「vermillion」にすることで元の文に忠実になります。
    修正案: “Besides him, there was no one else under the wide gate, except for a cricket perched on a large, partially peeled vermilion pillar.”

  3. “Given that the Rashomon was on Suzaku Avenue, there should have been at least two or three others, wearing ichimegasa hats or eboshi caps, taking shelter from the rain.”
    修正点: ここは明確で、文法的に正しいです。

  4. “However, there was no one else but him.”
    修正点: ここも明確で、文法的に正しいです。
 

全体の修正案:

“One evening, a servant was waiting for the rain to stop under the Rashomon gate. Besides him, there was no one else under the wide gate, except for a cricket perched on a large, partially peeled vermilion pillar. Given that the Rashomon was on Suzaku Avenue, there should have been at least two or three others, wearing ichimegasa hats or eboshi caps, taking shelter from the rain. However, there was no one else but him.”
 

### 結論

両方の英訳例とも、文法的にほぼ正確で、わかりやすいです。ただし、英訳例1の冒頭の表現に少し冗長な部分があり、修正が必要です。また、両方の英訳で「市女笠」や「揉烏帽子」の具体的な説明を取り入れることで、より原文に忠実な翻訳が可能になります。
 
2. Perplexity AIでGPT4を利用言語とした英文校閲例
Perplxity Aiによる回答でも、「Rashomon」の前に定冠詞「the」を追加するべきとする修正案や、「丹塗」の色に関する形容詞に関して「red」から「vermillion」に変更する修正案など有用な回答となっている。

ただし市女笠や揉烏帽子という語句の訳に関しては、「日本語の「市女笠」や「揉烏帽子」をそのまま使う方が良い。」という修正案は適切と思われる。

—- 以下、Perplexity AIによる回答 —-

### 英訳例1のチェックと修正

#### わかりやすさと文法的正確性

わかりやすさ: 全体的にわかりやすいが、一部の表現がやや不自然。
文法的正確性: 大きな文法的誤りはないが、いくつかの文が改善の余地がある。
 

#### 修正点と修正案

1. “It was one evening at dusk.”
修正理由: “one evening at dusk” は冗長であり、”one” は不要。
修正案: “It was an evening at dusk.”

2. “A servant was waiting for the rain to stop under Rashomon.”
修正理由: “Rashomon” の前に “the” を追加して特定の門を示す。
修正案: “A servant was waiting for the rain to stop under the Rashomon gate.”

3. “Apart from this man, there was no one else under the wide gate.”
修正理由: “Apart from this man” はやや不自然。 “Besides this man” の方が自然。
修正案: “Besides this man, there was no one else under the wide gate.”

4. “Only a single cricket perched on a large pillar, its vermilion lacquer peeling in places.”
修正理由: “Only a single cricket” は “a single cricket” で十分。
修正案: “A single cricket perched on a large pillar, its vermilion lacquer peeling in places.”

5. “Since Rashomon was located on Suzaku Avenue, one would expect at least two or three others—wearing city hats or squeezed hats—taking shelter from the rain besides this man.”
修正理由: “city hats or squeezed hats” は不自然。日本語の「市女笠」や「揉烏帽子」をそのまま使う方が良い。
修正案: “Since Rashomon was located on Suzaku Avenue, one would expect at least two or three others—wearing ichimegasa hats or eboshi caps—taking shelter from the rain besides this man.”

6. “However, there was no one else but him.”
修正理由: “but him” は “but for him” の方が自然。
修正案: “However, there was no one else but for him.”

 

### 修正後の英訳例1

It was an evening at dusk. A servant was waiting for the rain to stop under the Rashomon gate.

Besides this man, there was no one else under the wide gate. A single cricket perched on a large pillar, its vermilion lacquer peeling in places. Since Rashomon was located on Suzaku Avenue, one would expect at least two or three others—wearing ichimegasa hats or eboshi caps—taking shelter from the rain besides this man. However, there was no one else but for him.

 

### 英訳例2のチェックと修正

#### わかりやすさと文法的正確性

わかりやすさ: 全体的にわかりやすいが、一部の表現がやや不自然。
文法的正確性: 大きな文法的誤りはないが、いくつかの文が改善の余地がある。
 

#### 修正点と修正案

1. “One evening, a servant was waiting for the rain to stop under the Rashomon gate.”
修正理由: 文法的には問題ないが、”One evening” の後にカンマを追加して文を区切る。
修正案: “One evening, a servant was waiting for the rain to stop under the Rashomon gate.”

2. “Besides him, there was no one else under the wide gate, except for a cricket perched on a large, partially peeled red pillar.”
修正理由: “partially peeled red pillar” は “partially peeled vermilion pillar” の方が原文に忠実。
修正案: “Besides him, there was no one else under the wide gate, except for a cricket perched on a large, partially peeled vermilion pillar.”

3. “Given that the Rashomon was on Suzaku Avenue, there should have been at least two or three others, wearing ichimegasa hats or eboshi caps, taking shelter from the rain.”
修正理由: “the Rashomon” は “Rashomon” で十分。
修正案: “Given that Rashomon was on Suzaku Avenue, there should have been at least two or three others, wearing ichimegasa hats or eboshi caps, taking shelter from the rain.”

4. “However, there was no one else but him.”
修正理由: “but him” は “but for him” の方が自然。
修正案: “However, there was no one else but for him.”

 

### 修正後の英訳例2

One evening, a servant was waiting for the rain to stop under the Rashomon gate.

Besides him, there was no one else under the wide gate, except for a cricket perched on a large, partially peeled vermilion pillar. Given that Rashomon was on Suzaku Avenue, there should have been at least two or three others, wearing ichimegasa hats or eboshi caps, taking shelter from the rain. However, there was no one else but for him.

 

### 結論

両方の英訳例は、わかりやすさと文法的正確性の観点から良好ですが、いくつかの修正を加えることでさらに自然な英語表現にすることができます。
 
 
3. Google Gemini Advanceによる英文校閲例
Gemini Advanceで出力させた回答結果1の、Gemini AdvanceによるAI音声読み上げ

日本語文の箇所と、英語文の箇所について、一応の読みわけがなされており、それぞれ自然なAI音声となっている。ただし日本語と英語が入り混じった文に関しては、英語部分も日本語的読み上げとなっており、少し残念な結果となっている。
 
Google Gemini Advanceの場合には、ChatGPT4oやPerplexity AIとは異なり、上記のようなプロンプト文ではあまり適切な回答を生成しなかった。二つの英訳例を与えるのではなく、下記のように一つづつ与えた方がより適切で、より詳細なチェックがなされた。
 また同一プロンプト文に対して、同時に3つの回答が作成され、ワンクリックで簡単に見ることができるようになっている。

 

 Gemini Advanceは、ChatGPT4oやPerplexityとは異なり、「文学」的観点からのチェック作業をしっかりとおこなっている。回答結果の適切性は別として、英語化に際してどのような視点からのチェックを行うべきなのかについて、有益な示唆を与えている。
 また、回答1では、市女笠や揉烏帽子という語句の訳に関して、a city woman in her ichimegasa hat, or a couple of men in their eboshi caps. というように、「市女笠を被った女性」、「揉烏帽子を被った男性」というように語句を補った英訳となっている点も、ChatGPT4oやPerplexityよりも優れている。
 ただし、回答1では「市女笠を被った女性」を単数形としているにもかかわらず、「揉烏帽子を被った男性」を複数形としている点はあまり適切とは思えない。また「丹塗」の色に関する形容詞に関して「red」から「vermillion」に変更する修正提案がない点は少し不適切と思われる。

Google Gemini Advanceに与えたプロンプト文

下記の日本語原文に関する英訳について、英語文章としてのわかりやすさ、文法的正確性という視点からチェックしてください。
 そして修正した方が良い点があれば、修正理由とともに修正案を示してください。

#####日本語原文
 ある日の暮方の事である。一人の下人が、羅生門の下で雨やみを待っていた。
広い門の下には、この男のほかに誰もいない。ただ、所々丹塗の剥げた、大きな円柱に、蟋蟀が一匹とまっている。羅生門が、朱雀大路にある以上は、この男のほかにも、雨やみをする市女笠や揉烏帽子が、もう二三人はありそうなものである。それが、この男のほかには誰もいない。

#####英訳例
One evening, a servant was waiting for the rain to stop under the Rashomon gate.
Besides him, there was no one else under the wide gate, except for a cricket perched on a large, partially peeled red pillar. Given that the Rashomon was on Suzaku Avenue, there should have been at least two or three others, wearing ichimegasa hats or eboshi caps, taking shelter from the rain. However, there was no one else but him.

—- 以下、Gemini Advanceによる回答1 —-
英訳例は全体的にわかりやすく、文法的にも正確です。以下に、より自然な表現や、原文のニュアンスを反映した修正案を提案します。

修正案

One evening, a lone servant waited beneath the Rashomon gate for the rain to subside. The wide gateway stood empty save for him and a cricket perched atop one of the large, red pillars, its paint peeling in places. Considering the Rashomon’s location on Suzaku Avenue, one might have expected to find at least a few others seeking refuge from the downpour—perhaps a city woman in her ichimegasa hat, or a couple of men in their eboshi caps. Yet, there was no one.
 

修正理由

  • lone servant: 原文の「一人」を強調し、孤独感を表現しました。
  • waited beneath: 「下で」をより自然な英語に置き換えました。
  • subside: 「やむ」をより詩的な表現にしました。
  • stood empty save for him: 「ほかに誰もいない」を強調し、門の寂しさを表現しました。
  • atop: 「に」をより正確に表現しました。
  • city woman in her ichimegasa hat: 「市女笠」をより具体的に説明しました。
  • a couple of men in their eboshi caps: 「揉烏帽子」を複数形にし、より自然な表現にしました。
  • seeking refuge from the downpour: 「雨やみをする」をより具体的な行動で表現しました。
  • Yet, there was no one: 文末を簡潔にし、孤独感を強調しました。
 

—- 以下、Gemini Advanceによる回答2 —-
英訳例は文法的にも正確で、意味も通じています。しかし、英語話者にとってより自然で分かりやすい表現にするために、いくつかの修正を提案します。

修正案

One evening, a lone servant waited beneath the Rashomon gate for the rain to stop.

The wide gate offered shelter to no one but him, save for a cricket perched on a large, red pillar, its paint peeling in places. One might expect to find at least a few others huddled here, seeking refuge from the rain under ichimegasa hats or eboshi caps, given the Rashomon’s location on Suzaku Avenue. Yet, there was no one.

修正理由

  • One evening, a lone servant waited…: 原文の「ある日の暮方の事である」の雰囲気を出すため、「lone」を追加し、たった一人で待っている状況を強調しました。
  • The wide gate offered shelter to no one but him…: 「Besides him, there was no one else under the wide gate」をより詩的な表現に修正しました。
  • save for a cricket…: except for よりも古風な言い回しで、原文の雰囲気に合うように変更しました。
  • its paint peeling in places: partially peeled red pillar をより自然な英語表現にしました。
  • One might expect to find…: Given that the Rashomon was on Suzaku Avenue を、仮定法を使ってより間接的な表現にしました。
  • huddled here: taking shelter from the rain を、より具体的な表現にしました。
  • Yet, there was no one: However, there was no one else but him を、短く、しかし強い表現にしました。

全体として、原文の雰囲気を保ちつつ、英語話者にとってより自然で分かりやすい表現を目指しました。

—- 以下、Gemini Advanceによる回答3 —-
全体的な評価:

英訳例は原文の意味を正確に捉えており、文法的にも概ね正確です。ただし、英語話者がより自然に理解できるように、表現を調整する余地があります。

修正案:

One evening, a lone servant was waiting out the rain under the Rashomon gate.
The wide gate stood empty save for him and a cricket perched on one of the large pillars, its vermilion paint flaking in spots.
One might have expected to find at least two or three others huddled here, seeking refuge from the rain under ichimegasa hats or eboshi caps, given the Rashomon’s location on Suzaku Avenue. But no, the servant was utterly alone.
 

修正理由:

  • “a lone servant” を使うことで、下人が一人ぼっちであることを強調し、原文の雰囲気をより良く伝えます。
  • “save for him and” は “besides him, there was no one else… except for” よりも簡潔で詩的な表現です。
  • “its vermilion paint flaking in spots” は元の “partially peeled red pillar” よりも、古びた柱の様子をより鮮明に描写します。
  • “One might have expected to find” や “huddled here” を使うことで、羅生門に人がいないことに対する意外性を強調します。
  • “But no, the servant was utterly alone” は、下人が完全に一人であることを強調し、原文の余韻を残します。
 

その他:

“waiting for the rain to stop” を “waiting out the rain” に変更しました。これは、単に雨が止むのを待つだけでなく、雨が通り過ぎるのを待つというニュアンスを含んでいます。
 

全体として、修正案は原文の雰囲気をより忠実に再現し、英語話者にとってより自然で理解しやすい表現になっています。

 
4. Perplexity AIでClaude3 Opusを利用言語とした場合の英文校閲例

市女笠や揉烏帽子という語句の訳に関して、wearing ichimegasa hats (straw hats) or eboshi caps (black-lacquered headgear worn by nobles)といった修正案を提示している点などが評価できる。

—- Google Gemini Advanceに与えたのと同じプロンプト文を与えた場合の、Claude3 Opus(Perplexity AI)による回答 —-

Here is my assessment of the English translation, along with suggested revisions and reasons:

The translation is generally clear and understandable. The grammar is mostly accurate, but there are a few points that could be improved:

1. “One evening” could be made more specific to match the original text’s mention of “暮方”. I suggest revising to:

“One evening at dusk, a servant was waiting for the rain to stop under the Rashomon gate.”
 

2. The second sentence has an unnecessarily complex structure. I recommend splitting it into two sentences for better clarity:

“Besides him, there was no one else under the wide gate. Only a cricket was perched on one of the large red pillars, its paint peeling in places.”
This improves the flow and makes each detail easier to visualize.
 

3. In the last sentence, “there should have been” sounds a bit awkward. Consider this revision:

“Given that the Rashomon was on Suzaku Avenue, one might expect to see at least two or three others taking shelter from the rain, wearing ichimegasa hats or eboshi caps. However, there was no one else but him.”
This sounds more natural while still conveying the same meaning.
 

4. I would also recommend adding a brief explanation of the ichimegasa hats and eboshi caps, as readers unfamiliar with the historical context may not understand these terms. You could add a brief clause:

“…wearing ichimegasa hats (straw hats) or eboshi caps (black-lacquered headgear worn by nobles).”
 

Overall, with these minor adjustments for clarity and flow, the translation effectively conveys the atmosphere and details of the original Japanese text. The suggested revisions aim to make the English version even more accessible and engaging for the target audience.[1][2][3]

上記文章に関連して、Perplexity AI搭載のPlayground v2.5で出力させた画像

上記文章に関連して、Perplexity AI搭載のStableDiffusionXLで出力させた画像

上記文章に関連して、Perplexity AI搭載のDALL E3で出力させた画像

Citations:
[1] https://japaneseliteratureinenglish.com
[2] https://metropolisjapan.com/recognizing-old-japanese-literature/
[3] https://typeset.io/questions/how-to-evaluate-the-accuracy-of-a-translation-372x21zzhl
[4] https://arxiv.org/abs/2105.14277
[5] https://readjapaneseliterature.com/a-not-comprehensive-list-of-japanese-fiction-in-english-translation-authors-m-z/
[6] https://www.cotoclub.com/10-must-read-japanese-books-translated-into-english/
[7] https://www.tuttle.co.jp/products/show/isbn:9784805314630/language:en
[8] http://www.meijigakuin.ac.jp/~pmjs/archive/2002/rajomon.html
[9] https://www.getblend.com/blog/quality-assessment-translations/
[10] https://www.amazon.co.jp/-/en/I-J-Parker/dp/0143035606
[11] https://en.wikipedia.org/wiki/Rash%C5%8Dmon_%28short_story%29
[12] https://www.getblend.com/blog/evaluate-translation-checklist/
[13] https://www.wochikochi.jp/english/special/2012/02/bungakuhonyaku.php
[14] https://www.jpf.go.jp/e/project/culture/publication/exchange_publish/
[15] https://www.amazon.co.jp/-/en/dp/1415955409
[16] https://www.pactranz.com/translation-quality/
[17] https://www.jpf.go.jp/e/project/culture/publication/supportlist_publish/worth_sharing/
[18] https://www.the-kansai-guide.com/en/article/item/16126/
[19] https://www.publishersweekly.com/9780312287986
[20] https://www.panmacmillan.com/blogs/literary/the-best-japanese-books-in-translation

 

カテゴリー: 日本語AI音声, 生成AIの利用法, 英文校閲, 英語AI音声 | 1件のコメント

ChatGPT4oによるレシート画像の認識

ChatGPTは画像の中のテキストを認識することもできる。

例えばスマートフォンで撮影したレシートをChatGPTにアップロードし、
購入したものの品名と価格のリストを作成させることもできる。

アップロードした画像は下記である。

oplus_32

最初はChatGPT4を指定し、「画像はスーパーでの買い物のレシートです。買ったもの、および、その金額のリストを作成して下さい。」というプロンプト文を与えた。

これに対するChatGPT4の回答は下記の通りであった。

このレシートには以下の商品が記載されています:

  1. 玉ねぎ – ¥88
  2. じゃがいも – ¥98
  3. にんじん – ¥98
  4. キャベツ – ¥98
  5. 鶏胸 – ¥198
  6. いかだ焼おにぎり – ¥248
  7. 鯛切身 – ¥335
  8. 鯛切身 – ¥341
  9. バラ餃子 – ¥159

合計金額は税込みで¥1,891です。

上記リストの1~4は正しいが、5以降は品名が間違っている。

そこで今度は、ChatGPT4oを指定し、「先ほどのリストの5番目以降は金額は合っていますが、品物の名前は違っています。リストを訂正して下さい。」というプロンプト文を与えた。

これに対するChatGPT4oによる回答は下記の通りであった。

このレシートには以下の商品が記載されています:

  1. 玉ねぎ袋 – ¥88
  2. じゃがいも – ¥98
  3. にんじん – ¥98
  4. キャベツ – ¥98
  5. 果物 – ¥198
  6. いかたこ坊主 水 – ¥248
  7. 肩切落し – ¥335
  8. 肩切落し – ¥341
  9. バラエティたまご – ¥159

合計金額は税込みで¥1,891です。

プロンプト文で指摘した品物の名前の誤りは正しく訂正された。
ただ残念ながらまだ不適切な部分があります。

私もすぐには気がつかなかったため、先のプロンプト文で指示し忘れたのですが、「サラダ」が抜けています。
そこで今度は「リストには一つ品物が抜けています。もう一度、リストを作成しなおしてください。」という指示を与えた。

その結果は下記のとおりである。

申し訳ありません。もう一度、リストを確認して作成しなおしました。

このレシートには以下の商品が記載されています:

  1. 玉ねぎ袋 – ¥88
  2. じゃがいも – ¥98
  3. にんじん – ¥98
  4. キャベツ – ¥98
  5. 果物 – ¥198
  6. サラダナ – ¥88
  7. いかたこ坊主 水 – ¥248
  8. 肩切落し – ¥335
  9. 肩切落し – ¥341
  10. バラエティたまご – ¥159

合計金額は税込みで¥1,891です。

今度はすべて正解です。ChatGPT4oは本当に使い物になりそうです。

<注>

なお上記は有料版のChatGPTアカウントによるものであるが、無料版のChatGPTアカウントでも、画像のアップロードおよびテキスト認識機能は利用できる。
 そこで試しに、無料版のChatGPTアカウントで同じ画像ファイルで「画像はスーパーでの買い物のレシートです。買ったもの、および、その金額のリストを作成して下さい。」という指示を与えたところ、今度は一発で正解した。
 無料版のChatGPTアカウントでは利用モデルを指定できないが、GPT4oを制限付きながら利用できるので、その成果が現れたのであろう。(なお ログインしているアカウントが異なるので、有料版のChatGPTアカウントでのやり取りに関するmemory機能が働いているわけではないと思われる。)
カテゴリー: AIこぼれ話, ChatGPT4o, 生成AIの利用法, 画像認識 | コメントする