ChatGPT のようにテキストを学習しことばを入出力する生成 AI はほとんど既存の言語をそのまままなぶ. しかし,画像生成 AI は画像を断片的なことばとともに学習するので,擬似的な言語 (英語) を学習する. したがって,プロンプトの文法は英語ではなくてその疑似的な言語である.
ChatGPT のようなテキストを入出力する生成 AI には,文法的にただしい文章を入力する必要がある. 断片的なことばでもこたえてくれるし,意図どおりに解釈されることもあるが,すくなくとも「わかるように」プロンプトを書く必要がある. 造語をあたえても拒否されるだけだ.
これに対して,画像生成 AI はプロンプトが文法的にただしい必要はない. 基本的には単語をならべてやればよい. また,造語をいれても反応する.
しかし,単語をならべる順序によって,こたえが変わってくることはある. 通常はその差はあまりおおきくないが,やはりそこに文法のようなものはある. それは英語の文法とはちがう. 画像生成 AI は英語にちかい擬似的な言語をうけとるといってよいだろう.
キーワード: